Stimatore lineare¶
Il modulo esegue la stima di parametri utilizzando uno stimatore lineare. Gli input allo stimatore sono un file vettoriale contente una colonna con l’indicazione del target da stimare (es: volume) in formato numerico, e (opzionale) l’indicazione delle variabili (attributi del vettore) da usare nella stima (es: percentili LIDAR, altezza LIDAR media, dimensione della chioma, ecc.). L’utente potrà anche inserire un vettoriale da usare nella fase di validazione o per mappare un’area più ampia (es. vettoriale di una griglia).
Esempio: stima diametro singoli alberi Lo shapefile di input (“Dati di input vettoriale”) avrà per esempio una tabella degli attributidi questo tipo:
![]()
Nel caso della stima del diametro di un albero useremo come target la colonna “DBH_cm” e come variabili per esempio l’altezza dell’albero (colonna “Height_m”) e l’area della chioma (colonna “Area”). Le due varaibili andranno selezionate dal menu’ “Colonne delle feature da utilizzare”.
Input¶
Dati di input vettoriale di training: file vettoriale contente le aree di training e l’indicazione del parametro da stimare. Si consiglia di avere un numero adeguato di aree di training, che rappresenti adeguatamente la variabilità dell’attributo da stimare.
Seleziona la colonna con indicazione del parametro da stimare: selezionare tra le colonne del file vettoriale quella che indica il target da stimare.
Vettoriale di mappatura: file vettoriale contente le aree per effettuare la mappatura dell’attributo stimato. Input opzionale.
Parametri¶
Effettuare la cross-validation: se scelto viene effettuata la cross validation. La cross-validation consiste nel dividere i campioni di training (le aree contenute nel vettoriale di training) in un numero N di fold definiti dall’utente (parametro “fold della cross-vaidation”) e di creare un modello usando N-1 fold e di validarlo sul fold rimanete. Questa operazione è ripetuta N volte.
Inserire il numero di fold della cross-validation: inserire il numero di fold della cross-validation. Questo numero deve essere scelto in base al numero di campioni di training disponibili e deve essere maggiore o uguale a 2. Non può essere un valore superiore al numero di campioni. Si consiglia di non usare un valore superiore a 10.
Selezionare la trasformazione: scegliere la trasformazione da applicare alla colonna target. La trasformazione può aiutare ad ottenere un modello lineare nel caso la distribuzione dei dati non lo sia.
Selezione variabili:
- no: nessuna selezione delle variabili. Vengono usate tutte le varaibili contenute nel vettoriale di training.
- manuale: le variabili vengono selezionate manualmente.
- file: le variabili sono scelte in base al file di output del modulo “Selezione variabili per la stima”.
Colonne delle feature da utilizzare (opzionale): selezionare le varaibili da utilizzare. Se non si seleziona nulla vengono usate tutte le variabili. Attivo solo se la selezione varaibili manuale è selezionata.
File di selezione (opzionale): inserire il file ottenuto in output dal modulo “Selezione variabili per la stima”. Attivato solo se l’opzione “file” viene scelta nel menu “selezione variabili”.
Vettoriale di validazione (opzionale): file vettoriale contenente le aree di validazione o di mappatura. I nomi delle colonne del vettoriale devono essere le stesse delle varaibili utilizzate nella creazione del modello.
Seleziona la colonna per la validazione (opzionale): selezionare tra le colonne del file vettoriale quella che indica il target. Se si effettua la mappatura non ve scelto nulla.
Indice di accuratezza per la selezione del modello (opzionale):
- MSE: Mean Square Error.
- R2: R2.
Creare output: se scelto viene creato l’output, ovvero un vettoriale uguale a quello di validazione/mappatura con un campo aggiuntivo col parametro stimato. Se non viene dato nessun input alla voce Vettoriale di validazione l’output verrà creato partendo dal vettoriale di training.
Output¶
Risultato: inserire il percorso e il nome del file di output. Oltre allo shape file lo strumento crea, nella stessa directory, un file TXT dei coefficienti e dell’intercetta del modello lineare usato per la stima, e due file CSV relativi ai risultati del calcolo dell’accuratezza per il set di validazione e della cross validation.
Colonna per i valori della stima: nome della colonna dove verranno salvati i valori stimati. Al nome indicato viene aggiunta in fondo una L per indicare che la stima è stata effettuata mediante stimatore lineare.