Génération d'échantillons d'entraînement géoréférencés
Extraction spectrale | Échantillonnage stratifié | Validation croisée
Cet algorithme génère un jeu de données d'entraînement pour les modèles de machine learning en croisant les parcelles agricoles de référence avec les images satellites multi-spectrales. Il extrait automatiquement les valeurs spectrales et applique un échantillonnage stratifié pour garantir la qualité des données d'entraînement.
Extraction des valeurs de pixels pour toutes les bandes disponibles
Répartition des échantillons entre training et test par parcelle
Échantillonnage systématique avec grille de 10m dans chaque parcelle
Détection et gestion automatique des valeurs manquantes
Couche vectorielle contenant les zones d'entraînement annotées
Géométrie : Polygones
Formats : Shapefile, GeoPackage, GeoJSON
Obligation : Attribut de classification requis
Nom de l'attribut contenant les types de cultures
Type : Texte
Encodage : UTF-8 recommandé
Exemples : "culture", "type_culture", "label"
Raster pour l'extraction des valeurs spectrales
Format : GeoTIFF, IMG, ou autre format supporté par QGIS
Bandes : Doit contenir les bandes utilisées pour l'entraînement
Important : Même SCR que les parcelles
Pourcentage des parcelles à utiliser pour l'entraînement
Plage : 10-90%
Défaut : 70%
Le reste est utilisé pour la validation
Points géoréférencés avec attributs spectraux
Format : Shapefile ou GeoPackage
Attributs :
Vérification de la compatibilité spatiale entre parcelles et image
Génération de points selon une grille régulière de 10m dans chaque parcelle
Extraction des valeurs de toutes les bandes pour chaque point
Répartition aléatoire des parcelles entre ensemble d'entraînement et de test
Export des échantillons au format vectoriel
Privilégier des parcelles d'au moins 0.5 hectare pour un échantillonnage représentatif
Viser un nombre similaire d'échantillons pour chaque classe de culture
Vérifier la précision des étiquettes avant l'extraction
Visualiser les échantillons générés pour détecter d'éventuels problèmes
Symptôme : Échantillons placés dans de mauvaises zones
Solution : Vérifier que parcelles et image ont le même SCR
Problème : Trop peu d'échantillons pour certaines cultures
Solution : Collecter plus de parcelles ou ajuster le ratio train/test
Cause : Pixels hors image ou sans données
Solution : Vérifier l'emprise de l'image par rapport aux parcelles