Clasificación Semi-Automática de Cobertura del Suelo con Sentinel-2

Resumen del Caso de Estudio

Industria: Agricultura y Ganadería Ubicación: Provincia de San Luis, Argentina

Métricas de Impacto:

+12.700 hectáreas clasificadas en 10 clases de cobertura del suelo en menos de una semana
75% de reducción de tiempo en comparación con el mapeo manual (estimado de 4+ semanas reducido a < 1 semana)
10 clases de cobertura discriminadas exitosamente usando imágenes satelitales de resolución media
Flujo de trabajo repetible y adaptable a otros campos y evaluaciones futuras

Descripción General

Un gran campo ganadero en San Luis, Argentina — de más de 12.700 hectáreas — necesitaba un mapa integral de cobertura del suelo para evaluar su potencial de reconversión agrícola. Dada la vasta extensión del campo y la gran cantidad de clases de ambiente visualmente similares, el mapeo manual era virtualmente impracticable. Se diseñó y ejecutó un enfoque de clasificación semi-automática utilizando imágenes Sentinel-2 y aprendizaje automático no supervisado para obtener resultados precisos y espacialmente explícitos.

El Desafío

El campo presentaba un mosaico complejo de pastizales naturales, montes, médanos y pasturas — 10 clases ambientales distintas en total — muchas de las cuales compartían firmas espectrales similares. Los desafíos principales fueron:

Escala: Más de 12.700 hectáreas hacían inviable la delimitación manual en un plazo razonable.
Similitud entre clases: Varias categorías de pastizal y monte (ej., monte muy abierto vs. abierto, pastizal arenoso vs. semi-arenoso) eran extremadamente difíciles de separar visualmente, incluso con imágenes satelitales.
Falta de imágenes de alta resolución: No se contaba con imágenes de alta resolución disponibles para la zona al momento del análisis, descartando una clasificación supervisada directa con muestras de entrenamiento de alta granularidad.
Resultados críticos para la toma de decisiones: Los resultados de la clasificación informarían directamente las decisiones de planificación de uso del suelo — la precisión no era negociable.

Enfoque Técnico

Stack Tecnológico

Componente	Tecnología
Teledetección	Sentinel-2 MSI (resolución 10–20 m)
Procesamiento	Google Earth Engine (GEE)
Clasificación	WEKA (clustering no supervisado vía GEE)
Índices Espectrales	NDVI, GNDVI, MNDWI, EVI, GCI, BSI
Post-procesamiento	QGIS
Formatos de Salida	GeoPackage (GPKG), Excel, mapas PDF

Índices Espectrales Utilizados

Cada índice fue seleccionado para maximizar la discriminación entre las 10 clases objetivo:

Índice	Nombre Completo	Propósito
NDVI	Índice de Vegetación de Diferencia Normalizada	Vigor y densidad general de la vegetación
GNDVI	NDVI Verde	Sensibilidad a la concentración de clorofila
EVI	Índice de Vegetación Mejorado	Mejor respuesta en áreas de alta biomasa
GCI	Índice de Clorofila Verde	Estimación del contenido de clorofila foliar
MNDWI	Índice de Agua de Diferencia Normalizada Modificado	Discriminación de suelo desnudo y humedad
BSI	Índice de Suelo Desnudo	Detección de suelo expuesto y arena (médanos, áreas degradadas)

Metodología de Clasificación

La decisión metodológica clave fue utilizar un enfoque semi-supervisado — clustering no supervisado seguido de fusión de clases guiada por expertos — en lugar de una clasificación completamente supervisada. Esto estuvo motivado por dos factores: la ausencia de imágenes de referencia de alta resolución, y la gran cantidad de clases espectralmente similares que habrían requerido un volumen impracticable de muestras de verdad de campo.

flowchart TD
    Start([🛰️ Inicio]) --> FieldVisit[🗺️ Visita de Campo e Identificación de Clases]
    FieldVisit --> ImageSelect[📥 Selección de Imagen Sentinel-2]
    ImageSelect --> Indices[⚙️ Cálculo de Índices Espectrales]
    Indices --> Cluster[📊 Clasificación No Supervisada - WEKA]
    Cluster --> Evaluate{¿Concordancia Visual?}
    Evaluate -->|No| Adjust[🔄 Ajustar Número de Clusters]
    Adjust --> Cluster
    Evaluate -->|Sí| Merge[🎯 Fusionar Clusters en Clases Finales]
    Merge --> Export[💾 Exportar a GeoPackage]
    Export --> PostProc[🗺️ Post-procesamiento en QGIS]
    PostProc --> Deliver([📤 Entregables Finales])

    classDef startEnd fill:#E7F5C5,stroke:#B5C0C0,stroke-width:2px,color:#3A4040
    classDef process fill:#DDEAF6,stroke:#B5C0C0,stroke-width:2px,color:#3A4040
    classDef decision fill:#EED5CF,stroke:#B5C0C0,stroke-width:2px,color:#3A4040
    classDef adjust fill:#EED5CF,stroke:#B5C0C0,stroke-width:2px,color:#3A4040

    class Start,Deliver startEnd
    class FieldVisit,ImageSelect,Indices,Cluster,Merge,Export,PostProc process
    class Evaluate decision
    class Adjust adjust

El proceso iterativo comenzó con aproximadamente 25 clusters y fue refinado progresivamente — reduciendo y fusionando clases — hasta que la salida mostró una fuerte concordancia visual tanto con las imágenes satelitales como con las observaciones de campo recolectadas durante la visita al sitio.

Aspectos Destacados de la Implementación

Refinamiento Iterativo de Clusters

La clasificación no supervisada no fue una operación de un solo paso. Se requirieron múltiples iteraciones, ajustando el número de clusters iniciales para encontrar el balance óptimo entre sobre-segmentación (demasiadas clases sin significado) y sub-segmentación (perder distinciones importantes). El proceso siguió esta lógica:

Alto número inicial de clusters (~25): Sobre-segmentación deliberada para capturar diferencias espectrales sutiles.
Comparación visual: Cada iteración se comparó contra el compuesto Sentinel-2 y las notas de campo.
Fusión progresiva: Los clusters que correspondían a la misma clase real fueron fusionados, informados por el conocimiento de campo.
Salida final: 10 clases ambientales claramente definidas con fuerte coherencia espacial.

Estrategia de Apilamiento Multi-Índice

En lugar de clasificar solo con bandas espectrales crudas, la entrada de clasificación fue un stack multi-índice combinando seis índices espectrales. Este enfoque mejoró significativamente la separabilidad entre clases — particularmente para el desafiante gradiente pastizal-monte — al aprovechar la sensibilidad de cada índice a diferentes propiedades biofísicas (estructura de la vegetación, contenido de clorofila, exposición del suelo y humedad).

Clases de Cobertura y Superficies Finales

Clase	Superficie (ha)
Pastizal Natural Arenoso	2.642
Pastizal Natural Semi-Arenoso	2.016
Pastizal Natural de Mayor Calidad	1.771
Pastizal Natural de Menor Calidad	1.607
Médano con Cobertura Vegetal	1.605
Monte Muy Abierto	896
Monte Abierto	796
Pastura	716
Monte Denso	487
Médano Activo	220
Total	12.756

Mapa de Clasificación

El mapa de clasificación final y el compuesto Sentinel-2 utilizado como referencia se incluyen como figuras en este caso de estudio. El mapa codificado por colores muestra la distribución espacial de las 10 clases en todo el campo, con estadísticas de superficie por clase.

Resultados finales de la clasificación no supervisada — codificación de clases de cobertura.

Resultados e Impacto

12.756 hectáreas completamente clasificadas en 10 clases de cobertura del suelo con alta precisión espacial.
75% de reducción de tiempo: Una tarea estimada en más de 4 semanas de trabajo manual fue completada en menos de 1 semana — y con una consistencia superior en todo el campo.
10 clases espectralmente similares discriminadas exitosamente usando solo datos Sentinel-2 de resolución media (10–20 m), sin requerir imágenes comerciales de alta resolución.
Entregables accionables: Archivos GeoPackage para integración GIS, planillas Excel con estadísticas de superficie por clase, y mapas PDF listos para uso en campo y reuniones de gestión.
Metodología repetible: El flujo de trabajo es completamente reproducible y puede adaptarse a otros campos, otros períodos temporales, o convertirse en un pipeline automatizado en Python para monitoreo sistemático.

Mis Contribuciones

Este fue un proyecto individual, de punta a punta. Mis contribuciones específicas incluyeron:

Reconocimiento de campo: Realicé personalmente la visita al campo para identificar, caracterizar y geolocalizar las 10 clases de cobertura.
Diseño metodológico: Diseñé el enfoque de clasificación semi-supervisada desde cero — eligiendo clustering no supervisado sobre clasificación supervisada debido a la falta de imágenes de alta resolución, y definiendo la estrategia de refinamiento iterativo.
Selección de índices espectrales: Seleccioné y calculé los 6 índices espectrales (NDVI, GNDVI, EVI, GCI, MNDWI, BSI) para maximizar la separabilidad de clases según las condiciones ambientales específicas del sitio.
Clasificación e iteración: Ejecuté el pipeline completo de clasificación en Google Earth Engine, iterando desde ~25 clusters iniciales hasta las 10 clases finales a través de múltiples rondas de validación visual y fusión.
Post-procesamiento y cartografía: Realicé todo el post-procesamiento en QGIS, incluyendo etiquetado de clases, cálculo de superficies y producción de los mapas y entregables finales.
Entrega: Produje y entregué el set completo de productos — GeoPackage, Excel y mapas PDF.

Lecciones Aprendidas

Reflexión Metodológica

Cuando no se dispone de imágenes de alta resolución, un enfoque semi-supervisado — clustering no supervisado seguido de fusión guiada por expertos — puede superar a una clasificación supervisada mal acotada. El habilitador clave es un fuerte conocimiento de campo: sin la visita al terreno, el paso de fusión habría sido pura especulación.

El apilamiento multi-índice es esencial para la discriminación de clases complejas. Depender solo de bandas crudas no habría separado los subtipos de pastizal y monte a la resolución de Sentinel-2.
El refinamiento iterativo supera a la clasificación de un solo intento. Comenzar con más clusters de los necesarios y fusionar hacia abajo es una estrategia más segura que intentar acertar el número exacto de clases en el primer intento.
Si repitiera este proyecto hoy, exploraría Earth Embeddings (representaciones de características derivadas de modelos fundacionales) para generar las clases de clasificación — logrando potencialmente una separabilidad aún mejor sin ingeniería manual de índices.
El flujo de trabajo es un fuerte candidato para automatización en Python, haciéndolo repetible en múltiples campos y períodos temporales para monitoreo sistemático del uso del suelo.

¡Tomemos un café virtual juntos!

¿Necesitás mapear y clasificar cobertura del suelo en grandes extensiones usando imágenes satelitales? Reservá una sesión gratuita de 30 minutos para conversar sobre tus desafíos y explorar cómo podemos trabajar juntos.

Reservar una llamada gratuita