11.4. Classificação Não Supervisionada
A classificação não supervisionada é uma técnica que agrupa dados semelhantes em clusters ou categorias, sem a utilização de rótulos ou conhecimento prévio das classes a serem identificadas. Esta abordagem é bastante utilizada para descobrir padrões, tendências e relacionamentos entre dados. Diferentemente da classificação supervisionada, a classificação não supervisionada não possui uma etapa de treinamento baseada em conjuntos de dados rotulados ou amostras. A classificação não supervisionada é baseada em métodos de clustering ou de agrupamento.
Métodos de agrupamento e diferentes medidas de similaridade entre séries temporais de imagens são abordados na Seção Agrupamento de Séries Temporais de Imagens de Satélites. A Seção Descoberta de Padrões em Séries Temporais de Imagens apresenta uma metodologia não supervisionada, baseado nos métodos de agrupamento Self-Organizing Map (SOM) e o Hierarchical Clustering Algorithm (HCA), para detecção de padrões em séries temporais de imagens em um estudo de caso usando glebas do Sicor.
Para mapear uso e cobertura da terra baseado em classificação não supervisionada de séries temporais de imagens de satélites, Silva et al. [194] propôs uma metodologia usando SOM e HCA, mostrada na Figura 11.14. A metodologia proposta foi aplicada em uma área de estudo no estado do Mato Grosso apresentada na Figura 11.15 e os resultados da classificação não supervisionada é mostrado na Figura 11.16, com 4 e 12 grupos ou clusters.
Figura 11.14 - Metodologia para mapear uso e cobertura da terra baseado em classificação não supervisionada de séries temporais de imagens de satélites usando SOM e HCA. Fonte: [194].
Figura 11.15 - Área de estudo no estado de Mato Grosso onde a metodologia para classificação não supervisionada foi aplicada. A imagem do lado direito é do satélite Sentinel-2 e sensor MSI, com 10 metros de resolução espacial, e com composição colorida (Swir16, Nir, and Blue). Fonte: [194].
A metodologia foi aplicada em todas as séries temporais de imagens, extraídas dos cubos Sentinel-2 (10 metros de resolução espacial e composição temporal de 16 dias), de todos os pixels dentro da área de estudo (1954 × 2188 pixels). Foi utilizado o índice NDVI e o período agrícola de 29/08/2019 a 12/08/2020, correspondente ao período do TerraClass Cerrado 2020.
Essas séries foram agrupadas pelo método SOM, usando uma grade de 12 x 12 neurônios (144 neurônios). Após o agrupamento no SOM, os vetores de peso dos neurônios do mapa de saída foram agrupados usando o método HCA, com 4 e 12 grupos ou clusters finais (average linkage). O resultado da classificação não supervisionada é mostrado na Figura 11.16, com 4 e 12 grupos ou clusters. Além dos dois resultados, com 4 e 12 clusters, a Figura 11.16 apresenta o mapa de uso e cobertura da terra dessa área de estudo do TerraClass Cerrado 2020 para referência.
Para o resultado de 4 clusters, o mapa de saída do SOM, os vetores de peso de seus neurônios e a cor da classe associada a cada neurônio são mostrados na Figura 11.17 e o dendrogram gerado pelo método HCA para as 4 classes é mostrado na Figura 11.18. A Figura 11.19 ilustra os padrões das séries temporais NDVI associados a cada um dos 4 cluster.
Figura 11.16 - Resultado da classificação com 4 e 12 grupos ou clusters. Fonte: [194]
Figura 11.17 - Mapa de saída do SOM com uma grade de 12 x 12 neurônios e seus vetores de peso, pintados com a cor da classe ou cluster associado a cada neurônio. Fonte: [194]
Figura 11.18 - Dendrogram gerado pelo método HCA. Fonte: [194]
Figura 11.19 - Padrões das séries temporais NDVI associados a cada um dos 4 cluster.. Fonte: [194]