ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “Estimação populacional na Espanha com base em imagens de satélite”
Alunos: Bernardo Braga Martins e Miguel do Nascimento Faria Conforto
Orientadora: Maria Luíza Guerra de Toledo (ENCE/IBGE)
Coorientador: Ian Monteiro Nunes (DPE/IBGE)
Data: 28 de novembro de 2024 – Quinta-feira
Horário: 15h00m
Local: Rua André Cavalcanti, 106, sala 306 (auditório) – ENCE
Resumo: Este trabalho investiga a aplicação de técnicas de Machine Learning baseada em árvores de decisão para a estimação populacional na Espanha a partir de imagens satelitais e dados georreferenciados. O problema foi dividido entre estimação por classes de população e estimação pontual. Utilizando imagens do satélite Sentinel-2, a análise considerou as bandas espectrais R, G, B, NIR, SWIR, e a luz noturna VIIRS, além de dados complementares, como Uso da Terra (LU), Zonas Climáticas Locais (LCZ) e informações do OpenStreetMap (OSM). Para reduzir a dimensionalidade dos dados, foi aplicada a Análise de Componentes Principais (PCA), sintetizando informações em combinações lineares que explicam até 99% da variância total. A avaliação dos modelos observou as métricas de Acurácia, Precisão, Revocação, F1-Score e R² ajustado, para o problema de classificação, e medidas de erro como erro quadrático médio (MSE), raiz do erro quadrático médio (RMSE) e Erro Absoluto Médio (MAE), para o problema regressão. Os resultados demonstraram que modelos baseados exclusivamente em variáveis satelitais, como a luz noturna VIIRS e o SWIR, apresentaram melhor desempenho do que aqueles que incluíram dados exógenos, cuja adição muitas vezes prejudicou a precisão devido à inconsistência e natureza não oficial desses dados. Modelos baseados em PCA também mostraram resultados promissores, mas ainda inferiores às abordagens que usaram apenas variáveis satelitais, sendo o XGBoost o modelo com melhores resultados para estimação populacional pontual. O trabalho ressalta a importância de variáveis geoespaciais de alta resolução para a modelagem populacional e identifica o aprendizado de máquina, especialmente com ferramentas de deep learning, como um campo promissor para aprimoramento futuro. Os desafios da subestimação de populações elevadas foram destacados como áreas para avanços metodológicos e aplicações futuras.
Palavras-chave: Machine Learning, Satélite, Estimação Populacional.
Banca examinadora:
Maria Luíza Guerra de Toledo (ENCE/IBGE) – Orientadora
Ian Monteiro Nunes (DPE/IBGE) – Coorientador
César Augusto Marques da Silva (ENCE/IBGE)
Gustavo da Silva Ferreira (ENCE/IBGE)
Coordenação de Graduação
Renata Pacheco Nogueira Duarte