ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “MÉTODO DE OTIMIZAÇÃO APLICADO AO PROBLEMA DE AGRUPAMENTO BASEADO EM DENSIDADE E GRADE”
Aluno: Pedro Henrique Sodré Puntel
Orientador: José André de Moura Brito (ENCE/IBGE)
Coorientador: Flávio Marcelo Tavares Montenegro (ENCE/IBGE)
Data: 28 de julho de 2022 – Quinta-feira
Horário: 18h00m
Local: Rua André Cavalcanti, 106, sala 204 – ENCE
Resumo da Monografia: A análise de agrupamentos (AAG) é uma técnica de análise multivariada que agrega um conjunto de algoritmos que têm, por objetivo, segmentar bases de dados em grupos homogêneos, levando-se em consideração, basicamente, suas características (atributos), uma métrica e uma função objetivo (JOHNSON; WICHERN, 2007). Tais algoritmos são utilizados para contornar a complexidade intrínseca aos problemas de agrupamento, onde, em geral, a obtenção do ótimo global - melhor solução à luz da função objetivo, via aplicação de métodos exatos ou de uma enumeração exaustiva é algo impraticável. Adicionalmente, face às inúmeras aplicações da AAG e à complexidade de resolução das mesmas, diversos algoritmos têm sido propostos na literatura; capazes de produzir agrupamentos de boa qualidade, não necessariamente ótimos, em um tempo computacional factível. Dentre estes, destacam-se os algoritmos baseados em densidade e em grade, pois além de não requererem uma especificação prévia do número de grupos, são robustos à presença de outliers e permitem a identificação de grupos com formatos arbitrários (HAN; KAMBER; PEI, 2012). Neste trabalho, será proposta uma nova abordagem de densidade e grade para o problema de agrupamento, implementada na forma de um algoritmo genético – método de otimização global, e que utiliza, para a determinação dos grupos, os conceitos de efeitos de primeira e segunda ordem em estatística espacial. A abordagem contempla, ainda, técnicas para redução de dimensionalidade e projeção bidimensional da estrutura de distâncias subjacentes aos conjuntos de dados, possibilitando uma inspeção visual direta e relevante dos mesmos (INGWER; PATRICK, 2005). Para avaliar o algoritmo proposto, foram realizados experimentos computacionais envolvendo 55 bases de dados reais e artificiais, de forma que as soluções (agrupamentos) produzidas foram avaliadas/analisadas mediante a aplicação de índices associados a critérios de validação, além de uma comparação com as soluções produzidas por outro algoritmo de densidade tradicional da literatura - DBSCAN. Os resultados e análises produzidas indicam que a abordagem proposta constitui-se como uma boa alternativa à resolução do problema de agrupamento.
Palavras-chave: Análise de Agrupamentos, Algoritmos Genético de Chaves Aleatórias, Processos Pontuais Espaciais, Escalonamento Multidimensional.
Banca examinadora:
José André de Moura Brito (ENCE/IBGE) – Orientador
Flávio Marcelo Tavares Montenegro (ENCE/IBGE) – Coorientador
Gustavo da Silva Ferreira (ENCE/IBGE)
Coordenação de Graduação
Gustavo da Silva Ferreira