ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Pós-Graduação em População, Território e Estatísticas Públicas
Qualificação de Tese de Doutorado
A Escola Nacional de Ciências Estatísticas convida para a Qualificação de Tese de Doutorado intitulada: “Algoritmos de otimização aplicados ao problema de agrupamento com seleção de variáveis ”
Aluno: Leandro Lins Marino
Data: 30 de Abril de 2021 – Sexta-Feira
Horário: 14h00m
Resumo Tese: Em face às tecnologias atuais utilizadas para coleta, análise e disseminação de dados, a produção de informações associadas às mais variadas temáticas tem se multiplicado. Concomitantemente, há um crescimento expressivo nos conjuntos de dados, tanto na quantidade de registros quanto em suas dimensões (variáveis). Entretanto, nem todas as variáveis disponíveis nesses dados são necessárias ou contribuem de maneira efetiva para a produção de análises, o que implica buscar alternativas para a resolução do Problema de Seleção de Variáveis (PSV). Esse problema possui um papel de grande importância no processo analítico, em especial, quando são analisados conjuntos de dados com alta dimensionalidade. Quando abordado como um problema de otimização, o PSV é classificado como um problema de alta complexidade, o que torna difícil ou mesmo inviável o uso abordagens exatas, visto o tempo computacional demandado. Diante de tal complexidade, este projeto de qualificação traz novas propostas para a resolução do PSV, considerando o desenvolvimento de algoritmos de otimização baseados em meta-heurísticas, e que foram combinados com diferentes algoritmos de agrupamento, medidas de distância, índices de validação e funções objetivo. Mais especificamente, para resolver o PSV, foram considerados dois caminhos distintos: por meio de uma Heurística Construtiva e através de algoritmos baseados na meta-heurística Algoritmo Genético de Chaves Aleatórias Viciadas (BRKGA, do inglês Biased Random-Key Genetic Algorithm. Em particular, foram propostos BRKGAs com três decodificadores, sendo um de natureza aleatória, um que aborda a Análise de Agrupamentos e o outro por meio de Análise de Componentes Principais. De forma a avaliar o desempenho dos algoritmos propostos quanto à qualidade das soluções produzidas tanto para o problema de agrupamento, quanto em relação à identificação das variáveis mais relevantes, foram realizados experimentos computacionais com conjuntos de dados reais e artificiais. Os resultados obtidos até o momento indicam que a metodologia proposta constitui um caminho promissor para a resolução do PSV.
Palavras-chave: Análise de Agrupamento. Seleção de variáveis e atributos. Algoritmos de Otimização. Algoritmo Genético. BRKGA
Dr. José André de Moura Brito (ENCE/IBGE) - Orientador
Dr. Gustavo Silva Semaan (UFF). - Coorientador
Dr. Gustavo da Silva Ferreira (ENCE/IBGE)
Dr. Flávio Marcelo Tavares Montenegro (ENCE/IBGE)
Dr. Leonardo Silva de Lima (UFPR)
Angelita Alves de Carvalho