ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “ALGORITMO DE AGRUPAMENTO APLICADO A BASES DE DADOS DE GRANDE PORTE”
Aluno: Roberto da Fonseca Rutz
Orientador: José André de Moura Brito (ENCE/IBGE)
Data: 29 de junho de 2023 – Quinta-feira
Horário: 18h30m
Local: Rua André Cavalcanti, 106, sala 306 (Auditório) – ENCE
Resumo da Monografia: Neste TCC é proposto um novo algoritmo para resolver o problema de agrupamento com k-medoids, normalmente abordado e resolvido mediante a utilização dos clássicos algoritmos PAM e CLARA. O primeiro algoritmo tem limitações quanto ao tamanho das bases de dados que podem ser utilizadas, isto é, o número máximo de objetos a serem agrupados e o segundo, correspondente a uma variante do primeiro, produz soluções (agrupamentos) de qualidade, apenas, razoável. Assim sendo, buscando resolver esse problema para bases de dados de maior porte e produzir soluções de boa qualidade, foi desenvolvido um algoritmo baseado em um método de otimização global, mais especificamente, na metaheurística algoritmos genéticos de chaves aleatórias viciadas. Para avaliação da eficácia e eficiência do novo algoritmo, frente aos algoritmos PAM e CLARA, foram realizados experimentos computacionais com 50 bases de dados, diversificadas quanto à origem, ao número de objetos e atributos. Nesses experimentos foram analisados os valores da função objetivo, da silhueta média e dos tempos de processamento, produzidos pelos três algoritmos. O novo algoritmo produziu melhores soluções, especialmente, para bases de dados a partir de 100.000 objetos.
Palavras-chave: Problema de Agrupamento, Bases de Dados de Grande Porte, Metaheurística.
Banca examinadora:
José André de Moura Brito (ENCE/IBGE) – Orientador
Flávio Marcelo Tavares Montenegro (ENCE/IBGE)
Gustavo da Silva Ferreira (ENCE/IBGE)
Coordenação de Graduação
Gustavo da Silva Ferreira