ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “ESTUDO COMPARATIVO DE ESTRATÉGIAS PARA O CASAMENTO SEMÂNTICO DE NOMES DE PRODUTOS E SERVIÇOS”
Aluno: Antônio Mamede Araújo de Medeiros
Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)
Data: 29 de julho de 2022 – Sexta-feira
Horário: 15h00m
Local: Rua André Cavalcanti, 106, sala 306 – ENCE
Resumo da Monografia: O principal objetivo do casamento semântico de textos é medir o grau de similaridade semântica de um texto para outro, permitindo por exemplo, a realização da correspondência automática entre itens equivalentes, mas com escrita dissemelhante, em duas pesquisas distintas do IBGE. Além de poder ser utilizado para agrupar nomes diferentes em um só nome para representar todos esses mesmos itens. Este trabalho compara abordagens automáticas de casamento semântico de nomes de produtos e serviços da Pesquisa de Orçamentos Familiares (POF) com as do Sistema Nacional de Índices de Preços ao Consumidor (SNIPC) utilizando algoritmos de similaridade de Leveshtein, Jaro e Jaccard além de técnicas como o TF-IDF e embeddings semânticos gerados via Word2Vec.
Palavras-chave: Casamento de textos curtos. Similaridade Semântica. TF-IDF. Word2Vec. Embeddings Semânticos. Processamento de Linguagem Natural.
Banca examinadora:
Eduardo Corrêa Gonçalves (ENCE/IBGE) – Orientador
Maria Luíza Guerra de Toledo (ENCE/IBGE)
Coordenação de Graduação
Gustavo da Silva Ferreira