logotipo ence

 

ENCEemFOCO_N2.
SiSU 2024
Catalogo de Projetos 2023
Nota 5 Post para Facebook
Núcleo ENCE Covid-19
Agenda de Eventos Externos
SAS
1/7 
start stop bwd fwd

 
 
  

Vídeo Institucional
 
 
 
ungp brazil hub logo md
 
 
 
ico rbe.fw
 
 
 
banner com qrcode completo

Apresentação de Monografia da Graduação de Antônio Mamede Araújo de Medeiros

ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS

Graduação em Estatística

Apresentação de Monografia

A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: ESTUDO COMPARATIVO DE ESTRATÉGIAS PARA O CASAMENTO SEMÂNTICO DE NOMES DE PRODUTOS E SERVIÇOS”

Aluno: Antônio Mamede Araújo de Medeiros

Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)

Data: 29 de julho de 2022 – Sexta-feira

Horário: 15h00m

Local: Rua André Cavalcanti, 106, sala 306 ENCE

Resumo da Monografia: O principal objetivo do casamento semântico de textos é medir o grau de similaridade semântica de um texto para outro, permitindo por exemplo, a realização da correspondência automática entre itens equivalentes, mas com escrita dissemelhante, em duas pesquisas distintas do IBGE. Além de poder ser utilizado para agrupar nomes diferentes em um só nome para representar todos esses mesmos itens. Este trabalho compara abordagens automáticas de casamento semântico de nomes de produtos e serviços da Pesquisa de Orçamentos Familiares (POF) com as do Sistema Nacional de Índices de Preços ao Consumidor (SNIPC) utilizando algoritmos de similaridade de Leveshtein, Jaro e Jaccard além de técnicas como o TF-IDF e embeddings semânticos gerados via Word2Vec.

Palavras-chave: Casamento de textos curtos. Similaridade Semântica. TF-IDF. Word2Vec. Embeddings Semânticos. Processamento de Linguagem Natural.

Banca examinadora:

Eduardo Corrêa Gonçalves (ENCE/IBGE) Orientador

Maria Luíza Guerra de Toledo (ENCE/IBGE)

Coordenação de Graduação

Gustavo da Silva Ferreira

Endereço: Rua André Cavalcanti, 106 - Bairro de Fátima - CEP 20231-050 - Rio de Janeiro