logotipo ence

 

Nupesq.
ENCEemFOCO_N2.
SiSU 2024
Catalogo de Projetos 2023
Nota 5 Post para Facebook
Núcleo ENCE Covid-19
Agenda de Eventos Externos
SAS
1/8 
start stop bwd fwd

 
 
  

Vídeo Institucional
 
 
 
ungp brazil hub logo md
 
 
 
ico rbe.fw
 
 
 
banner com qrcode completo

Apresentação de Monografia da Graduação de Marcos Paulo Lima Polatto de Queiroz e Matheus Vasconcellos Costa Bom

ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS

Graduação em Estatística

Apresentação de Monografia

A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: CLASSIFICAÇÃO MULTIRRÓTULO DE COMENTÁRIOS TÓXICOS ATRAVÉS DE REDES NEURAIS RECORRENTES

Alunos: Marcos Paulo Lima Polatto de Queiroz e Matheus Vasconcellos Costa Bom

Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)

Coorientador: Maurício Franca Lila (ENCE/IBGE)

Data: 03 de julho de 2023 – Segunda-feira

Horário: 18h00m

Local: Rua André Cavalcanti, 106, sala 306 (Auditório) ENCE

Resumo da MonografiaA evolução tecnológica alterou a forma de nos comunicarmos entre si, assim como a maneira de se obter novas e atualizadas informações. Os fóruns de discussão e as redes sociais, por exemplo tornaram o debate de ideias instantâneo. Este desenvolvimento, apesar de positivo para a sociedade em muitas áreas pode acabar gerando alguns problemas como a disseminação de ideias ou comentários tóxicos, ameaçadores, obscenos ou criminosos. Portanto, para empresas como a Wikipédia que recebe milhões de visitas diárias em suas páginas, torna-se humanamente impossível controlar e moderar as ocorrências desses comentários maldosos em suas páginas de discussão. A solução portanto, é a implementação de métodos computacionais para a redução destas ocorrências. Este trabalho foca em criar um classificador multirrótulo de comentários tóxicos utilizando uma base de dados com comentários retirados de páginas de discussão da Wikipédia e desenvolver modelos de Redes Neurais Recorrentes aliados ao Processamento de Linguagem Natural como forma de lidar com os problemas citados. Durante o desenvolvimento do trabalho, grandes desafios foram encontrados, isso posto o modelo mais promissor obteve um F1-Score de 0,5145. Ao final do trabalho são apresentadas propostas para melhoria dos modelos.

Palavras-chave: Redes Neurais, RNN, Processamento de Linguagem Natural, NLP, classificação multirrótulo, comentários tóxicos.

Banca examinadora:

Eduardo Corrêa Gonçalves (ENCE/IBGE) – Orientador

Maurício Franca Lila (ENCE/IBGE) – Coorientador

Elizabeth Belo Hypolito (ENCE/IBGE)

Breno Tiago Novello Trotta de Oliveira (DPE/IBGE)

Coordenação de Graduação

Gustavo da Silva Ferreira

Endereço: Rua André Cavalcanti, 106 - Bairro de Fátima - CEP 20231-050 - Rio de Janeiro