ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “CLASSIFICAÇÃO MULTIRRÓTULO DE COMENTÁRIOS TÓXICOS ATRAVÉS DE REDES NEURAIS RECORRENTES”
Alunos: Marcos Paulo Lima Polatto de Queiroz e Matheus Vasconcellos Costa Bom
Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)
Coorientador: Maurício Franca Lila (ENCE/IBGE)
Data: 03 de julho de 2023 – Segunda-feira
Horário: 18h00m
Local: Rua André Cavalcanti, 106, sala 306 (Auditório) – ENCE
Resumo da Monografia: A evolução tecnológica alterou a forma de nos comunicarmos entre si, assim como a maneira de se obter novas e atualizadas informações. Os fóruns de discussão e as redes sociais, por exemplo tornaram o debate de ideias instantâneo. Este desenvolvimento, apesar de positivo para a sociedade em muitas áreas pode acabar gerando alguns problemas como a disseminação de ideias ou comentários tóxicos, ameaçadores, obscenos ou criminosos. Portanto, para empresas como a Wikipédia que recebe milhões de visitas diárias em suas páginas, torna-se humanamente impossível controlar e moderar as ocorrências desses comentários maldosos em suas páginas de discussão. A solução portanto, é a implementação de métodos computacionais para a redução destas ocorrências. Este trabalho foca em criar um classificador multirrótulo de comentários tóxicos utilizando uma base de dados com comentários retirados de páginas de discussão da Wikipédia e desenvolver modelos de Redes Neurais Recorrentes aliados ao Processamento de Linguagem Natural como forma de lidar com os problemas citados. Durante o desenvolvimento do trabalho, grandes desafios foram encontrados, isso posto o modelo mais promissor obteve um F1-Score de 0,5145. Ao final do trabalho são apresentadas propostas para melhoria dos modelos.
Palavras-chave: Redes Neurais, RNN, Processamento de Linguagem Natural, NLP, classificação multirrótulo, comentários tóxicos.
Banca examinadora:
Eduardo Corrêa Gonçalves (ENCE/IBGE) – Orientador
Maurício Franca Lila (ENCE/IBGE) – Coorientador
Elizabeth Belo Hypolito (ENCE/IBGE)
Breno Tiago Novello Trotta de Oliveira (DPE/IBGE)
Coordenação de Graduação
Gustavo da Silva Ferreira