ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS
Apresentação de Monografia |
A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: “RANDOM FOREST E BORN-AGAIN TREE PARA PREDIÇÃO DE DOENÇAS CARDIOVASCULARES”
Aluno: Luís Guilherme de Sant'anna Nery Andrade Magalhães
Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)
Data: 25 de julho de 2022 – Segunda-feira
Horário: 16h00m
Local: Rua André Cavalcanti, 106, sala 303 – ENCE
Resumo da Monografia: De acordo com a Organização Mundial da Saúde, estima-se que as doenças cardiovasculares são responsáveis por 17,9 milhões de mortes por ano no mundo todo. Como a previsão precoce deste tipo de doença reduz a probabilidade de complicações em pacientes de alto risco, é de suma importância a realização de estudos com o objetivo de obter uma boa precisão. Porém, no campo da medicina, é crucial entender a razão de qualquer decisão tomada. Logo, este trabalho tem como objetivo realizar uma comparação entre três técnicas de machine learning para problemas de classificação, com foco na interpretabilidade do modelo gerado. Foi desenvolvido um projeto em Python para a aplicação destas técnicas em uma base de dados com informação de casos de aterosclerose. As técnicas comparadas foram: árvore de decisão, Random Forest e Born-Again Tree. Além disso, dois diferentes aspectos dos modelos são examinados neste estudo. O primeiro deles diz respeito ao desempenho preditivo dos modelos, comparando as medidas de acurácia geral, Precision, Recall e F-1 score. O segundo, aborda a interpretabilidade de cada modelo com base em seu nível de complexidade. Finalmente, os resultados mostraram que, na base de dados utilizada, a técnica Random Forest teve um maior desempenho preditivo em relação à árvore de decisão, como esperado. E a utilização da técnica Born-Again foi essencial pois simplificou a visualização do modelo de Random Forest, preservando sua acurácia.
Palavras-chave: árvores de decisão; Random Forest; Born-Again Tree; interpretabilidade; doença cardiovascular; machine learning
Banca examinadora:
Eduardo Corrêa Gonçalves (ENCE/IBGE) – Orientador
Daniela Polessa Paula (ENCE/IBGE)
Coordenação de Graduação