logotipo ence

 

ENCEemFOCO_N2.
SiSU 2024
Catalogo de Projetos 2023
Nota 5 Post para Facebook
Núcleo ENCE Covid-19
Agenda de Eventos Externos
SAS
1/7 
start stop bwd fwd

 
 
  

Vídeo Institucional
 
 
 
ungp brazil hub logo md
 
 
 
ico rbe.fw
 
 
 
banner com qrcode completo

Apresentação de Monografia da Graduação de Luís Guilherme de Sant'anna Nery Andrade Magalhães

ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS

Graduação em Estatística

Apresentação de Monografia

A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada: RANDOM FOREST E BORN-AGAIN TREE PARA PREDIÇÃO DE DOENÇAS CARDIOVASCULARES

Aluno: Luís Guilherme de Sant'anna Nery Andrade Magalhães

Orientador: Eduardo Corrêa Gonçalves (ENCE/IBGE)

Data: 25 de julho de 2022 – Segunda-feira

Horário: 16h00m

Local: Rua André Cavalcanti, 106, sala 303 ENCE

Resumo da Monografia: De acordo com a Organização Mundial da Saúde, estima-se que as doenças cardiovasculares são responsáveis por 17,9 milhões de mortes por ano no mundo todo. Como a previsão precoce deste tipo de doença reduz a probabilidade de complicações em pacientes de alto risco, é de suma importância a realização de estudos com o objetivo de obter uma boa precisão. Porém, no campo da medicina, é crucial entender a razão de qualquer decisão tomada. Logo, este trabalho tem como objetivo realizar uma comparação entre três técnicas de machine learning para problemas de classificação, com foco na interpretabilidade do modelo gerado. Foi desenvolvido um projeto em Python para a aplicação destas técnicas em uma base de dados com informação de casos de aterosclerose. As técnicas comparadas foram: árvore de decisão, Random Forest e Born-Again Tree. Além disso, dois diferentes aspectos dos modelos são examinados neste estudo. O primeiro deles diz respeito ao desempenho preditivo dos modelos, comparando as medidas de acurácia geral, Precision, Recall e F-1 score. O segundo, aborda a interpretabilidade de cada modelo com base em seu nível de complexidade. Finalmente, os resultados mostraram que, na base de dados utilizada, a técnica Random Forest teve um maior desempenho preditivo em relação à árvore de decisão, como esperado. E a utilização da técnica Born-Again foi essencial pois simplificou a visualização do modelo de Random Forest, preservando sua acurácia.

Palavras-chave: árvores de decisão; Random Forest; Born-Again Tree; interpretabilidade; doença cardiovascular; machine learning

Banca examinadora:

Eduardo Corrêa Gonçalves (ENCE/IBGE) Orientador

Daniela Polessa Paula (ENCE/IBGE)

Coordenação de Graduação

Endereço: Rua André Cavalcanti, 106 - Bairro de Fátima - CEP 20231-050 - Rio de Janeiro