logotipo ence

 

ENCEemFOCO_N2.
SiSU 2024
Catalogo de Projetos 2023
Nota 5 Post para Facebook
Núcleo ENCE Covid-19
Agenda de Eventos Externos
SAS
1/7 
start stop bwd fwd

 
 
  

Vídeo Institucional
 
 
 
ungp brazil hub logo md
 
 
 
ico rbe.fw
 
 
 
banner com qrcode completo

Apresentação de Monografia da Graduação de Aline de Mendonça Brasilino e Quezia Tedeschi da Silva

ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS

Graduação em Estatística

Apresentação de Monografia

A Escola Nacional de Ciências Estatísticas convida para a defesa de Monografia da Graduação intitulada:

 “EXPLORANDO CENÁRIOS PARA COMPARAR PERFORMANCE DE MODELOS PARA PREDIÇÃO DE VARIÁVEIS BINÁRIAS DESBALANCEADAS

Alunas: Aline de Mendonça Brasilino e Quezia Tedeschi da Silva

Orientador: Gustavo Henrique Mitraud Assis Rocha

Data: 26 de janeiro de 2022

Horário: 18h10min

Local:

https://ibge.webex.com/ibge/j.php?MTID=m3068580201f8169be0f1f77415fc23f2 (senha TCCENCE)

Resumo da Monografia: A identificação do classificador que tem a melhor performance para verdadeiros positivos e para verdadeiros negativos ao analisar variáveis binárias desbalanceadas impõe desafios à tomada de decisões durante a análise de dados. Neste trabalho, criamos 36 cenários com esse objetivo para os modelos: Naive Bayes, CART, Floresta Aleatória e Regressão Logística sob abordagem bayesiana. Cada cenário foi definido variando o tamanho do conjunto de dados e a proporção de desbalanceamento da variável resposta na base de treino e na base de teste. Foram utilizados dados históricos do comportamento de clientes de empréstimos ao consumidor. Os cenários foram implementados no software R. Para cada modelo em cada cenário calculamos as métricas: sensibilidade, especificidade, VPP (Valor Preditivo Positivo) e AUC (Área Sob a Curva). O ponto de corte para classificação dos clientes em inadimplentes e adimplentes foi definido como o ponto que maximiza a soma da sensibilidade e da especificidade. Foram desconsiderados resultados em que AUC ≤ 0,5, por isso, o modelo CART e os cenários cujos tamanho da base de treino era igual a 100 foram retirados. As métricas de desempenho foram maiores quanto maior o tamanho da base e menor o desbalanceamento na base de treino.

Banca examinadora:

Gustavo Henrique Mitraud Assis Rocha (Escola Nacional de Ciências Estatísticas/ENCE-IBGE/Brasil) - Orientador
Eduardo Corrêa Gonçalves (Escola Nacional de Ciências Estatísticas/ENCE-IBGE/Brasil)
Larissa de Carvalho Alves (Escola Nacional de Ciências Estatísticas/ENCE-IBGE/Brasil)

Coordenação de Graduação

Endereço: Rua André Cavalcanti, 106 - Bairro de Fátima - CEP 20231-050 - Rio de Janeiro