A Escola Nacional de Ciências Estatísticas convida para a Defesa de Tese de Doutorado intitulada:
O Preço da Cesta Básica à Luz de Big Data
Aluno: Marcus André Alves Zimmermann Vieira
Data: 07 de Fevereiro de 2025– Sexta-Feira
Horário:09h30m
Resumo:A cesta básica tem uma forte representatividade na dinâmica social, pois as classes menos abastadas são muito afetadas pelas variações de preços dos alimentos e outros bens e serviços de consumo básicos. Isso ocorre, porque as desigualdades que assolam o nosso país diminuem o poder de compra da população, o que faz o valor da cesta básica comprometer uma grande parcela da renda das famílias brasileiras. O DIEESE calcula o valor da cesta básica para 17 capitais brasileiras, com base em preços obtidos por coleta presencial em estabelecimentos físicos. Contudo, esse meio de obtenção de dados impõe limitações à cobertura geográfica e à quantidade de estabelecimentos visitados. Além disso, tal processo representa altos custos financeiro e de tempo. Uma opção para superar tais limitações é utilizar métodos inovadores e fontes de dados alternativas. Assim, a presente tese visa propor uma nova abordagem para a coleta dos preços utilizados na base de cálculo do valor da cesta básica a partir de soluções que considerem o uso de big data. Nesta proposta, o valor da cesta básica é calculado com base em preços coletados em páginas de comércio eletrônico que funcionem no Brasil, utilizando a técnica de web scraping com o uso do pacote Selenium no R. Além do trabalho desenvolvido na coleta, ainda foi fundamental estruturar a limpeza e calcular as estatísticas das 17 cidades ao longo de 12 meses. Os valores obtidos com a abordagem alternativa foram comparados aos produzidos pelo DIEESE de forma tradicional e os resultados mostraram que um sobrepõe-se ao outro em muitos momentos, aplicados em diversas localidades. Algumas diferenças foram importantes de serem justificadas, principalmente, o caso dos produtos à granel que apresentavam erros ao apresentar muitos outliers, mas que não invalidam todo o processo. No fim, foi possível aprender que o uso de fontes alternativas neste caso pode complementar a operação presencial de forma a quase substituí-la, o que possibilitaria redução abrupta de custos e, consequentemente, a ampliação de cobertura do indicador.
Palavras-chave:Preço. Cesta básica. Big data. Web scraping. Comércio eletrônico
Banca examinadora:
Dra. Andrea Diniz da Silva (ENCE/IBGE) – Orientadora
Dr. Maurício Onoda (Grupo Carrefour) – Coorientador
Dra. Denise Britz do Nascimento Silva (ENCE/IBGE)
Dra. Maria Luiza Guerra de Toledo (ENCE/IBGE)
Dr. Romay Conde Garcia (ENCE/IBGE)
Dr. Diogo Cortiz da Silva (PUC-SP)
Dra. Ana Luiza Neves de Holanda Barbosa (IPEA/IBMEC-RJ)
Coordenação de Pós-Graduação
Angelita Alves de Carvalho