logotipo ence
 
 
  

Vídeo Institucional
 
 
 
ungp brazil hub logo md
 
 
 
ico rbe.fw
 
 
 
banner com qrcode completo

Minicurso: Introdução à coleta de dados da internet com o pacote rvest.

Laboratório 104, 01 de novembro, 2024

Horário: 14:00 às 17:00hs

Ministrante: Guilherme dos Santos (UFRJ).

guilherme 8semic

MiniBio: Possui graduação em estatística pela ENCE e mestrado em estatística pela UFRJ. Atualmente é doutorando em estatística na UFRJ e professor substituto no Departamento de Métodos Estatísticos (DME-UFRJ).

Resumo: Ocasionalmente, podemos estar interessados em analisar um conjunto de dados que está disponível apenas em uma página da web. Isto é, a informação de interesse pode estar disponíıvel como texto ou como uma tabela em um website, mas não disponível para download. Neste caso, precisamos de uma ferramenta para extrair estes dados e transformá-los em algo em que possamos trabalhar no R. Neste minicurso, será apresentado o pacote rvest como ferramenta para realizar a extração de dados em páginas da web. Veremos como identificar e extrair os elementos que representam os dados de interesse, sejam eles tabelas ou pedaços de texto.

Requisitos desejáveis: conhecimentos básicos de R (preferencialmente ter cursado ou estar cursando a disciplina Estatística Computacional I).   

Inscrições: 14 a 18 de out/2024 pelo Microsoft Teams através do link abaixo

https://forms.office.com/r/rWCiEYCbVR

As vagas são limitadas!

Endereço: Rua André Cavalcanti, 106 - Bairro de Fátima - CEP 20231-050 - Rio de Janeiro