Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Como criar uma tabela que mostre as seguintes colunas ( Data , Título , Site ) a partir de Web Scraping ? Por exemplo, uma tabela com notícias do jornal Valor Econômico ou outro de escolha do usuário sobre "Petrobrás". Usando R ou Python.

+2 votos
121 visitas
perguntada Jun 29, 2016 em Programação Computacional por Giovanni Beviláqua (372 pontos)  
Compartilhe

1 Resposta

0 votos
respondida Jun 30, 2016 por danielcajueiro (5,666 pontos)  

Eu sugiro usar o Scrapy. No Python ele funciona muito bem (não sei se ele tem interface com o R). Os detalhes dependem muito do site de interesse. Vários exemplos são apresentados na página do Scrapy.

Para o caso do R, existe um livro muito adequado sobre o assunto que foi copiado dessa resposta (mas não tenho como dar detalhes sobre esse assunto):

XML and Web Technologies for Data Sciences with R (integração do R com tecnologias web)

...