Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Existem sites interessantes onde eu possa encontrar bases de dados para brincar com Aprendizagem de Máquinas, Estatística, Econometria e Paradigmas relacionados a administração de Big Data?

0 votos
1,408 visitas
perguntada Mar 7, 2016 em Dados e Bases de Dados por danielcajueiro (5,726 pontos)  
Compartilhe

1 Resposta

0 votos
respondida Mar 7, 2016 por danielcajueiro (5,726 pontos)  

Algumas excelentes fontes de dados são:

1. Bases de dados para treinar machine learning

Bases de dados do Kaggle

UCI machine learning repository

2. Bases de dados de livros

Site da Cengage com os dados usados no livro Introductory Econometrics do Wooldridge Veja aqui também exemplos do uso desses dados em Python.

A página de dados do Livro Modern Multivariate Statistical Techniques - Alan J. Izenman

Applied Econometric Time Series - Walter Enders: Veja aqui uma aplicação desses dados.

A página de dados do livro Introduction to Econometrics - Stock and Watson

An introduction to statistical learning with applications in R - Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani

Methods of Multivariate Analysis - Alvin C. Rencher

3. Dados Econômicos de fontes reconhecidas

Mundo

Econdata: Veja também The craft of economic modeling

United Nations data

OECD data

Time series data

Brasil

IPEA data

50 maiores bancos - BACEN: Veja aqui um exemplo do uso desses dados.

IBGE

4. Dados de finanças

Yahoo Finanças

Fama-French data

Nefin

5. Dados de redes complexas

Complex networks resourses

Stanford large network dataset collection

University of California - Network dataset collection

Cambridge Networks Network

Luciano Costa databases

Network Science

Complex Networks Datasets

6. Bases de dados de Softwares

R datasets package

Scipy data sets

Pajek datasets: Veja aqui um exemplo do uso de dados em pajek em análise empírica de redes complexas.

Outros

A página de dados do Robert Niles (Jornalista e Web Designer)

...