Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Existe alguma resistência dos departamentos de Economia em utilizar Machine Learning para previsões?

+8 votos
932 visitas
perguntada Jan 23, 2016 em Economia por eco1911 (146 pontos)  

Não vejo disciplinas relacionadas a Aprendizagem de Máquinas (Machine Learning) nas pós-graduações de Economia. Elas são consideradas técnicas incompatíveis ou existem economistas desenvolvendo esse tipo de pesquisa no Brasil?

Até mesmo nos departamentos de Estatística não tenho encontrado muita coisa desse caráter, focando sobretudo em aplicações.

Estaria o Brasil atrasado nesse campo? Existe mesmo uma demanda por esse tipo de profissional ou Ciência de Dados (Data science) e Aprendizagem de Máquinas (Machine Lerning) estão sendo "sobrevalorizados" na mídia?

Compartilhe

2 Respostas

+8 votos
respondida Jan 24, 2016 por danielcajueiro (5,136 pontos)  

Não existe resistência e acho que existe muita curiosidade (:-). Quem não está interessado em saber como o Google escolhe labels para suas imagens e como a Amazon ou o Netflix te oferece sugestões de compra??. Para usar Aprendizagem de Máquinas (ou qualquer outra técnica), você precisa ter uma pergunta de pesquisa relevante que justifique o seu uso.

Sua pergunta é muito interessante e, por isso, vou tentar considerar várias dimensões complementares - não acredito que dê para responder de forma simples e direta:

1) O objetivo principal de um economista é responder perguntas de pesquisa importantes, que em geral envolve o processo de escolha dos agentes e tem como base a Teoria Microeconômica. Logo, o economista vai apenas se preocupar em desenvolver ou usar técnicas de Aprendizagem de Máquinas se elas realmente forem úteis para responder perguntas em economia. Quando desenvolvemos um modelo, tentamos modelar a "essência" do processo que estamos trabalhando. Já mencionei esse ponto aqui nessa resposta:

"O mapa não é o território. A única utilidade de um mapa depende da similaridade de estrutura entre o mundo empírico e o mapa. - Alfred Korzybski".

The map is not a territory

Cada tipo de mapa tem habilidade de modelar uma dimensão. Existem mapas físicos (usados para modelar um espaco físico de um determinado ambiente), mapa econômicos (focam em atividades econômicas), mapas políticos (que delimitam as fronteiras das cidades, estados e países) e muitos outros. Assim como mapas, modelos modelam algumas dimensões adequadamente. Apenas Deus ou a natureza tem as equacões matemáticas exatas usadas para gerar determinado tipo de dado (já fizemos esse tipo de comentário aqui). De fato, o que queremos são modelos úteis.

Nesse contexto é importante notar que a maioria das perguntas que o economista enfrenta leva a testar teorias já desenvolvidas (pela Teoria Econômica) ou estender essas teorias, que tem diferenças conceituais importantes com a metodologia proposta por Aprendizagem de Máquinas:

a) Enquanto economistas usam dados para VALIDAR teorias, cientistas da área de Aprendizagem de Máquinas usam dados para GERAR teorias.

b) Economistas estão muito interessados em medir o impacto de uma variável em outra. Muitas vezes modelos lineares de regressão ou painel de dados lineares são mais adequados para trabalhar com problemas desse tipo, pois esses "impactos" saem facilmente do modelo. Os modelos usados em Aprendizagem de Máquina não possuem essa facilidade. Considere por exemplo os Modelos de Resposta Binária. Embora esses modelos sejam bem simples, você não consegue explicitamente o tamanho do efeito, mas apenas a direção do efeito.

c) Econometristas desenvolveram várias técnicas para tornar as regressões para o teste de teoria mais confiáveis. Por exemplo, endogeneidade é um problema típico que afeta nossas regressões e hoje temos abordagens muito interessantes para lidar com ela.

Mas sua pergunta foi "por que economistas não usam Aprendizagem de Máquinas em Previsão?" Estou considerando agora a área de previsão aqui de forma bem restrita, por exemplo, a área de previsão de estrutura a termo de taxas de juros e a área de previsão de retornos de ativos financeiros (pois de uma forma geral, qualquer boa teoria gera boas previsões). Nessas áreas, as diferenças descritas acima não apareceriam e essas podem ser usadas sem dificuldade. Mas esse tipo de previsão é uma porção pequena do trabalho do econometrista. Faça um teste... Pergunte aos economistas que você conhece que trabalham com econometria aplicada quais deles usaram econometria para testar teorias e quais deles usaram econometria para fazer previsão.

2) É verdade! Não existem muitos economistas que trabalham diretamente com Aprendizagem de Máquinas. Por que? De fato, essas áreas que exigem mais computação ainda estão se popularizando em economia. Até mesmo para aprender computação básica existem poucas opções dentro de programas de mestrado e doutorado em economia. Na UnB temos um curso no programa de pós-graduação. Veja informação sobre ele aqui. Não conheço outros programas de economia que tenham disciplinas como essa (mas deve haver). Entretanto, nada impede que alunos se inscrevam em cursos da área de ciência da computação ou engenharia que apresentem cursos similares. Vale a pena mencionar (como você pode ver no link do Curso Métodos Computacionais para Economia da UnB) que em a que em algumas edições desse curso trabalhamos explicitamente com Aprendizagem de Máquinas.

3) Muitas vezes simplesmente economistas não dizem que estão trabalhando com Aprendizagem de Máquinas, mas estão trabalhando com algo muito relacionado. Dessa forma, você não ouve economistas falando sobre Aprendizagem de Máquinas. De fato, existem muitas técnicas e idéias que são comuns a Aprendizagem de Máquinas, estatística e econometria. Veja as diferenças nessas perguntas:

Qual a diferença entre econometria e estatística?

Qual a diferença entre Aprendizagem de Máquinas e Estatística?

(Essa pergunta também explora sua questão "Mesmo em departamentos de estatística, não tenho encontrado muita coisa." De fato, a maioria da literatura de Aprendizagem de Máquinas é desenvolvida em Departamentos de Ciência da Computação).

4) Temos professores no Departamento de Economia da UnB e alunos que trabalham com aprendizagem de máquinas lidando com Segmentação de Mercado, Mídia... O Marcelo Medeiros (que é um econometrista da PUC-Rio) trabalha (ou trabalhou) com modelos de redes neurais aplicados a séries temporais economicas, Alexandre Ywata do IPEA (meu co-autor no livro) trabalha (ou trabalhou) com Mistura de Especialistas, Aprendizagem por Reforço e várias outras técnicas que estão na interface de Aprendizagem de Máquinas e Estatística. Deve haver vários outros.

5) Eu acredito que estamos na era dos dados (já mencionei isso aqui). Nunca foi tão barato ter dados (estão na internet de graça), nunca tivemos tanto poder computacional e linguagens de programação adequadas para lidar com dados. Acredito que economia vai seguir essa tendência mundialmente incluindo o Brasil. Em 2013, o Journal of Economic Literature publicou o artigo "Hamermesh, Daniel S. 2013. "Six Decades of Top Economics Publishing: Who and How?" Journal of Economic Literature, 51(1): 162-72.¨:

Top journals are publishing many fewer papers that represent pure theory, regardless of subfield, somewhat less empirical work based on publicly available data sets, and many more empirical studies based on data collected by the author(s) or on laboratory or field experiments.

De fato, a Blooberg View também mencionou esse interesse recente de economistas por dados tomando como base esse artigo do Hamermesh.

changing Economics

6) Existe uma demanda crescente por profissionais que saibam como lidar com dados (incluindo organização e extração) e técnicas adequadas para essa modelagem dirigida por dados. Isso ocorre em todas as áreas! The truth is out there - X Files (desculpe, não resisti) e as empresas querem acessar essa "verdade".

x-files

Essa tendência pode ser vista explicitamente no filme Moneyball mencionado aqui, onde dados são usados para fazer escolhas importantes no Baseball:

Moneyball

+1 voto
respondida Ago 12, 2016 por Marcelo Cruz (16 pontos)  

Não diria que existe uma resistência, mas que em Economia as pessoas em geral esperam que haja uma teoria por trás das informações retiradas dos dados - por exemplo, não apenas que se diga que as relação entre as taxas de juros e o comportamento do consumo é dada por tal função, mas que se explique por que isso acontece. Por causa disso, já vi o termo data mining ser usado de forma quase pejorativa quando as conclusões do processo parecem casuísticas, sem uma teoria subjacente, ou sem o devido cuidado com a consistência dentro x fora da amostra.

...