Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Explorando o paper "The Product Space Conditions the Development of Nations" (Hill Climbing no Espaço-Produto)

0 votos
24 visitas
perguntada Out 27 em Sistemas Complexos por Renan Abrantes (16 pontos)  
editado Out 29 por Renan Abrantes

Trabalho final do curso de Métodos Computacionais em Economia.

Propõe-se, a partir do espaço-produto do paper em questão, rodar um algoritmo de steepest ascent hill climbing para encontrar os máximos locais dessa rede complexa. A função objetivo utilizada para encontrar os máximos é a PRODY, que será explicada na resposta abaixo.

O algoritmo foi postado separadamente no PRorum, com a finalidade de que as pessoas achem mais facilmente essa implementação para situações similares. Veja aqui.

Apenas como comentário adicional, há um pacote de Python denominado "Ecomplexity", que calcula diretamente os índices de complexidade e a matriz de proximidades de uma determinada base de dados. De qualquer forma, este não é o foco do presente trabalho.

Referências:

  • Hidalgo, César A., et al. "The product space conditions the development of nations." Science 317.5837 (2007): 482-487.
  • Hausmann, Ricardo, Jason Hwang, and Dani Rodrik. "What you export matters." Journal of economic growth 12.1 (2007): 1-25.
  • Alshamsi, Aamena, Flávio L. Pinheiro, and Cesar A. Hidalgo. "Optimal diversification strategies in the networks of related products and of related research areas." Nature communications 9.1(2018): 1-7.
  • O’Clery, Neave, Muhammed Ali Yıldırım, and Ricardo Hausmann. "Productive Ecosystems and the arrow of development." Nature communications 12.1 (2021): 1-14.
Compartilhe

1 Resposta

0 votos
respondida Out 29 por Renan Abrantes (16 pontos)  
editado Nov 6 por Renan Abrantes

1. Referência e motivação

O trabalho mais conhecido sobre teoria da complexidade no campo do desenvolvimento econômico é o de Hausmann e Hidalgo. As suas duas principais contribuições são os índices de complexidade econômica e o espaço-produto. Neste exercício, vamos explorar o espaço-produto. Para mais informações sobre os índices de complexidade econômica, clique aqui.

A partir de dados de exportação de bens, os autores calculam os índices de Vantagem Comparativa Revelada (VCR), conforme proposto por Balassa (1965). Caso o índice seja maior que um, considera-se que o país tem VCR no produto em questão. Os VCRs implicam a construção de uma matriz de zeros e uns, com os produtos de um lado e os países do outro.

Essa matriz é facilmente transformada em uma matriz de proximidades, que indica a probabilidade condicional mínima de um produto \(i\) ser exportado (com VCR) dado que outro produto \(j\) é exportado. A matriz de proximidades pode ser definida como:

\(\theta_{i, j} = min[P(VCRx_{i}|VCRx_{j}), P(VCRx_{j}|VCRx_{i})]\)

Observe que esta matriz é simétrica e que, ao minimizar nos dois sentidos da probabilidade condicional, toma-se uma atitude mais "conservadora" para se mensurar o compartilhamento de requisitos produtivos entre dois produtos.

Aplica-se, então, uma maximum spanning tree sobre essa matriz, de maneira a formar um "esqueleto" para a rede de compartilhamento produtivo a que se quer chegar. Por último, os autores povoam a rede com todas as proximidades entre produtos com valor acima de \(0,55\). Aqui nasce o espaço-produto.

Hausmann, Hidalgo et al (2014) fazem uso de uma metáfora para explicar o processo de desenvolvimento por meio dessa rede, o espaço-produto, transcrita em tradução livre:

"Imagine que o espaço-produto é uma floresta, na qual todo produto é uma árvore. Árvores que requerem capacidades similares estão próximas umas das outras na floresta. Árvores distantes requerem capacidades bem diferentes. Se os países são uma coleção de firmas que fazem diferentes produtos, podemos pensar nas firmas como macacos que vivem em árvores, significando que eles exploram certos produtos. Países diferem no número e na localização dos seus macacos nessa floresta em comum. O processo de desenvolvimento, que implica aumentar a diversidade e complexidade, é semelhante a macacos colonizarem a floresta, ocupando mais árvores e movendo-se especialmente para as que tiverem mais frutas, ou seja, as mais complexas.

Em "The product space conditions the development of nations", os autores não somente constroem o espaço-produto, como também testam se essa rede aufere a probabilidade de um país desenvolver VCR em um produto em função de sua vizinhança produtiva. Ao passo que a probabilidade de desenvolver VCR em um produto com proximidades de 0,1 é basicamente nula, os autores afirmam que se a proximidade é de 0,8, a probabilidade aumenta para 15%. Dentre outros resultados, este confirma que o espaço-produto explica a aparição de novos produtos exportados pelos países ao longo do tempo.

2. Teoria econômica

Os achados de Hidalgo e Hausmann se encaixam na literatura que alia a diversificação produtiva ao desenvolvimento econômico, com níveis de path dependence.

Em 2018, Hidalgo e Pinheiro discutiram estratégias de diversificação no espaço-produto, com o objetivo de identificar o “tempo” que um produto demoraria para “contagiar” por inteiro essa rede a partir de alguns algoritmos testados. Nesta proposta, quanto menor o tempo de difusão, melhor.

Em 2021, Hausmann e O’Clery propõem um novo espaço-produto, o Eco Space, inspirado no conceito de aninhamento (nestedness) das redes tróficas de biologia. Produtos “raros” só passam a ser produzidos se uma economia tiver uma ampla quantidade de produtos mais “comuns”.

As ideias de aninhamento e complementariedade produtiva contribuíram para entender a trajetória de desenvolvimento de uma economia, mas ainda carecem de explicações para algumas economias ficarem presas em armadilhas de renda nesse arcabouço teórico.

Afinal, essa literatura poderia explicar por que “A Grande Divergência” se mantém, para além dos motivos já apontados na ciência econômica? Por que algumas economias não conseguem se desenvolver ou outras ficam no meio do caminho?

A imagem será apresentada aqui.
Figura extraída da aula de Economia Brasileira do prof. Bernardo Mueller da UnB, com dados da Penn World Table

3. Base de Dados

A Universidade de Harvard mantém um site dedicado ao estudo da complexidade econômica, denominado Atlas of Economic Complexity, em https://atlas.cid.harvard.edu/.

Neste site, há um banco de dados chamado Dataverse com os insumos necessários para este exercício. O exercício foi feito com dados de exportação de bens originalmente extraídos do COMTRADE, conforme o Sistema Harmonizado das Nações Unidas (HS-92), de 4 dígitos, e tratados pela equipe do Dataverse.

No Dataverse, o espaço-produto pode ser diretamente extraído em formato de lista de conexões entre os vértices (edges list), assim como os dados de VCR para cada ano x país x produto.

Os dados de PIB per capita PPP são extraídos dos World Development Indicators, do Banco Mundial. Esses dados servirão de insumo para o hill climbing no espaço-produto, o que será melhor explicado mais à frente.

Escolhi o ano de 2015 para extrair os dados de interesse.

4. Por que hill climbing no espaço-produto?

Em 2007, Hausmann e Rodrik propuseram um indicador de renda per capita associada à exportação de um produto – PRODY. O PRODY nada mais é que a ponderação das rendas per capita de cada país \(j\) pelo VCR que cada país tem para o produto \(k\).

\(PRODY_k = \sum_j\frac{(x_{jk}/X_j)}{\sum_j(x_{jk}/X_j)}Y_j\)

Em 2018, ao testar os tempos de difusão no espaço-produto, Hidalgo e Pinheiro afirmam:

“…we model diffusion sequentially, by choosing one potentially active node as an activation target at each time step (the target). A strategy, therefore, can be described as an ordered sequence of activation targets.” … “Certainly, one could focus on other objective functions (such as maximizing the contribution of exports to GDP...). For now, we leave the extension to other objective functions as a future exercise...”

Complementando a ideia original de difusão de Hidalgo e Pinheiro, propõe-se aqui que a função objetivo da difusão sequencial seja o PRODY. O PRODY representará o payoff que uma economia terá em passar a exportar aquele produto.

Com a função objetivo definida, proponho aqui um toy model para testar a difusão no espaço-produto sujeita à otimização via PRODY. Suponha que no momento \(t_0\) uma economia é especializada em um produto \(i\), que tem uma vizinhança de \(j\) outros produtos. Os recursos produtivos serão alocados de forma a otimizar a renda, dentro das restrições de vizinhança desse produto. O resultado dessa otimização é se especializar somente no produto que contém o PRODY máximo na vizinhança e assim sucessivamente, até que se chegue a um máximo local.

Este algoritmo de steepest ascent hill climbing é antagônico à pura complementariedade produtiva das propostas anteriores dessa literatura. O mecanismo de disputa por recursos produtivos é internalizado ao espaço de possibilidades de produção. É esse mecanismo que vai gerar os máximos locais na rede, ou seja, as armadilhas de renda.

Na heurística deste exercício, é como se estivéssemos procurando os pontos em que não é possível mudar sem sacrificar de imediato alguma utilidade, representando uma forma de pareto-eficiência no tempo. É nesse ponto que a economia apresentaria riscos de estacionar.

A imagem será apresentada aqui.

5. Resultados

5.1 Máximos Locais

O espaço-produto-PRODY apresenta uma estrutura recheada de máximos locais e que pode levar a armadilhas de renda, a depender dos produtos em que uma economia é especializada.

Dentre os 866 produtos deste espaço-produto, temos 196 que representam um máximo local. Isso não quer dizer que os 196 máximos locais representem subdesenvolvimento. De qualquer forma, 98 (50% dos máximos) deles configuram renda per capita menor que a da Grécia (aprox. US$ 30.000), que é a economia avançada com menor renda per capita em 2019 para o WEO-FMI.

Já 246 produtos (28,4% do total) caem, ao final do hill climbing, nos máximos locais representados pela renda per capita de economias não avançadas.

O exercício mostra que o espaço-produto-PRODY é sujeito a path dependence. Os resultados finais de PRODY podem ser bem sensíveis às condições iniciais do exercício, ou seja, em que ponto se iniciou o hill climbing e qual era o seu PRODY inicial.

O ponto de início é condição-chave, pois a sua vizinhança e seus respectivos payoffs é o que determinará se há alguma possibilidade de melhoria no PRODY. Da mesma forma, se o algoritmo escolher um vértice que não seja o de origem, a vizinhança deste novo vértice e os seus respectivos payoffs é o que determinará as suas possibilidades de "ascensão" na rede.

A figura abaixo relaciona o PRODY inicial ao PRODY final, extraído após o algoritmo chegar a um vértice que representa um máximo local:

A imagem será apresentada aqui.

Nesta figura, é possível observar que há aproximadamente 250 vértices com PRODY final representando uma renda per capita de economia não desenvolvida, menor que US$30.000 (o que já havia sido mencionado anteriormente).

O "teto" do PRODY, em laranja, representa as restrições de cada produto. Neste ambiente de path dependence, é possível sair de uma renda per capita inicial menor que alguma contraparte, mas chegar a uma renda per capita maior no final das contas. De qualquer forma, essa situação não é comum.

5.2 A Corrida da Rainha Vermelha

Vamos dividir os resultados em quartis para observar melhor essa questão, observando em que quartil o PRODY inicial de um produto estava e em qual quartil ele chegou no PRODY final .

No primeiro gráfico abaixo, temos a divisão utilizando os mesmos valores para separar os quartis do PRODY inicial e do final. Já no segundo gráfico, os quartis do PRODY final são refeitos para representar a nova "distribuição de renda" após todos estarem em seus máximos locais.

A imagem será apresentada aqui.
A imagem será apresentada aqui.

Observe que este toy model não prevê bem armadilhas de pobreza. Apenas 22% dos produtos que estavam no primeiro quartil do PRODY inicial assim se mantiveram no PRODY final.

Entretanto, isso não quer dizer que haja alta mobilidade no desenvolvimento comparativo. Quando cruzados os quartis de PRODY inicial com os de PRODY final, 57% daqueles que caíam no primeiro quartil do PRODY inicial se mantém no primeiro quartil do PRODY final. Apenas 9% deles conseguem chegar ao quartil final. Esse movimento parece se repetir ao longo dos quartis, com certa "persistência" no desenvolvimento comparativo.

Esse movimento pode representar uma Corrida da Rainha Vermelha (ou Rainha de Copas), metáfora extraída de Alice no País das Maravilhas: "É preciso correr o máximo possível, para permanecermos no mesmo lugar."

A hipótese da Rainha Vermelha é utilizada na biologia para descrever a incessante corrida evolucionária entre espécies, na qual uma espécie se desenvolve continuamente para manter estável a sua aptidão relativa às outras espécies. Da mesma forma, o segundo gráfico apresenta a dinâmica de as economias crescerem para seguir na mesma posição relativa do desenvolvimento econômico mundial.

5.3 A Contribuição do Grau de Conexões

Hidalgo e Pinheiro (2018) concluem que o grau de conexões (degree) de um produto é muito importante para diminuir o tempo de difusão no espaço-produto. Qual seria o efeito do grau de conexões para o exercício de hill climbing?

Controlado pelo PRODY inicial, o degree do produto inicial tem efeito positivo sobre o PRODY final, de US$162 por conexão, confirmando que as conexões produtivas facilitariam o desenvolvimento econômico. Entretanto, o grau de conexão do produto inicial tem um alcance bem limitado no exercício de hill climbing. Aproximadamente 84% dos produtos tem até 10 conexões no espaço-produto, restringindo a sua contribuição para o PIB per capita final.

Quando o PRODY final também é controlado pelo número de passos dados a partir de cada vértice, o degree deixa de ter significância estatística. Já o efeito de cada passo é de US$5.142 adicionais no PRODY final (e estatisticamente significante). Isso demonstra, pela natureza do exercício de hill climbing, que o número de vizinhos não importa tanto quanto ter sucessivamente ao menos um vizinho com PRODY maior do que o produto de origem.

A imagem será apresentada aqui.
A imagem será apresentada aqui.

6. Código

O algoritmo foi postado separadamente no PRorum, com a finalidade de que as pessoas achem mais facilmente essa implementação para situações similares. Veja aqui.

...