Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Qual a melhor biblioteca em Python para trabalhar com textos jurídicos em processamento de linguagem natural?

0 votos
41 visitas
perguntada Mar 15 em Aprendizagem de Máquinas por WENDEL ANCHIETA (1 ponto)  

Estou iniciando em Processamento de Linguagem Natural, mais especificamente com textos jurídicos. Dessa forma estou procurando um norte, dei uma lida na documentação do Spacy e nltk. Mas, ainda não sei qual a mais adequada. Procuro também exemplos aplicados.

Compartilhe
comentou Mar 15 por Stuart Mill (1,449 pontos)  
Acho que o mais comum de se começar é o nltk. Na página tem vários exemplos com livros do projeto Gutenberg aplicando as funções do módulo.

1 Resposta

0 votos
respondida Jun 2 por danielcajueiro (6,051 pontos)  

Usando o comentário do Stuart Mill acima, de fato, se você não tem experiência prévia, sugiro que comece usando o NLTK. De fato, Processamente de Linguagem Natural é um tópico muito amplo. Depende exatamente do que vc deseja fazer com os textos jurídicos e que tipo de modelos usar.

Além do Spacy, tem ainda o Gensim e o Glove. Ambas são muito boas mas com focos diferentes. O foco do Gensim é word2vec e do Glove é word embedings.

Mas se você não tem experiência com o tópico, sugiro que você comece com o NLTK.

...