Com o crescimento acelerado do aprendizado de máquina e da inteligência artificial, o processamento de linguagem natural (PLN) assume um papel mais importante na tarefa de facilitar a comunicação entre humanos e computadores. Com o PLN cada vez mais em evidência, o número de recursos disponíveis on-line só aumenta. Porém, às vezes, um bom livro é necessário para se familiarizar com esse tema tão complexo e variado. Os livros podem reforçar seus conhecimentos de dados e contextualizar o tema, oferecendo aos leitores uma ótima introdução ao PLN, além de esclarecer as principais teorias e exemplos práticos.
Recomendamos a seguir oito livros excelentes para ampliar seus conhecimentos e ajudar você a se familiarizar com as oportunidades que o PLN traz para pessoas, empresas e para a sociedade em geral. Esta lista traz livros para todos os níveis de conhecimentos de análise.
1. “Speech and Language Processing” (Processamento de fala e linguagem)
Autores: Daniel Jurafsky e James H. Martin
Site: Site | Amazon
Este livro sobre PLN, que está entre os mais citados e recomendados, foi escrito pelo professor da Universidade Stanford, Dan Jurafsky, e pelo professor da Universidade do Colorado, James Martin. Ele traz um guia aprofundado sobre o tema do processamento de linguagem. O livro tem o objetivo de ser uma referência para alunos de cursos avançados de graduação e pós-graduação em PLN ou linguística computacional. No entanto, é uma leitura obrigatória para qualquer um que esteja estudando a teoria e a aplicação do processamento de linguagem para expandir e fortalecer seus conhecimentos analíticos.
O livro está em sua segunda edição, e Jurafsky e Martin estão trabalhando na terceira, que deve ser finalizada ainda este ano. Confira um rascunho na página da Web de Jurafsky.
2. “Natural Language Understanding” (Compreensão da linguagem natural)
Autor: James Allen
Site: Site do autor | Amazon
Este livro é outro guia introdutório ao PLN e é considerado um clássico. Apesar de ter sido publicado em 1994, ele é altamente relevante às discussões e atividades analíticas de hoje, além de ser aclamado por gerações de pesquisadores e professores de PLN. Ele apresenta os principais conceitos e técnicas necessários para criar sistemas de PLN, além de abordar a história e a teoria de cada um sem sobrecarregar os leitores com jargão técnico.
3. “Handbook of Natural Language Processing” (Manual de processamento de linguagem natural)
Autores: Nitin Indurkhya e Fred J. Damerau
Site: Amazon
Moderno e completo, “Handbook of Natural Language Processing” oferece ferramentas e técnicas para desenvolver e implementar o PLN prático em sistemas de computador. O livro tem três seções: técnicas clássicas (incluindo abordagens simbólicas e empíricas), abordagens estatísticas de PLN e várias aplicações, como visualização de informações, construção de ontologia, mineração de textos de biomedicina e muitas outras.
A segunda edição tem um escopo multilíngue, incluindo línguas europeias e asiáticas além do inglês, e há uma ênfase maior em abordagens estatísticas. Além disso, ela traz uma nova seção sobre novas aplicações que aborda áreas emergentes, como a análise de sentimento. Trata-se de um ótimo ponto de partida para aprender a aplicar o PLN a sistemas de computador.
4. “The Handbook of Computational Linguistics and Natural Language Processing” (Manual de linguística computacional e processamento de linguagem natural)
Autores: Alexander Clark, Chris Fox e Shalom Lappin
Site: Amazon
Semelhante ao “Handbook of Natural Language Processing”, este livro traz uma visão geral dos conceitos, metodologias e aplicações do PLN e da linguística computacional, que são apresentados em uma linguagem acessível e de fácil compreensão. Ele oferece uma introdução às principais questões teóricas e a importantes aplicações em engenharia produzidas pelos trabalhos de PLN para impulsionar o avanço da disciplina. As teorias e aplicações andam de mãos dadas para mostrar sua relação nas pesquisas em linguagem, conforme observam proeminentes pesquisadores de PLN. Trata-se de um excelente recurso para estudantes de PLN e engenheiros que desenvolvem aplicações de PLN em laboratórios e empresas de software.
5. “The Oxford Handbook of Computational Linguistics” (Manual de linguística computacional de Oxford)
Autor: Ruslan Mitkov
Site: Amazon
Este manual descreve os principais conceitos, métodos e aplicações da linguística computacional de uma forma que estudantes de graduação e não especialistas podem compreender. Como descrito na Amazon, é uma referência de última geração para um dos campos mais ativos e produtivos da linguística. Uma ampla gama de linguistas e pesquisadores de áreas como informática, inteligência artificial, engenharia de linguagem e ciência cognitiva achará este livro interessante e prático. Ele começa apresentando fundamentos linguísticos, seguidos por uma visão geral de tarefas, técnicas e ferramentas atuais do processamento de linguagem natural de particular interesse para pesquisadores de linguagem computacional mais experientes. Seja para profissionais com pós-doutorado ou para não especialistas, este livro é extremamente útil.
6. “Foundations of Statistical Natural Language Processing” (Fundamentos do processamento de linguagem natural em estatística)
Autores: Christopher Manning e Hinrich Schuetze
Site: Site | Amazon
Outra obra de educadores de Stanford, este livro foi escrito pelo colega de Jurafsky, Christopher Manning. Ambos já lecionaram o popular curso de introdução ao PLN em Stanford. O coautor do livro e colega de Manning é um professor de linguística computacional da Universidade de Munique.
O livro oferece uma introdução a métodos estatísticos para PLN, bem como uma base sólida para aprender novos métodos de PLN e viabilizar a criação de novas ferramentas de PLN. Tanto fundamentos matemáticos e linguísticos como métodos estatísticos são abordados de uma forma que ajuda os leitores a desenvolver aplicações de processamento de linguagem.
7. “Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit” (Processamento de linguagem natural com Python: analisando textos com o Kit de ferramentas de linguagem natural)
Autores: Steven Bird, Ewan Klein e Edward Loper
Site: Site | Amazon
Este livro é uma introdução útil ao campo de PLN com um foco em programação. Se você deseja ter uma fonte de referência prática em sua prateleira ou mesa, independentemente de ser um iniciante em PLN, um linguista computacional ou um desenvolvedor de IA, o livro traz centenas de exemplos com explicações completas e exercícios progressivos que dão vida ao PLN. Ele pode ser usado para estudo individual, como um livro didático ao estudar PLN ou linguística computacional, ou como um complemento para cursos de inteligência artificial, mineração de textos ou linguística de corpus.
Tem interesse na linguagem de programação Python? O livro explica como criar programas em Python que analisam dados desestruturados como se fossem linguagem e recomenda o download da linguagem Python e do Kit de ferramentas de linguagem natural (NLTK, Natural Language Toolkit). Em um site complementar, os autores atualizaram o livro para funcionar com o Python 3 e o NLTK 3.
8. “Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist’s Manual to Data Mining, Deep Learning & Natural Language Processing” (Métodos de análise de Big Data: técnicas de análise modernas para o século XXI: o manual do cientista de dados sobre mineração de dados, aprendizagem profunda e processamento de linguagem natural)
Autor: Peter Ghavami
Site: Amazon
O livro de Peter pode parecer denso para um iniciante em PLN, mas é ideal como um manual abrangente para quem já está familiarizado com as relações entre o PLN e o Big Data no mundo de hoje. Ele também serve como uma referência útil para cientistas de dados, analistas, gerentes comerciais e profissionais de business intelligence. Com mais de cem técnicas de análise e métodos incluídos, temos certeza de que profissionais de análise experientes adorarão este livro.
Os capítulos tratam sobre os mais variados temas, incluindo aprendizado de máquina, modelagem preditiva, análise de cluster e muito mais. O livro também aborda tópicos de ciência de dados como visualização de dados, previsão e análise de regressão, além de campos relacionados ao PLN, como redes neurais, aprendizagem profunda e inteligência artificial. Esses temas são explicados em linhas gerais, mas Peter também entra em mais detalhes sobre terminologias e fundamentos matemáticos.
Isenção de responsabilidade: A Tableau não endossa oficialmente qualquer produto, publicação ou opinião mencionada nesta página da Web. Consequentemente, esta página não tem associação com programas de links afiliados. Este artigo foi criado exclusivamente para fins educacionais, e as informações apresentadas sobre produtos e publicações são disponibilizadas para que os leitores possam tomar decisões embasadas por conta própria.