Huit ouvrages exceptionnels sur le traitement du langage naturel pour tous les niveaux

Avec l'accélération du machine learning et de l'intelligence artificielle, le traitement du langage naturel joue un rôle de plus en plus important pour faciliter la communication entre les systèmes informatiques et les utilisateurs. Au vu de l'attention suscitée par cette technologie, on trouve aujourd'hui un plus grand nombre de ressources en ligne. Néanmoins, pour un sujet aussi complexe et diversifié, un bon livre est parfois essentiel pour acquérir des bases solides. Les livres vous aident à développer votre datalphabétisation au sens large et contiennent des informations fondamentales sur le traitement du langage naturel, ses grandes théories ainsi que des exemples concrets.

Voici huit ouvrages exceptionnels (en anglais) pour élargir vos connaissances et vous familiariser avec le potentiel du langage naturel pour les utilisateurs, les entreprises et la société en général. Ils conviennent à tous les niveaux de compétence analytique.

1. « Speech and Language Processing »

Auteurs : Daniel Jurafsky et James H. Martin
Site Web : Site | Amazon

Ce livre, rédigé par le professeur Dan Jurafsky de l'Université de Stanford et le professeur James Martin de l'Université du Colorado, est l'un des ouvrages les plus cités et les plus recommandés en matière de traitement du langage. Il propose un guide détaillé sur le sujet. Il accompagne les cours universitaires de premier ou de deuxième cycle portant sur le traitement du langage naturel ou sur la linguistique informatique. Il s'agit toutefois d'un ouvrage indispensable pour tous ceux qui s'intéressent à la théorie et à la pratique du traitement du langage et veulent développer et consolider leurs compétences analytiques.

C'est la deuxième édition de cet ouvrage. Une troisième édition est en cours de préparation et devrait être prête dans l'année. Vous pouvez en consulter une ébauche (en anglais) sur la page Web de Daniel Jurafsky.

2. « Natural Language Understanding »

Auteur : James Allen
Site Web : Site de l'auteur | Amazon

Voici une autre introduction au traitement du langage naturel, considérée comme une référence. Bien que ce livre date de 1994, il n'a pas perdu sa pertinence face aux débats et aux activités analytiques d'aujourd'hui. Il est acclamé par des générations de chercheurs et d'enseignants dans cette discipline. Il explique les techniques et les concepts majeurs nécessaires pour développer des systèmes de traitement du langage naturel, et il réussit à présenter leurs contextes et théories sans noyer les lecteurs avec un jargon technique.

3. « Handbook of Natural Language Processing »

Auteurs : Nitin Indurkhya et Fred J. Damerau
Site Web : Amazon

Ce guide sur le traitement du langage naturel est à la fois complet et moderne. Il propose des outils et des techniques pour développer cette technologie et l'appliquer de façon pratique aux systèmes informatiques. Le livre est divisé en trois sections : les techniques classiques (avec des approches symboliques et empiriques), les approches statistiques pour le traitement du langage naturel et, enfin, ses applications variées (visualisation des informations, construction ontologique, exploration de texte biomédical, etc.).

La deuxième édition adopte une perspective multilingue, avec l'inclusion de certaines langues européennes et asiatiques en plus de l'anglais. L'accent y est davantage mis sur les approches statistiques. En outre, elle contient une nouvelle section sur des applications dans des domaines émergents tels que l'analyse des sentiments. Il s'agit d'un bon point de départ pour découvrir comment appliquer le traitement du langage naturel aux systèmes informatiques.

4. « The Handbook of Computational Linguistics and Natural Language Processing »

Auteurs : Alexander Clark, Chris Fox et Shalom Lappin
Site Web : Amazon

À l'instar du guide précédent (« Handbook of Natural Language Processing »), cet ouvrage accessible et facile à comprendre présente les concepts, les méthodologies et les applications du traitement du langage naturel et de la linguistique informatique. Il évoque les problématiques théoriques majeures de la discipline, ainsi que les applications industrielles qui jouent un rôle clé dans son développement. Il associe théorie et pratique pour illustrer la relation entre ces deux aspects au sein de la recherche linguistique, comme le soulignent les plus grands chercheurs dans le domaine du traitement du langage naturel. Cet ouvrage constitue une excellente ressource tant pour les étudiants que pour les ingénieurs qui développent des applications de traitement du langage naturel pour des éditeurs de logiciels.

5. « The Oxford Handbook of Computational Linguistics »

Auteur : Ruslan Mitkov
Site Web : Amazon

Ce guide met les principaux concepts, méthodes et applications de la linguistique informatique à la portée des étudiants de premier cycle et des débutants. Comme l'indique Amazon, il s'agit d'un ouvrage de référence dans l'un des domaines les plus dynamiques et productifs de la linguistique. De nombreux linguistes et chercheurs de disciplines variées (informatique, intelligence artificielle, ingénierie du langage, sciences cognitives, etc.) le trouveront intéressant et pratique. Cet ouvrage commence avec une présentation des notions linguistiques de base. Il offre ensuite une vue d'ensemble destinée aux spécialistes de la linguistique informatique sur les tâches, les techniques et les outils actuels pour le traitement du langage naturel. Que vous soyez novice ou expérimenté, ce livre vous sera forcément utile.

6. « Foundations of Statistical Natural Language Processing »

Auteurs : Christopher Manning et Hinrich Schuetze
Site Web : Site | Amazon

Ce livre est l'œuvre d'un autre professeur de l'Université de Stanford, Christopher Manning, collègue de Daniel Jurafsky. Tous deux ont enseigné un cours d'introduction populaire sur le traitement du langage naturel à l'Université de Stanford. Cet ouvrage est le fruit de la collaboration de Christopher Manning avec Hinrich Schuetze, professeur en linguistique informatique de l'université Ludwig-Maximilians-Universität en Allemagne.

Il présente différentes méthodes statistiques et offre une base solide pour acquérir de nouvelles méthodes et accompagner la création d'outils de traitement du langage naturel. Il évoque également des notions mathématiques et linguistiques de base, en plus des méthodes statistiques, pour aider les lecteurs à créer des applications de traitement du langage.

7. « Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit »

Auteurs : Steven Bird, Ewan Klein et Edward Loper
Site Web : Site | Amazon

Cet ouvrage est une excellente initiation au traitement du langage naturel du point de vue de la programmation. Que vous soyez novice, expert de la linguistique informatique ou développeur spécialisé dans l'IA, les centaines d'exemples complets et d'exercices concrets graduels que cet ouvrage propose sont parfaits si vous avez besoin d'un manuel pratique. Il peut être utilisé individuellement, pour accompagner un cours sur le traitement du langage naturel ou la linguistique informatique, ou en complément d'un programme d'étude sur l'intelligence artificielle, le text mining ou la linguistique.

Le langage de programmation Python vous intéresse ? Cet ouvrage vous explique comment créer des programmes Python pour analyser des données non structurées telles que des données linguistiques, et vous recommande de télécharger Python et Natural Language Toolkit. Les auteurs offrent une version du livre compatible avec Python 3 et NLTK 3 sur un site associé.

8. « Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist's Manual to Data Mining, Deep Learning & Natural Language Processing »

Auteur : Peter Ghavami
Site Web : Amazon

L'ouvrage de Peter Ghavami peut certes sembler intimidant si vous débutez. Néanmoins, c'est un manuel complet utile si vous connaissez déjà le traitement du langage naturel et le lien existant entre le Big Data et le monde moderne. C'est également un ouvrage de référence pour les data scientists, les analystes, les responsables d'entreprise et les utilisateurs BI. Avec plus d'une centaine de techniques et de méthodes analytiques à la clé, il deviendra très certainement le livre de chevet des pros de l'analytique.

Ses chapitres couvrent tous les sujets, du machine learning à la modélisation prédictive, sans oublier l'analyse de clusters. Il aborde également des thèmes liés à la data science, avec notamment la visualisation des données, les prédictions et l'analyse de régression, ainsi que des domaines liés au traitement du langage naturel, tels que les réseaux neuronaux, le deep learning et l'intelligence artificielle. En plus d'une explication générale, l'auteur propose également une terminologie et des bases mathématiques plus détaillées.


Avis de non-responsabilité : Tableau ne soutient pas les produits et publications présentés, ni les opinions formulées. De ce fait, cette page ne fait partie d'aucun programme d'affiliation. Le présent article est proposé dans un objectif pédagogique, et les informations sur les produits et les publications sont fournies pour aider les utilisateurs à prendre des décisions en connaissance de cause.