On ne peut pas dire que nous réfléchissions souvent aux subtilités de notre propre langue. Il s'agit d'un comportement intuitif qui se base sur des indices sémantiques tels que des mots, des signes ou des images pour transmettre des informations et du sens. On dit parfois que l'apprentissage d'une langue est plus facile à l'adolescence parce que c'est un comportement réitérable qui peut être inculqué, un peu comme la marche. De plus, les langues ne suivent pas de règles strictes et comportent de nombreuses exceptions.
L'acquisition du langage, si naturelle pour les humains, est extrêmement complexe pour les ordinateurs, car elle s'accompagne d'un grand nombre de données non structurées, d'un manque de règles strictes et d'une absence de perspective ou de contexte concret. Or, les hommes s'appuient de plus en plus sur les systèmes informatiques pour communiquer et effectuer des tâches. C'est pourquoi le machine learning et l'intelligence artificielle (IA) attirent l'attention et connaissent un tel engouement. Le traitement du langage naturel suit le développement de l'IA. Bien que ces deux termes puissent nous évoquer des robots futuristes, il existe déjà des cas simples d'application du traitement du langage naturel au quotidien. En voici quelques exemples fondamentaux.
Filtres de messagerie
Les filtres de messagerie sont l'une des premières applications de base du traitement du langage naturel en ligne. Cette technique a d'abord été utilisée pour créer des filtres anti-spam, afin d'identifier des messages indésirables sur la base de certains mots ou expressions. Les filtres ont ensuite progressé au fil de l'évolution du traitement du langage naturel.
L'une des applications les plus courantes et les plus récentes de cette technique est la classification des e-mails par Gmail. Ce système est capable de classer un e-mail parmi trois catégories (Principale, Réseaux sociaux ou Promotions) en fonction de son contenu. Il permet ainsi aux utilisateurs de Gmail de mieux gérer leur boîte de réception, afin de consulter et de répondre à leurs e-mails importants rapidement.
Assistants intelligents
Les assistants intelligents tels que Siri (Apple) et Alexa (Amazon) se servent de la reconnaissance vocale pour identifier des schémas vocaux, en déduire un sens et proposer une réponse utile. Il nous semble aujourd'hui normal de poser une question à Siri, qu'elle nous comprenne et qu'elle nous réponde de façon pertinente en fonction du contexte. De même, nous nous habituons à échanger avec Siri ou Alexa chez nous au quotidien, par le biais de notre thermostat, de nos luminaires, de notre voiture, etc.
Nous attendons maintenant d'assistants tels qu'Alexa et Siri qu'ils saisissent les indices contextuels pour nous aider au quotidien, ainsi que pour effectuer certaines tâches (par exemple commander des articles). Nous apprécions même leurs réponses amusantes ou lorsqu'ils nous parlent d'eux. Nos interactions deviennent plus personnelles à mesure qu'ils apprennent à nous connaître. Selon l'article du New York Times « Why We May Soon Be Living in Alexa's World » (en anglais) : « Un changement important s'annonce. Alexa deviendra très probablement la troisième plate-forme grand public majeure de cette décennie. »
Résultats de recherche
Les moteurs de recherche utilisent le traitement du langage naturel pour afficher des résultats pertinents, en se basant sur des comportements de recherche similaires ou sur l'intention de l'utilisateur. Chacun peut ainsi trouver ce dont il a besoin, sans avoir de compétence particulière.
Par exemple, lorsque vous commencez à saisir une requête, non seulement Google vous propose des recherches populaires associées, mais il peut également reconnaître le sens général de votre demande au-delà de sa formulation exacte. Si vous saisissez un numéro de vol dans Google, vous en connaîtrez le statut. Si vous saisissez un symbole boursier, vous obtiendrez un compte-rendu des actions. Si vous saisissez une équation mathématique, une calculatrice s'affichera. Votre recherche peut offrir des résultats variés parce que la technique de traitement du langage naturel qu'elle utilise associe une requête ambiguë à une entité donnée afin d'offrir des résultats utiles.
Saisie intuitive
La présence de fonctions telles que la correction automatique, la saisie automatique et la saisie intuitive est aujourd'hui tellement courante sur nos smartphones que nous la tenons pour acquise. La saisie automatique et la saisie intuitive sont comparables aux moteurs de recherche dans la mesure où elles se basent sur ce qui est saisi pour proposer la fin d'un mot ou une suggestion. La correction automatique change parfois même certains mots pour améliorer le sens général de votre message.
En outre, ces fonctions évoluent à votre contact. La saisie intuitive s'adapte au fil du temps à vos tournures de phrase spécifiques. Cela donne parfois lieu à des échanges de messages drôles, avec des phrases entièrement basées sur la saisie intuitive. Le résultat peut être étonnamment personnel et instructif, et attire même l'attention de certains médias.
Traduction
Si votre exercice d'espagnol est bourré de fautes de grammaire, votre enseignant saura que vous avez triché ! De nombreuses langues ne se prêtent pas à une traduction directe car elles présentent des constructions de phrases différentes, un fait autrefois négligé par les services de traduction. Ces systèmes ont toutefois beaucoup évolué.
Grâce au traitement du langage naturel, les outils de traduction en ligne offrent des traductions plus précises et correctes d'un point de vue grammatical. Ils sont extrêmement utiles si vous avez besoin de communiquer avec une personne qui ne parle pas votre langue. Par ailleurs, si vous désirez traduire un texte étranger, ces outils sont désormais capables de reconnaître la langue du texte saisi pour le traduire.
Appels téléphoniques numériques
Nous avons tous déjà entendu une annonce de type « cet appel peut être enregistré à des fins de formation » sans forcément savoir ce que cela implique. Ces enregistrements peuvent certes être utilisés à des fins de formation (par exemple dans le cas d'un échange avec un client mécontent), mais ils sont généralement conservés dans une base de données qui permet ensuite à un système de traitement du langage naturel d'apprendre et de progresser. Les systèmes automatisés redirigent les appels des clients vers un agent ou un chatbot en ligne, qui fournira des informations pertinentes pour répondre à leurs demandes. Cette technique de traitement du langage naturel est déjà utilisée par de nombreuses entreprises, notamment des opérateurs téléphoniques majeurs.
Elle permet également à un ordinateur d'imiter la voix humaine. Il est ainsi possible de prévoir des appels téléphoniques automatisés pour prendre un rendez-vous au garage ou chez le coiffeur, comme en témoigne cette vidéo (en anglais) au cours de laquelle l'Assistant Google appelle un salon de coiffure pour prendre un rendez-vous.
Analyse de données
Les fonctionnalités du langage naturel sont aujourd'hui intégrées aux workflows analytiques. En effet, de plus en plus de fournisseurs de BI proposent une interface en langage naturel pour leurs visualisations de données. Un codage visuel plus intelligent permet par exemple de proposer la meilleure visualisation possible pour une tâche spécifique, en fonction de la sémantique des données. Chacun peut ainsi explorer les données à l'aide d'énoncés en langage naturel ou de fragments de questions dont les mots-clés sont interprétés et compris.
L'exploration des données à l'aide du langage permet non seulement de rendre les données plus accessibles, mais elle ouvre également l'analytique à toute l'entreprise, au-delà du cercle habituel des analystes et développeurs informatiques.
Pour en savoir plus sur la façon dont le langage naturel peut vous aider à mieux visualiser et explorer vos données, consultez ce webinaire (en anglais).
Analyse de textes
L'analyse de textes permet de convertir des données textuelles non structurées en données analysables à l'aide de différentes techniques linguistiques, statistiques et de machine learning.
L'analyse des sentiments peut sembler un défi de taille pour les marques (surtout dans le cas d'une clientèle volumineuse). Cependant, un outil basé sur le traitement du langage naturel permet généralement d'examiner les interactions client (telles que les commentaires ou les avis sur les médias sociaux, voire les mentions de noms de marque), pour en connaître la teneur. Les marques peuvent analyser ces interactions pour évaluer l'efficacité de leur campagne marketing ou surveiller l'évolution des problèmes rencontrés par les clients. Elles peuvent ensuite décider comment réagir ou améliorer leur service pour proposer une meilleure expérience.
Le traitement du langage naturel contribue également à l'analyse de textes car il permet d'extraire des mots clés et d'identifier des structures ou des tendances au sein de données textuelles non structurées.
Le traitement du langage naturel est déjà bien présent dans le monde numérique. Ses applications se multiplieront au fur et à mesure que les entreprises et les secteurs d'activité en découvriront les avantages et l'adopteront. L'intervention humaine restera certes essentielle en cas de problèmes de communication plus complexes, mais le traitement du langage naturel sera notre allié au quotidien, avec la gestion et l'automatisation de tâches mineures pour commencer, puis de plus en plus complexes au fil des progrès technologiques.