Nu er steeds meer vraag komt naar Machine Learning en kunstmatige intelligentie, speelt natuurlijke-taalverwerking (Natural Language Processing, NLP) een belangrijker rol in het overbruggen van menselijke en computertaal. Door de toegenomen aandacht voor NLP zijn er meer online bronnen beschikbaar, maar soms is een goed boek nodig om een onderwerp dat zo complex en veelzijdig is, echt te doorgronden. Boeken kunnen je algemene datageletterdheid verhogen en fundamentele achtergrondinformatie bevatten, die lezers een goede inleiding in NLP geven, of belangrijke theorieën uitleggen (al dan niet aan de hand van een praktijkvoorbeeld).
Hier zijn acht goede boeken om meer kennis op te doen over en bekend te worden met de mogelijkheden die NLP creëert voor individuen, bedrijven en de samenleving. Geschikt voor alle analytische vaardigheidsniveaus.
1. Speech and Language Processing
Auteurs: Daniel Jurafsky en James H. Martin
Website: Site | Amazon
Dit is een van de meest gerefereerde en aanbevolen boeken over NLP, geschreven door Dan Jurafsky, professor aan Stanford University, en James Martin, professor aan de University of Colorado, en geeft een diepgaande handleiding over het onderwerp taalverwerking. Het is bedoeld voor bachelor- en masteropleidingen over NLP of computerlinguïstiek. Maar iedereen die in de theorie en toepassing van taalverwerking duikt, zou dit boek moeten lezen. Het vergroot en versterkt je analytische capaciteiten.
Dit is de tweede editie en Jurafsky en Martin verwachten de derde editie later dit jaar uit te brengen. Bekijk een voorbeeld op de Stanford-webpagina van Jurafsky.
2. Natural Language Understanding
Auteur: James Allen
Website: Website auteur | Amazon
Dit boek is ook een inleidende gids voor NLP en wordt als een klassieker beschouwd. Hoewel het in 1994 al is verschenen, is het bijzonder relevant voor de discussies en analyse-activiteiten van nu. Het boek wordt door verschillende generaties NLP-onderzoekers en -opleiders geprezen. Er worden belangrijke technieken en concepten in geïntroduceerd die nodig zijn voor het bouwen van NLP-systemen en het gaat in op de achtergrond en theorie ervan zonder lezers te overweldigen met technisch jargon.
3. Handbook of Natural Language Processing
Auteurs: Nitin Indurkhya en Fred J. Damerau
Website: Amazon
Dit uitgebreide en moderne 'Handbook of Natural Language Processing' biedt tools en technieken voor het ontwikkelen en implementeren van praktische NLP in computersystemen. Het boek bestaat uit drie delen: klassieke technieken (inclusief symbolische en empirische benaderingen), statistische benaderingen van NLP en verschillende toepassingen, van informatievisualisatie tot ontologiebouw en biomedische textmining.
De tweede editie is gericht op meerdere talen en wordt niet alleen in het Engels aangeboden, maar ook in Europese en Aziatische talen. Er ligt ook een grotere nadruk op statistische benaderingen. Daarnaast bevat het een gedeelte over nieuwe toepassingen waarin opkomende gebieden worden behandeld, zoals sentimentanalyse. Dit is een goed beginpunt om te leren hoe NLP toegepast kan worden op computersystemen.
4. The Handbook of Computational Linguistics and Natural Language Processing
Auteurs: Alexander Clark, Chris Fox en Shalom Lappin
Website: Amazon
Dit boek bevat, net als het 'Handbook of Natural Language Processing', een overzicht van concepten, methoden en applicaties van NLP en computerlinguïstiek, gepresenteerd op een toegankelijke en eenvoudig te begrijpen manier. Er wordt een inleiding gegeven in de belangrijkste theoretische problemen en de centrale engineeringstoepassingen van NLP waarmee de discipline is bevorderd. Theorie en praktijk worden beiden gebruikt om de relatie in taalonderzoek te duiden zoals die gezien wordt door de beste NLP-onderzoekers. Het is een goede hulpbron voor NLP-studenten en engineers die NLP-applicaties ontwikkelen voor softwarebedrijven.
5. The Oxford Handbook of Computational Linguistics
Auteur: Ruslan Mitkov
Website: Amazon
Dit handboek beschrijft de belangrijkste concepten, methoden en toepassingen van computerlinguïstiek, op een manier die begrijpelijk is voor leken en bachelorstudenten. Zoals beschreven op Amazon is het een moderne referentie aan een van de actiefste en productiefste gebieden binnen de linguïstiek. Het is interessant voor linguïsten en onderzoekers van elk kaliber op het gebied van informatica, kunstmatige intelligentie, taalengineering en cognitieve wetenschappen. Het begint met linguïstische grondbeginselen, gevolgd door een overzicht van huidige taken, technieken en programma's voor natuurlijke-taalverwerking, en is gericht op ervaren onderzoekers in de computerlinguïstiek. Dit is een nuttig boek, zowel voor leken als voor postdoctoraal medewerkers.
6. Foundations of Statistical Natural Language Processing
Auteurs: Christopher Manning en Hinrich Schuetze
Website: Site | Amazon
Nog een boek uit handen van docenten op Stanford. Dit boek is geschreven door Jurafsky's collega Christopher Manning. Zij gaven de populaire inleidende cursus NLP op Stanford. De co-auteur van Manning is een professor computerlinguïstiek aan de Duitse Ludwig-Maximilians-Universität.
Het boek geeft een inleiding in statistische methoden voor NLP en een degelijke basis om nieuwe NLP-methodes te begrijpen en de ontwikkeling van NLP-programma's te ondersteunen. Wiskundige en taalkundige basiskennis, evenals statistische methoden, worden evenredig gepresenteerd, op een manier die lezers helpt bij het creëren van applicaties voor taalverwerking.
7. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit
Auteurs: Steven Bird, Ewan Klein en Edward Loper
Website: Site | Amazon
Dit boek is een handige inleiding op het gebied van NLP, gericht op programmeren. Voor degenen die op zoek zijn naar een handige hulpbron voor op boekenplank of bureau, of je nu net begint met NLP, een computerlinguïst of een AI-ontwikkelaar bent. Het boek bevat honderden volledig uitgewerkte voorbeelden en verschillende soorten oefeningen die een goed beeld geven van NLP. Het kan gebruikt worden voor individuele studie, als cursusboek voor een studie NLP of computerlinguïstiek of ter aanvulling van een cursus kunstmatige intelligentie, textmining of corpuslinguïstiek.
Nieuwsgierig naar de programmeertaal Python? Het begeleidt je bij het creëren van Python-programma's die ongestructureerde data (zoals taal) parseren en beveelt je aan Python en de Natural Language Toolkit te downloaden. Op een bijbehorende website hebben de auteurs zelfs het boek geüpload voor het werken met Python 3 en NLTK 3.
8. Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist's Manual to Data Mining, Deep Learning & Natural Language Processing
Auteur: Peter Ghavami
Website: Amazon
Peters boek lijkt misschien een hele kluif voor een beginneling op het gebied van NLP, maar het is een handige, uitgebreide handleiding voor degenen die bekend zijn met NLP en hoe big data vandaag de dag wordt gebruikt. Het is ook een handig naslagwerk voor datawetenschappers, analisten, bedrijfsmanagers en business-intelligenceprofessionals. Dit boek bevat meer dan honderd analysetechnieken en -methoden, waardoor we verwachten dat dit een favoriet zal zijn onder ervaren analisten.
De hoofdstukken behandelen alles, van Machine Learning tot predictive modeling en clusteranalyse. Datawetenschappelijke onderwerpen, waaronder datavisualisatie, voorspelling, regressieanalyse en NLP-gerelateerde onderwerpen zoals neurale netwerken, deep learning en kunstmatige intelligentie, worden ook besproken. Ze worden uitgebreid uitgelegd, maar Peter gaat ook dieper in op de terminologie en onderliggende wiskunde.
Disclaimer: Tableau ondersteunt de producten en publicaties die op deze website genoemd worden en de meningen die daarin vermeld worden niet, en als zodanig is deze pagina niet betrokken bij partnerprogramma's. Dit artikel is uitsluitend bedoeld voor educatieve doeleinden en de bovenstaande informatie over producten en publicaties wordt ter beschikking gesteld zodat lezers zelf weloverwogen beslissingen kunnen nemen.