Åtta bra böcker om språkteknologi (NLP) för alla nivåer

Språkteknologi (NLP) har fått en mer framträdande roll i närmandet mellan datakommunikation och mänsklig kommunikation i takt med att drivkraften för maskininlärning och artificiell intelligens accelererar. Det ökande intresset för NLP innebär fler onlineresurser, men ibland behövs det en bra bok för att verkligen komma in i ett så komplext och mångfacetterat ämne. De här böckerna kan bättra på din datakunskap rent allmänt och ger antingen en bra bakgrund och introduktion till NLP eller förtydligar viktiga teorier och exempel från det verkliga livet.

Här är åtta bra böcker som vidgar dina kunskaper och presenterar de möjligheter som språkteknologi (NLP) kan skapa för individen, företag och samhället i stort. Den passar alla kunskapsnivåer inom analys.

1. Speech and Language Processing

Författare: Daniel Jurafsky och James H. Martin
Webbplats: Webbplats | Amazon

En av de mest refererade och rekommenderade böckerna om språkteknologi (NLP). Boken, som är skriven av professor Dan Jurafsky vid Stanford University och professor James Martin vid University of Colorado, är en djupdykning i ämnet. Den är avsedd att användas på kurser på såväl grundnivå som avancerad nivå inom NLP eller datalingvistik. Den är dock ett måste för den som vill kasta sig in i teori och tillämpning av språkteknologi på sin väg mot bättre och starkare analytisk förmåga.

Det här är den andra upplagan och Jurafsky och Martin arbetar på en tredje med målet att bli klara senare i år. Visa ett utkast av Jurafsky på Stanfords webbsida.

2. Natural Language Understanding

Författare: James Allen
Webbplats: Författarens webbplats | Amazon

Den här boken är en annan introduktionsguide till NLP, och den anses vara en klassiker. Trots att den publicerades redan 1994 är den fortfarande mycket relevant i nutida diskussioner och analyser, och lovprisas av generationer av forskare och utbildare inom NLP. Här presenteras de viktigaste teknikerna och begreppen som krävs för att bygga NLP-system. Även bakgrunden och teorierna bakom presenteras utan att överväldiga läsaren med teknisk jargong.

3. Handbook of Natural Language Processing

Författare: Nitin Indurkhya och Fred J. Damerau
Webbplats: Amazon

Den moderna och omfattande Handbook of Natural Language Processing tillhandahåller verktyg och tekniker för att utveckla och implementera praktisk NLP i datorsystem. Boken består av tre avsnitt: klassiska tekniker (inklusive symboliska och empiriska metoder), statistiska metoder i NLP samt en mängd applikationer, från informationsvisualisering till ontologikonstruktion och biomedicinsk textutvinning.

I den andra upplagan är perspektivet flerspråkigt. Utöver engelska behandlas även europeiska och asiatiska språk och lägger större vikt vid statistiska metoder. Den innehåller även ett nytt avsnitt om tillämpning av NLP där nya områden som attitydanalys diskuteras. Boken är en bra inkörsport till tillämpning av NLP i datorsystem.

4. The Handbook of Computational Linguistics and Natural Language Processing

Författare: Alexander Clark, Chris Fox och Shalom Lappin
Webbplats: Amazon

I likhet med Handbook of Natural Language Processing innehåller den här boken också en översikt av begrepp, metodiker och tillämpningar inom NLP och språkteknologi som presenteras på ett lättillgängligt och lättförståeligt sätt. Den består av en introduktion till viktiga teoretiska problem och de centrala tekniska tillämpningar som arbete inom NLP har producerat för att driva ämnet framåt. Ledande forskare inom NLP har påvisat det nära sambandet mellan teorier och tillämpningar vilket visas här. Boken är en tillgång för språkteknologistudenter och ingenjörer som utvecklar NLP-tillämpningar i labb på programvaruföretag.

5. The Oxford Handbook of Computational Linguistics

Författare: Ruslan Mitkov
Webbplats: Amazon

Den här handboken beskriver viktiga begrepp, metoder och applikationer inom språkteknologi på ett sätt som nybörjare inom ämnet kan förstå. Beskrivningen på Amazon stämmer, den här boken innehåller det allra senaste inom ett av de mest aktiva och produktiva fälten inom lingvistik. Den är intressant och praktisk för en mängd lingvister och forskare inom olika fält som informatik, artificiell intelligens, datalingvistik och kognitionsvetenskap. Boken börjar med grunderna i lingvistik för att sedan ge en överblick över aktuella uppgifter, tekniker och verktyg inom språkteknologi, vilken riktar sig till mer erfarna forskare inom datalingvistik. Du kommer att ha nytta av den här boken, oavsett om du har disputerat eller inte är så insatt i ämnet.

6. Foundations of Statistical Natural Language Processing

Författare: Christopher Manning och Hinrich Schuetze
Webbplats: Webbplats | Amazon

Ännu en bok av lärare från Stanford, den här har Jurafskys kollega Christopher Manning skrivit. De undervisade på den populära introduktionskursen i NLP på Stanford. Mannings medförfattare är professor i datalingvistik på det tyska Ludwig-Maximilians-Universität.

Boken är en introduktion till statistiska metoder för NLP. Den lägger även en bra grund för att förstå nyare metoder inom NLP och bidra till utveckling av NLP-verktyg. Här finns grunderna i matematik och lingvistik samt statistiska metoder i lika grad på ett sätt som ger stöd till läsare som vill skapa språkteknologiska applikationer.

7. ”Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit

Författare: Steven Bird, Ewan Klein och Edward Loper
Webbplats: Webbplats | Amazon

Den här boken är en bra introduktion till NLP med fokus på programmering. Om du vill ha en praktisk källa på hyllan att vända dig till, oavsett om du är nybörjare inom NLP, språkteknologi eller AI-utvecklare, så innehåller Natural Langauge Procession with Python hundratals genomarbetade exempel och graderade övningar för att levandegöra NLP. Den kan användas till individuella studier, som kursbok för studier inom NLP eller datalingvistik, eller som komplement till kurser inom artificiell intelligens, textutvinning eller korpuslingvistik.

Nyfiken på programmeringsspråket Python? Boken är en genomgång av hur du skapar Python-program som analyserar ostrukturerad data som språk. Du rekommenderas ladda ner Python och the Natural Language Toolkit. På den kompletterande webbplatsen har författarna uppdaterat boken så att den kan användas med Python 3 och NLTK 3.

8. ”Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist’s Manual to Data Mining, Deep Learning & Natural Language Processing

Författare: Peter Ghavami
Webbplats: Amazon

Peters bok kanske kan verka avskräckande för nybörjare inom NLP, men den är användbar som handbok för de som redan är förtrogna med NLP och hur big data förhåller sig till dagens värld. Den fungerar även som en bra referens för data scientists, analytiker, företagschefer och de som arbetar med Business Intelligence. Vi tror att den kommer att bli en favorit bland erfarna analytiker med sina mer än hundra analystekniker och -metoder.

De olika kapitlen behandlar allt från maskininlärning till prediktiv modellering och klusteranalys. Bland de datavetenskapliga ämnen som behandlas finns datavisualisering, förutsägelser och regressionsanalys. Dessutom diskuteras NLP-relaterade områden som neurala nätverk, djupinlärning och artificiell intelligens. Alla ämnen förklaras generellt, men författaren går även mer i detalj in på terminologi och grunderna i matematik.


Ansvarsfriskrivning: Tableau ger inget officiellt stöd till några produkter, publikationer eller åsikter som listas i den här artikeln. Inte heller är några partnerprogram länkade till den här sidan. Den här artikeln är endast avsedd för utbildningsändamål och ovanstående information om produkter och publikationer har gjorts tillgänglig så att läsare kan fatta välgrundade beslut på egen hand.