隨著機器學習和人工智慧的動能加速,自然語言處理 (NLP) 在接合電腦和人類交流中扮演更重要的角色。NLP 愈來愈引發關注,這表示可以使用更多的線上資源,不過有時需要一本優良書籍才能對於這個複雜而又多面的主題紮根。書籍可以提高您的整體資料素養,並提供基本的背景知識,進而為讀者提供 NLP 的入門知識或藉由主要理論和實際範例予以釐清。
本文推薦 8 本優良書籍,可以擴展您的知識並熟悉 NLP 為個人、企業和社會創造的機會。這能夠滿足所有分析技能程度。
1.《Speech and Language Processing》
作者:Daniel Jurafsky 和 James H. Martin
網站:網站 | Amazon
由史丹佛大學教授 Dan Jurafsky 和科羅拉多大學教授 James Martin 撰寫,是最廣泛引用和推薦的 NLP 書籍之一,提供有關語言處理主題的深入指南。這適合與 NLP 或計算語言學的大學或高級研究生課程一起提供。不過,這是在開發和增強分析功能時深入研究語言處理理論和應用的任何人必讀的書籍。
這是第二版,Jurafsky 和 Martin 正在編輯第三版,計劃於今年稍晚時完成。造訪 Jurafsky 的史丹佛網頁檢視草稿。
2.《Natural Language Understanding》
作者:James Allen
網站:作者網站 | Amazon
本書是 NLP 的另一本入門指南,被視為經典著作。這本書於 1994 年出版,不過與現今的討論和分析活動高度相關,並獲得 NLP 研究人員和教育工作者讚譽。這其中介紹建構 NLP 系統所需的主要技術和概念,並深入介紹每種技術的背景和理論,而且完全不會造成讀者接觸大量的技術術語。
3.《Handbook of Natural Language Processing》
作者:Nitin Indurkhya 和 Fred J. Damerau
網站:Amazon
這本全面性的現代《Handbook of Natural Language Processing》提供在電腦系統中開發和運用實用 NLP 的工具和技術。這本書分為三個部分:經典技術 (包括符號方法和經驗方法)、NLP 中的統計方法,以及多種應用,從資訊視覺化到本體構造和生物醫學文字探勘。
第二版涵蓋多種語言,除了英語之外,也包含歐洲和亞洲語言,而且更強調統計方法。此外,其中有新的應用部分,討論情感分析之類的新興領域。這是學習如何將 NLP 應用於電腦系統的好開端。
4.《The Handbook of Computational Linguistics and Natural Language Processing》
作者:Alexander Clark、Chris Fox 和 Shalom Lappin
網站:Amazon
與《Handbook of Natural Language Processing》相似,這本書概述 NLP 和計算語言學中的概念、方法和應用,並以容易瞭解的方式進行介紹。這其中介紹 NLP 為推動該學科進展而產生的主要理論問題和中央工程應用。正如 NLP 頂級研究人員所指出的,理論和應用共同呈現語言研究中的關係。對於 NLP 學生以及在軟體公司的實驗室中開發 NLP 應用程式的工程師而言,這是很好的資源。
5.《The Oxford Handbook of Computational Linguistics》
作者:Ruslan Mitkov
網站:Amazon
本書以大學生和非專業人士可以瞭解的方式描述計算語言學的主要概念、方法和應用。如 Amazon 網站所述,這是對語言學中最活躍且最有生產力的其中一個領域提供的最新參考。資訊學、人工智慧、語言工程和認知科學等領域的眾多語言學家和研究人員會覺得這本書有趣又實用。這本書從語言學基礎開始,然後概述自然語言處理的目前任務、技術和工具,相當適合資深的計算語言研究人員。無論您是非專家還是博士後工作人員,這本書都相當實用。
6.《Foundations of Statistical Natural Language Processing》
作者:Christopher Manning 和 Hinrich Schuetze
網站:網站 | Amazon
這是另一本由史丹佛大學教育工作者撰寫的書,作者是 Jurafsky 的同事 Christopher Manning。這些人在史丹佛大學教授頗受歡迎的 NLP 入門課程。Manning 的共同作者是德國慕尼黑大學的計算語言學教授。
這本書介紹 NLP 的統計方法,並為瞭解新 NLP 方法和支援 NLP 工具的建立奠定良好的基礎。數學和語言基礎,再加上統計方法,均以支援讀者建立語言處理應用的方式來表示。
7.《Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit》
作者:Steven Bird、Ewan Klein 和 Edward Loper
網站:網站 | Amazon
本書是 NLP 領域的實用介紹,重點是程式設計。如果您想在書架或辦公桌上找到實用的資源,無論您是 NLP 的初學者、電腦語言學家還是 AI 開發人員,這本書都包含數百個功能齊全的範例和分級練習,使得 NLP 貼近現實需求。這本書可以用於個人學習,也可以做為學習 NLP 或計算語言學的課程教科書,或與人工智慧、文字探勘或語料庫語言學課程相配合。
是否對 Python 程式語言感到好奇?這將引導您建立用於解析非結構化資料 (例如語言) 的 Python 程式,並建議下載 Python 和自然語言工具箱。在輔助網站上,作者實際上已經對這本書進行更新,適用於 Python 3 和 NLTK 3。
8.《Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist’s Manual to Data Mining, Deep Learning & Natural Language Processing》
作者:Peter Ghavami
網站:Amazon
Peter 的書對於 NLP 的新手而言似乎令人生畏,不過這對於熟悉 NLP 以及現今大數據關聯性的人而言,這是一本全面性的實用手冊。這也為資料科學家、分析師、業務經理和商業智慧從業人員提供實用的參考。由於包含一百多種分析技術和方法,因此我們認為這將是經驗豐富的分析從業人員最愛的書籍。
本章涵蓋從機器學習到預測建模和叢集分析的所有內容。另外也討論資料科學主題,包括資料視覺化、預測和迴歸分析,以及與 NLP 相關的領域,例如神經網路、深度學習和人工智慧。這些主題均隨附廣泛的解釋,不過 Peter 也進一步詳細介紹術語和數學基礎。
免責聲明:Tableau 不為本文列出的任何產品、出版物或其中的觀點提供官方背書,因此本頁面並未加入任何關聯連結計劃。本文僅供教育目的,我們提供上述關於產品和出版物的資訊,目的在於協助讀者可以自行做出明智的決定。