随着机器学习和人工智能发展势头加快,自然语言处理 (NLP) 在促进计算机和人类交流方面发挥着越来越重要的作用。随着人们对 NLP 的关注越来越多,可用的在线资源也越来越多,但有时需要一本优秀书籍来扎扎实实地了解这样具有复杂性和多面性的主题。书籍可以提高您的整体数据素养,并且书中包含基础背景知识,可为读者提供不错的 NLP 简介或对主要理论和真实示例的阐释。
以下介绍的八本优秀书籍可拓展您的知识,使您熟悉 NLP 为个人、企业和社会创造的机会。它可以满足所有分析技能水平人士的需求。
1.《Speech and Language Processing》
作者:Daniel Jurafsky 和 James H. Martin
网站:网站 | Amazon
这是一本由斯坦福大学教授 Dan Jurafsky 和科罗拉多大学教授 James Martin 撰写的被广泛引用且备受推荐的 NLP 书籍,它提供了关于语言处理这一主题的深入指导。它适用于在 NLP 或计算机语言学方面的本科课程或高级研究生课程中使用。不过,对于任何深入研究语言处理理论和应用的人来说,这是有助于发展和增强其分析能力的必读书籍。
这是第二版,Jurafsky 和 Martin 正在编写第三版,预计今年晚些时候完成。在 Jurafsky 的斯坦福网页上查看草稿。
2.《Natural Language Understanding》
作者:James Allen
网站:作者的网站 | Amazon
这本书是另一个 NLP 入门指南,被视为经典著作。尽管它出版于 1994 年,但与当今的讨论和分析活动紧密相关,并受到一代又一代 NLP 研究者和教育者的追捧。它介绍了构建 NLP 系统所需的主要技术和概念,并深入介绍了每种技术和概念的背景及理论知识,不会因包含过多的技术术语而给读者造成困扰。
3.《Handbook of Natural Language Processing》
作者:Nitin Indurkhya 和 Fred J. Damerau
网站:Amazon
这本全面、现代的《Handbook of Natural Language Processing》提供了用于在计算机系统中开发和实现实用 NLP 的工具和技术。本书分为三个部分:经典技术(包括符号和经验方法)、NLP 中的统计方法以及多种应用 - 从信息可视化到本体构建和生物医学的文本挖掘。
第二版涵盖多种语言,除了英语外还包括欧洲和亚洲语言,并且更加强调统计方法。此外,它新增了一个应用部分,探讨情绪分析等新兴领域。本书是学习如何将 NLP 应用到计算机系统的一个不错起点。
4.《The Handbook of Computational Linguistics and Natural Language Processing》
作者:Alexander Clark、Chris Fox 和 Shalom Lappin
网站:Amazon
与《Handbook of Natural Language Processing》相似,这本书对 NLP 和计算语言学中的概念、方法和应用,以一种易于理解的方式加以概述。它介绍了 NLP 工作所带来的推动学科发展的主要理论问题和中心工程应用。正如顶级 NLP 研究者所指出的,理论和应用工作携手并进,体现出语言研究中的关系。这本书是很好的资源,适用于 NLP 学生和在软件公司的实验室开发 NLP 应用的工程师。
5.《The Oxford Handbook of Computational Linguistics》
作者:Ruslan Mitkov
网站:Amazon
本手册以本科生和非专业人士能理解的方式介绍了计算语言学的主要概念、方法和应用。正如 Amazon 上所述,它是语言学中极其活跃和成果丰富的领域之一的先进参考资料。信息学、人工智能、语言工程和认知科学等领域的众多语言学家和研究者会认为它既有趣又实用。它首先介绍了语言学基础知识,然后概述了自然语言处理方面的当前任务、技术和工具,适用于较有经验的计算语言研究者。无论您是非专业人士,还是博士后工作者,这本书都非常有用。
6.《Foundations of Statistical Natural Language Processing》
作者:Christopher Manning 和 Hinrich Schuetze
网站:网站 | Amazon
这是另一本来自斯坦福教育者的书籍,作者是 Jurafsky 的同事 Christopher Manning。他们都在斯坦福大学教授受欢迎的 NLP 入门课程。Manning 的合著者是德国慕尼黑-路德维希-马克西米利安大学的一名计算语言学教授。
本书介绍了 NLP 的统计方法,并为理解新的 NLP 方法以及支持创建 NLP 工具奠定了良好的基础。数学和语言学基础知识以及统计方法均通过支持读者创建语言处理应用的方式展示。
7.《Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit》
作者:Steven Bird、Ewan Klein 和 Edward Loper
网站:网站 | Amazon
这本书对 NLP 领域做出了有用的介绍,侧重于编程。如果您希望书架或书桌上有实用的资源,无论您是 NLP 初学者、计算语言学家还是 AI 开发人员,这本书都是您的理想选择,其中包含数百个完整实用的示例和分级练习,生动地阐释了 NLP。这本书可以用于个人学习,作为学习 NLP 或计算语言学的课程教材,或者用作人工智能、文本挖掘或语料库语言学课程的辅助材料。
希望了解 Python 编程语言?这本书将引导您创建用于分析非结构化数据(如语言)的 Python 程序,并建议您下载 Python 和自然语言工具包。在配套网站上,作者实际上已更新了这本书,使其适用于 Python 3 和 NLTK 3。
8.《Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist’s Manual to Data Mining, Deep Learning & Natural Language Processing》
作者:Peter Ghavami
网站:Amazon
Peter 的书对于 NLP 初学者可能比较难,但对于熟悉 NLP 和了解大数据与当今世界的关联的人而言,这是非常有用的综合手册。它也是数据科学家、分析师、业务经理和商业智能从业者的有用参考。书中包含了一百多种分析技术和方法,我们认为经验丰富的分析从业者将非常喜欢这本书。
各章节涵盖从机器学习到预测性建模和群集分析的所有内容。数据科学主题包括数据可视化、预测和回归分析以及 NLP 相关领域(如神经网络、深度学习),此外还讨论了人工智能。这些主题包含广泛的阐释,但 Peter 也详细介绍了术语和数学基础知识。
免责声明:Tableau 并未对本页面列出的任何商品、出版物或意见提供正式支持,因此本页面并未加入任何关联链接计划。本文仅供参考,我们提供上述关于商品和出版物的信息仅仅是为了帮助读者自行做出决定。