機械学習と人工知能の勢いが加速するにつれて、自然言語処理 (NLP) は、コンピューターと人間のコミュニケーションの橋渡しにおいて顕著な役割を果たしています。NLP の注目度が高まり、さらに多くのオンラインリソースが公開されていますが、この複雑で多面的なテーマを根本的に理解するには、良い本が必要なときもあります。本によって全体的なデータリテラシーを高められるほか、NLP の詳しい紹介や、主な理論と実際の例を明確に説明する基本的な背景を読むことができます。
NLP が個人、企業、社会にもたらす機会について、詳しく学んで知識の幅を広げられる 8 冊の本をご紹介します。すべての分析スキルのレベルに対応しています。
1.「Speech and Language Processing」(音声と言語処理)
著者: Daniel Jurafsky 氏、James H. Martin 氏
Web サイト: サイト | Amazon
スタンフォード大学の Dan Jurafsky 教授とコロラド大学の James Martin 教授が手掛けた、最も広く参照および推奨されている NLP の本の 1 つです。言語処理のテーマに関する詳細なガイドを提供しています。NLP または計算言語学の大学生向けコースや大学院生向けの応用コースに使える内容となっていますが、言語処理の理論と適用について詳しく学び、分析能力の強化を図る場合には、必ず読んでいただきたい 1 冊です。
本書は第 2 版となります。Jurafsky 教授と Martin 教授は第 3 版の出版を予定しており、今年後半の完成を目指しています。Jurafsky 教授のスタンフォード大学 Web ページで草案をご覧ください。
2.「Natural Language Understanding」(自然言語に関する理解)
著者: James Allen 氏
Web サイト: 著者のサイト | Amazon
本書は NLP の入門ガイドであり、定番書となっています。1994 年に出版されましたが、最近の議論や分析活動と非常に関連性があり、何世代もの NLP の研究者や教育者から賞賛されています。NLP システムを作成するために必要な主な技術と概念を紹介し、専門用語で読者を圧倒することなく、それぞれの背景と理論について説明しています。
3.「Handbook of Natural Language Processing」(自然言語処理のハンドブック)
著者: Nitin Indurkhya 氏、Fred J. Damerau 氏
Web サイト: Amazon
包括的で現代的な「Handbook of Natural Language Processing」は、コンピューターシステムで実用的な NLP を開発して実装するためのツールと手法を紹介しています。本書は 3 つのセクションに分かれており、従来の手法 (象徴的および実証的アプローチを含む)、NLP の統計的アプローチのほか、情報の視覚化、オントロジー作成、生物医学テキストマイニングにわたる複数の適用例について取り上げています。
第 2 版では、英語以外のヨーロッパやアジアの言語に対応しているほか、統計的アプローチに強い重点が置かれています。また、新たな適用のセクションでは、センチメント分析などの新しい分野について説明しています。本書は、コンピューターシステムへの NLP の導入方法について学ぶ上での優れた開始ポイントとなります。
4.「The Handbook of Computational Linguistics and Natural Language Processing」(計算言語学と自然言語処理のハンドブック)
著者: Alexander Clark 氏、Chris Fox 氏、Shalom Lappin 氏
Web サイト: Amazon
「Handbook of Natural Language Processing」(自然言語処理のハンドブック) と同様に、本書では NLP と計算言語学の概念、方法論、適用の概要について、わかりやすく説明しています。主な理論上の問題や、NLP 分野を推進するために NLP の取り組みで生み出されたセントラルエンジニアリングの適用例について紹介しています。NLP のトップ研究者が指摘しているように、理論と適用例は密接に連携し合って、言語研究における関係を示しています。本書は、NLP の学生やソフトウェア会社のラボで NLP アプリケーションを開発しているエンジニアにとって、素晴らしいリソースです。
5.「The Oxford Handbook of Computational Linguistics」(オックスフォード版 計算言語学のハンドブック)
著者: Ruslan Mitkov 氏
Web サイト: Amazon
このハンドブックでは、大学生や専門外の読者でも理解しやすい方法で、計算言語学の主な概念、手法、適用について説明しています。Amazon の製品説明のとおり、言語学で最も活発で生産的な分野の 1 つを取り上げた、最新の参考書です。情報学、人工知能、言語工学、認知科学など、幅広い分野の言語学者と研究者にとって、興味深く実用的な内容となっています。言語の基礎から始まり、経験豊富な計算言語研究者を対象とした、自然言語処理の現行のタスク、手法、ツールの概要に移ります。専門外の読者だけでなく、博士研究員にとっても役立つ本です。
6.「Foundations of Statistical Natural Language Processing」(統計的自然言語処理の基礎)
著者: Christopher Manning 氏、Hinrich Schuetze 氏
Web サイト: サイト | Amazon
スタンフォード大学の教育者が手掛けたまた別の本である本書は、Jurafsky 教授の同僚である Christopher Manning 教授によって出版されました。スタンフォード大学で人気の NLP 入門コースを担当しています。Manning 教授の共著者は、ドイツのルートヴィヒ・マクシミリアン大学の計算言語学の教授です。
本書では、NLP の統計的手法を紹介するほか、新しい NLP 手法を理解し、NLP ツールの作成を支援できるよう、適切な基盤を提供しています。また、読者による言語処理アプリケーションの作成をサポートできるよう、数学と言語の基礎や統計的手法を説明しています。
7.「Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit」(Python による自然言語処理: Natural Language Toolkit を使用したテキストの分析)
著者: Steven Bird 氏、Ewan Klein 氏、Edward Loper 氏
Web サイト: サイト | Amazon
本書では、プログラミングに焦点を当てながら、NLP 分野の概要を紹介しています。NLP の初心者、計算言語学者、AI 開発者を問わず、実用的な情報源が必要な方のために、NLP を実現するための数多くの適用例と段階的な演習が用意されています。NLP または計算言語学を勉強する際のコースのテキストとして、または人工知能、テキストマイニング、コーパス言語学のコースを補足する資料として、個々の学習に活用できます。
Python プログラミング言語に興味をお持ちの方は、言語などの非構造化データを解析する Python プログラムの作成手順を学べます。本書では、Python や Natural Language Toolkit のダウンロードを推奨しています。著者はコンパニオンサイトで、Python 3 と NLTK 3 に対応するための更新版を掲載しています。
8.「Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: The Data Scientist’s Manual to Data Mining, Deep Learning & Natural Language Processing」(ビッグデータ分析手法: 21世紀の最新の分析手法: データマイニング、ディープラーニング、自然言語処理に関するデータサイエンティストのマニュアル)
著者: Peter Ghavami 氏
Web サイト: Amazon
NLP の初心者にとって、Ghavami 氏の本は難易度が高いように思われるかもしれません。ですが、NLP や、現在の世界におけるビッグデータの関連性を理解している人々には、包括的なマニュアルとして役立ちます。また、データサイエンティスト、アナリスト、ビジネスマネージャー、ビジネスインテリジェンスの実践者にとって、便利な参考資料となります。100 を超える分析技術と手法を紹介しているため、ベテランの分析実践者におすすめです。
本書は、機械学習から、予測モデリング、クラスター分析まで、すべてを網羅しています。データの視覚化、予測、回帰分析などのデータサイエンスのトピックに加えて、ニューラルネットワーク、ディープラーニング、人工知能などの NLP 関連分野についても説明します。これらは幅広い説明で補足されていますが、Ghavami 氏は専門用語や数学の基礎についても詳しく説明しています。
免責事項: Tableau は、この Web ページに記載されているいかなる製品、出版物、意見も正式に承認しているわけではないため、このページはどのようなアフィリエイトリンクプログラムにも関与していません。この記事は純粋に教育目的を意図しており、製品および出版物に関する上記の情報は、読者が情報に基づいて自身の意思決定を行えるようにするために提供されています。