データサイエンスには、数え切れないほどの優れたリソースがあります。思わず圧倒されるほどで、どこから読み始めるべきかを判断しづらいかもしれません。この記事では、データサイエンスの専門家から初心者まで、すべての人々にとって最も役立つブログとウェブサイトを紹介します。このデータサイエンスブログのリストには、アドバイスや学習リソースに加えて、専門家による最新のニュース、傾向、意見について、常に情報を提供する Web サイトを数多く掲載しています。
学習を始めたばかりで、データサイエンス自体についてもう少し詳しく知りたい方は、初心者向けのデータサイエンスに関する良書のリストも確認してください (リンク)。
1.Data Science Central
運営者: Vincent Granville 氏
Web サイトリンク: DataScienceCentral.com
Data Science Central は、その名が示すとおりの役割を果たしています。データサイエンスとビッグデータに関する、ほぼすべてのトピックのオンラインリソースハブとして活用できます。このサイトは、分析、テクノロジー、ツール、データビジュアライゼーション、コード、雇用機会に関するデータサイエンスの幅広いトピックを網羅しています。また、業界の専門家によって、主要なトピックに関するディスカッションやインサイトが提供されています。
このサイトは頻繁に更新されており、1 日約 2 件のブログ記事が投稿されるほか、ディスカッションや質問用のコミュニティフォーラムも用意されています。
2.SmartData Collective
運営者: Social Media Today
Web サイトリンク: SmartDataCollective.com
SmartData Collective は、ビジネスインテリジェンスとデータ管理の傾向に焦点を当てたコミュニティサイトです。Data Science Central と同様に、業界の専門家による投稿を通じて、データサイエンスに関するインサイトを提供しています。Data Science Central が全体としてデータサイエンスに直接焦点を当てているのに対して、SmartData Collective はさらに広い分野と、データサイエンスがビジネスと交差する仕組みに着目しています。
3.What's The Big Data?
運営者: Gil Press 氏
Web サイトリンク: WhatsTheBigData.com
What's The Big Data? は、データサイエンスに対して異なるアプローチを取り、ビッグデータの成長が現代の巨大なデジタル社会に与える影響に焦点を当てています。このブログの創設者である Gil Press 氏は、ビッグデータとデータサイエンスに精通しており、データリサーチでキャリアを積み、現在はコンサルティング業務を行っています。
Press 氏はブログで、ビッグデータが私たちの生活とどのように関わり、テクノロジーからビジネス、政府、政策に至るすべてに影響するかについて取り上げています。また、データ分野に関するニュースや説明のソースを提供しています。
4.No Free Hunch
運営者: Kaggle
Web サイトリンク: Blog.Kaggle.com
このブログは他のブログとは少し異なり、データサイエンティストの意見を直接取り上げるとともに、チュートリアルやニュースを提供しています。データサイエンスの Web サイトである Kaggle のブログでは、データサイエンスのプロジェクトや、対象のデータセットに最適なモデルを作成するデータサイエンティスト向けのコンテストを開催しています。組織は、賞金を懸けて自社で抱えているデータに関する問題を投稿でき、データの専門家がその問題を解決するために参加します。クラウドソーシングにより、革新的で興味深い試みが可能となり、さまざまな視点から学ぶことができます。
Microsoft Kinect ジェスチャー認識機能の改善、CERN でのヒッグス粒子の探索機能の改善、Heritage Health が 300 万ドルの賞金を懸けたことで有名な通院を必要とする患者の予測機能の改善などの知名度の高いものも含め、200 件以上のコンテストが開催されています。Kaggle の公式ブログでは、これらのコンテストについて深く掘り下げ、優勝者のインタビューを行って、データサイエンスの問題を解決するためのアプローチについてディスカッションしています。また、このブログでは、あらゆるレベルのデータサイエンス学習者を対象としたニュースやチュートリアルも提供しています。
5. insideBIGDATA
運営者: Rich Brueckner 氏
Web サイトリンク: InsideBIGDATA.com
InsideBIGDATA は、データサイエンスの機械学習の側面に焦点を当てています。IT およびビジネスのビッグデータ、機械学習、ディープラーニング、人工知能を対象としています。ゲスト特集記事では、業界のさまざまな見解についてのインサイトを提供しています。また、ニュースや Editor’s Choice 記事では、この分野で起こっている重要なことについて取り上げています。すべての記事は、トピックごとにきちんと分類されており、どのような特定のテーマにも焦点を当てられるようになっています。ブログには、イベント、求人、研究レポートなどのリソースも多数あります。これは、機械学習の最新情報を常に入手したい方に最適なリソースです。
6.Simply Statistics
運営者: Jeff Leek 氏、Roger Peng 氏、Rafa Irizarry 氏
Web サイトリンク: SimplyStatistics.org
統計について十分な情報を入手できていない場合は、このブログをお勧めします。生物統計学の 3名の教授が運営するこのブログでは、ビッグデータにおける豊富な統計について、また自らの研究分野を含むあらゆる分野で、データサイエンティストがこれらの統計を使用する方法について紹介しています。新たにキャリアを積もうとしている統計学者のために、業界でのキャリアと職務内容について、データサイエンティストとのインタビューも行っています。
7.Datafloq
運営者: Mark Van Rijmenam 氏
Web サイトリンク: Datafloq.com
Datafloqは、「Think Bigger: Developing a Successful Big Data Strategy for Your Business」の著者、Mark Van Rijmenam 氏によって運営されており、データサイエンスでのビッグデータに関する優れたリソースとなっています。このブログでは、ビッグデータのビジネスの側面と、組織がデータサイエンスを効果的に活用する方法に焦点を当てています。また、ブロックチェーンや人工知能など、話題となっているテクノロジー関連のトピックに関する情報も提供しています。Datafloq は、主に記事やインサイトを提供するリソースとして機能していますが、求人、ベンダー、イベント、トレーニングなどを通じて、専門家をつなぐことも目的としています。
8.Data Science 101
運営者: Ryan Swanstrom 氏
Web サイトリンク: 101.DataScience.Community
データサイエンス分野への参入を検討している方にとって、このブログは詳細でありながらも、素晴らしい開始ポイントとなります。Ryan Swanstrom 氏は、Microsoft、Wells Fargo、国防総省の請負業者のデータサイエンス部門でキャリアを積みました。現在は、Unify Consulting のデータサイエンスディレクターを務めています。このブログでは、貴重な体験談やヒントのほか、データサイエンティストとして成功するためのアドバイスを紹介しています。このブログは 2012 年に開設され、広範なアーカイブが保持されています。これらのアーカイブを確認することで、データサイエンスのディスカッションにおける実用的な過去数年間の内容を確認することができます。
9.Dataconomy
運営者: Dataconomy Media
Web サイトリンク: Dataconomy.com
Dataconomy もまた、未来のデータサイエンティストを対象としたリソースです。一般的なビッグデータに関するニュースやテクノロジー関連の動向についてだけでなく、業界専門家による論説記事も掲載しています。ただし、このブログは、データサイエンス業界でキャリアを積むためのリソースという点で、他のデータサイエンスハブと異なっています。このサイトでは、無料の IT リサーチライブラリと初心者向けガイドを提供しています。すでに業界に従事していて、ステップアップを図ろうとしている方のために、求人掲示板と候補者データベースも用意されています。
10.Data Science Report
運営者: Starbridge Partners
Web サイトリンク: StarbridgePartners.com/Data-Science-Report
詳細なリソースといえば、Data Science Report では、データサイエンスを詳しく理解するためのさまざまな形式のリソースが管理されています。このサイトでは、無料のコース、記事、本、動画、TED Talks を紹介して、あらゆるレベルのデータサイエンティストをサポートしています。トピックを絞り込んで、開始方法、給与交渉、インタビュー、テクノロジー、ソーシャルメディア、マーケティングのほか、「単に興味深い」トピックなどについて、厳選された情報を確認できます。データサイエンティストのキャリア段階を問うことなく、データについて学ぶ意欲のあるすべての人にとって有用なリソースハブです。