データサイエンティストが、組織的な変革を促進するためのソフトスキルを身に付ける。
データサイエンス分野でのスペシャリストの需要が拡大しています。LinkedIn 社の 2017 年の米国の新興職業に関するレポートでは、「2012 年以降、データサイエンティスト職が 650% 以上増加しており」、さまざまな業界で、「何百社に及ぶ企業がデータサイエンティストの役割を雇用している」と説明されています。「新しい職業の上位に機械学習エンジニア、データサイエンティスト、ビッグデータエンジニアがランクインしている」ことから、候補者プールが拡大しています。
しかしながら、より多くの部署や役割がデータを扱うようになると考えられていることから、組織ではデータリテラシーが全体的に高まっており、より多くのシチズンデータサイエンティストが現れています。ガートナー社 (英語) は、シチズンデータサイエンティストを「高度な診断的分析や予測機能、処方機能を使用するモデルを作成または生成するものの、本業は統計や分析以外の分野にある人材」と定義しています。これらの人材がデータサイエンティストに代わることはありませんが、仮説を立てたり検証したりする上で重要なパートナーとなります。
これにより、データサイエンスの定義が変化し、従来のデータ専門知識とビジネス分野の知識との間の境界線が曖昧になります。Charles Schwab 社の統計分析マネージャーである Sonic Prabhudesai 氏は、「より多くのビジネス部門のユーザーがデータの活用方法について理解するようになっており、データサイエンティストはビジネス内部の仕組みに対する知識を深めている」と説明しています。
今日、データサイエンティストは高度な統計および機械学習に関する知識だけでなく、業界に関する深い知識を含めた、ビジネスに対する戦略的な思考も求められています。Infosys 社の最高グローバルデータサイエンティストである N. R. Srinivasa Raghavan 博士は、「データサイエンスとは、単に複雑な計算を行うだけでなく、業界の特定の問題を解決するために多様なスキルを適用することです。データサイエンティストは、インサイトが適用される分野について十分に理解している必要があります」と述べています。
アルゴリズムとモデルによって生成される結果は、適切なコンテキストで適切な問題を解決できて初めて効果を発揮します。これは、プロセスの最初の段階で、ステークホルダーと協力して問題の記述や仮説を特定して調整し、ワークフロー全体を通してステークホルダーを関与させる必要があることを意味しています。また、ワークフローの最後には、関連性がありアクションに結び付く形で、ビジネスパートナーに結果を伝える方法を理解している必要があります。
Prabhudesai 氏は、「統計的なモデル化および機械学習は、データサイエンティストになるために不可欠となりつつあります。その分野に従事する人材が、いかに分析結果をシンプルでありながらもアクションに結び付く方法で伝えることができるかが、彼らの差別化につながります」と説明しています。データサイエンティストは、分析結果の提供ではなく、分析結果がビジネスに適用される方法において中心的な役割を担います。
セルフサービス分析ツールによって、データサイエンティストと上級ユーザーの両者が、データを探索して、データに対する理解を深められるようになります。これによって、残りの分析を誘導して、最終的にはビジネスに影響を与えることができるインサイトを引き出すことができます。