ビッグデータで成功するための 7 つのヒント
ビッグデータはますます重要となりつつあり、ビッグデータを活用した企業の成功事例が数多く報告されています。中にはデータを利用する前に保管していた企業もありましたが、後からそれが役立っています。
ビッグデータは増え続けるというのが現実です。データがスプレッドシート、データベース、データウェアハウス、オープンソースのファイルシステム (Hadoop など)、またはそれらのすべてに保存されていても、データにすばやく接続して統合できる柔軟性が必要になります。実際のサイズについては忘れてください。データを収集し、特に活用するという原理が重要なのです。
このペーパーではその開始点について説明します。ビッグデータへのアプローチとその潜在能力を最大限に活用する方法のベストプラクティスが 7 つあります。
本ページではホワイトペーパーの一部をお読みいただけます。全ページをお読みいただくには、右にあるボタンで PDF をダウンロードしてください。
これ以上大きくならないと思っていたビッグデータは、そう思った矢先にまた大きくなるものです。実際のサイズにかかわらず、ビッグデータには価値があります。ほとんどの組織には、あらゆる形や規模のビッグデータがあります。そして、組織はそうしたデータの重要性や可能性、注意を払うべき必要性も認識しています。無視できなくなるほどビッグデータはさらに増大していくことが明らかになっています。
さまざまな構造のデータの蓄積であるビッグデータを、その価値が明らかになる前から保存してきた企業では、すでにその扱いに慣れ、運用効率の向上、収益の拡大、新たなビジネスモデルの構築に役立てています。
その方法を知りたいと思いませんか。成功へのテクニックは 7 つのヒントにまとめられます。
1.短期を考えることで長期を考える
ビッグデータのテクノロジーについて常に最新の動向をキャッチすることに不安を感じているのはあなただけではありません。何もかもが非常に速く進化しており、今年や来年に最も使えるツールやプラットフォーム、手法がどれかを知るのは不可能です。
しかし、心配はいりません。この急激な進化が役に立つのです。
毎年、ベンダーはビッグデータの扱いがうまくなっています。リレーショナルおよびオンライントランザクション処理システム (OLTP) は、オンプレミスでもクラウドでも、より高性能かつ高効率になります。Hadoop とデータウェアハウスの関係をスムーズにする技術も発展していきます。常に、特定のニーズに最適に応える新たな製品が市場に登場してきます。
ですから、心配は無用です。既存の環境に新しい製品を導入することで十分な成果が得られるのであれば、そうした新製品の可能性を受け入れていきましょう。幅広い形式に対応可能な BI プラットフォームを維持するようにしてください。それにより、市場に登場する新製品からメリットを得られるようになります。
2.間違った選択を見破る
必要なのは Hadoop とデータウェアハウスのどちらでしょうか? ただし、これは引っかけ質問です。Hadoop とデータウェアハウスは並列で運用できるだけでなく、併用することでかなりのメリットが得られます。
データウェアハウスは、重要な構造化データを処理し、BI ツールやダッシュボードからアクセスしやすい形で保存するのに適していますが、分析処理やある種の変換については機能が弱く、時間がかかります。
この点では、Hadoop が優れています。Hadoop は、インタラクティブクエリおよびデータ管理が弱点ですが、生データ、非構造化データ、複雑なデータの処理に優れています。
2 つが一緒になると共生関係が形成されます。たとえば、役員が来年の在庫のニーズを予測するために使用するデータがあるとします。そのデータセットはおそらく膨大で、モデル化や再構築、またはデータウェアハウス用に準備する時間もあまりありません。そしてデータは役員が使用した後は、おそらく 1 週間ほどで破棄されてしまいます。ここで、データの保存に Hadoop を使用すれば、データを絞り込み、サンプルをデータウェアハウスに送信することができます。
「ビッグデータはデータウェアハウスの代わりではありません」と Third Nature 社の CEO である Mark Madsen 氏は自身の記事「What big data is Really About (ビッグデータとは)」で述べています。「またビッグデータは個別に管理しなければいけない島でもありません。新しい IT 環境の一部なのです」
「Hadoop かデータウェアハウスか」の引っかけに惑わされないでください。両方使うことができますし、両方使うべきなのです。
3.ビッグデータを見やすくする
ビッグデータを見やすくするには、視覚化することです。Aberdeen Group による 2013 年のレポートでは、「視覚的なデータディスカバリツールを使用する組織では、BI ユーザーの 48% が IT スタッフの助けを借りずに必要な情報を検索できる」と報告されています。視覚的なデータディスカバリができない場合、この割合は 23% まで減少します。
また、視覚的なデータディスカバリツールを使用するマネージャーは、使用しないマネージャーと比較して、タイムリーに情報を見つけることができる割合が 28% 高いという調査結果も出ています。
このレポートで、ビッグデータに関して最も重要だと思われるのは、ビジュアライゼーションによってインタラクティブなデータの操作が促されているということです。視覚化されたデータを使用しているマネージャーは、そうでないマネージャーと比較して、広範囲にわたってデータをインタラクティブに操作する割合が 2 倍以上も高くなります (15% に対して 33%)。また、発見した情報からヒントを得て、その場で思いついた質問をする可能性も高くなります。
データを視覚的に探索できると、データのストーリーが鮮明になり、瞬時に理解できるようになります。「アイデアがひらめくのです。そうしたひらめきはスプレッドシートでは得られません」と、Wells Fargo 社の戦略計画部門バイスプレジデントである Dana Zuber 氏は言います。
ビジュアル分析によっていつでも次の 2 つのことができるようになります。
- 見ているデータを変更できます。多くの場合質問が変われば、必要なデータも変わります。
- データの表示方法を変更できます。表示方法によって、得られる質問の答えも変わります。
データを取得し、表示し、質問の答えを見つける。その繰り返しがビジュアル分析のサイクルです。上述のシンプルなステップを繰り返すことで、ビジュアル分析を進めることができます。発見した情報とともに、質問は毎回より詳細な内容になります。さまざまな角度に掘り下げることができます。新しいデータを取り入れることができます。ビジュアライゼーションによって速いスピードで思考を展開していくことができ、次々にビューを作成していくことができます。
準備が整ったら、データを共有します。他のユーザーも自分で質問の答えを見つけることができます。チームの全員が新たな情報を発見でき、行動が加速し、業績の向上につながります。