ビッグ データ 解析ソフトの Tableau、Alation Data Catalog、Hadoop を活用し、データガバナンス能力を拡張した GoDaddy 社

13 TB を超えるデータのガバナンスの向上

IT により認証されたデータソースでレポートのエラーが減少

最適な製品開発によりカスタマーエクスペリエンスが向上

GoDaddy は国際的な Web ホスティングおよびインターネットドメイン登録会社で、1,700 万人の顧客にサービスを提供し、毎日収集される 13 TB のデータを Hadoop で保管して管理しています。同社のエンタープライズデータチームは今日、Tableau と Alation を使用し、データの正確性の管理能力を向上し、GoDaddy のデータスチュワードによって認証済みの管理されたデータソースにビジネス部門がアクセスできるようにしています。これによりアナリストが正確なデータの検索に費やす時間を短縮し、分析により多くの時間を費やせるようになりました。その結果、チームはデータに基づく意思決定を行って製品開発を続け、カスタマーエクスペリエンスを向上させています。

エンドユーザーにデータを提供することで、各自が独自のベースレベルのレポートを素早く作成できるようになりました。製品やアプリケーションの変更に最も近い現場で、必要な調整を素早く認識できるようになりました。

ビッグ データ 解析 ソフト Tableau で大規模にセルフサービスを実現

何百ものデータソースが何十ものプラットフォームに広がり、1400 人以上の Tableau Server ユーザーがいる GoDaddy のチームは、組織に信頼できるデータへのアクセスを提供するより良い方法を必要としていました。

GoDaddy のエンタープライズデータエバンジェリストであり Tableau Server 管理者の Sharon Graves 氏は過去の状況を次のように述べています。「重複データもいくつもありました。文書化されていない計算フィールドもありました。BI の視点から、レポートに必要なデータはこれだという確信を持てませんでした。」

大規模なセルフサービス分析を可能にするため、GoDaddy のエンタープライズデータチームはデータソースのインベントリを作成して使用状況に基づくビジネスコンテキストを提供できる、Alation Data Catalog と Tableau を導入しました。

Alation はエンドユーザーが複数ソースからデータを発見しやすくし、データのニュアンスを深く理解できるようにすることで、Tableau のデータガバナンスへのアプローチを補完します。Alation は組織のデータ、データに関するビジネスセマンティクス、および SQL のクエリログを通じて取得される組織の分析履歴に埋め込まれた分析ロジックをクローリングしてカタログを生成する、独自の自動プロセスを使用します。

Tableau と Alation を組み合わせたソリューションは、大規模なデータセットの処理および分析用のスクリプトプラットフォームの Apache Pig、クラスターコンピューティングフレームワークの Apache Spark、Apache Hive で構成された GoDaddy の Hadoop 環境に導入されました。

Image

Alation と Tableau により、GoDaddy のエンタープライズデータチームは表のデータがどこから来るかを理解し、特定分野の複数データソースを検索し、可視性とコントロールを向上させることができるようになりました。

GoDaddy は新しいデータプラットフォームで、データが正しく読み込まれるようにするための自動アラートの作成など、多くの手動プロセスを自動化しました。また、処理時にビジネスルールが一貫して適用されるようにもなりました。

しかし、それだけではありません。 Sharon 氏は「メタデータの多くは Alation の機械学習によって、クエリログファイルをスキャンし GoDaddy のサーバーのデータプロフィールを作成して自動的に取得されています」と説明します。

データスチュワードは Tableau と Alation を組み合わせて使用して、Alation Data Catalog のインベントリに自動的に登録されたデータを管理します。 スチュワードが Alation のキュレーション機能を使用することで、データのコンテキストを認識するために自動推奨されたビジネスセマンティクスを確認することができます。PII データを含むデータセットや、他のコンプライアンス上の理由によりデータ使用ポリシーを通じての管理が必要なデータセットに、タグを付けることができます。また、企業で使用するための正確性を認証する目的でデータソースを承認または却下して、分析の際にアナリストやパワーユーザーを支援することもできます。

Sharon 氏は「エンタープライズデータチームの編成とこれらの製品の導入により、Godaddy にすべての種類のデータの保管場所ができました」と述べています。「ルールと管理体制をしっかりと整えることで、エンドユーザーエクスペリエンスが大幅に向上しました。」

エンタープライズデータチームの編成とこれらの製品の導入により、Godaddy にすべての種類のデータの保管場所ができました。ルールと管理体制をしっかりと整えることで、エンドユーザーエクスペリエンスが大幅に向上しました。

1,700 万人以上のカスタマーエクスペリエンスを改善

GoDaddy のデータエンタープライズチームは、Web トラフィックメトリックスから顧客の購入履歴や社内統計まで、1 日 13 TB 以上のあらゆる種類のデータを扱っています。Sharon 氏は、新しいソリューションの導入前のプロセスが、GoDaddy のアナリストにとってどれだけ時間がかかり紛らわしく、ストレスがたまるものであったかを、次のように語りました。

「データに関する深い知識があるとは限らないパワーユーザーは、分析に適切なデータがどこにあるのかわからず、どこにあるかわかっていてもニーズを満たすために使う方法がわかりませんでした。」

この新しいプラットフォームにより、GoDaddy でのセルフサービス分析への移行が始まりました。Sharon 氏は次のように語りました。「セルフサービスの環境を整えることで、GoDaddy のプロダクトマネージャーとビジネスユーザーがデータを活用し、カスタマーエクスペリエンスを向上できるほか、傾向の特定や問題の予測をすることにより顧客のニーズに合った製品を見つけてデザインできるようになりました。」

ユーザーが必要な分析を行い、データを探すのに費やす時間が短縮され、より多くの時間をプロセスの改善に回せるようになった結果、1,700 万人のカスタマーエクスペリエンスが向上しました。

プロダクトマネージャーと部門のチームは Tableau ダッシュボードで傾向を特定し、実際に問題が発生する前にその可能性を見つけられるようになりました。データが自由に使えるようになり、Web サイトの傾向やメールキャンペーンの詳細を確認し、最適な製品開発が行えるようになりました。

Sharon 氏は次のように説明しています。「エンドユーザーにデータを提供することで、各自が独自のベースレベルのレポートを素早く作成できるようになりました。特定の時点で顧客が手続きを中断しているなら、そのフローを確認して他に良いアプローチがないか探ることができます。製品やアプリケーションへの変更に最も近い現場で、必要な調整を素早く認識できるようになりました。」

データガバナンスの改善で大きな損失につながるエラーが減少

アナリストによる以前のレポート作成は SQL からのデータの取得、スプレッドシートへの読み込み、結果のメール送信という形で行われていたため、エンタープライズデータチームがデータの使用方法に関するインサイトをほとんど得られませんでした。エラーの追跡が難しく、その対策はさらに困難でした。

現在 GoDaddy のデータスチュワードは、Alation を使用して何千もの Tableau ワークブックをスキャンし、各データソースのトップユーザーを把握しています。この知識により、分析とビジネスの両チームが社内全体でのデータの使用状況をより詳しく理解し、さらなるインサイトを得られるようになりました。これにより大規模で大きな損失につながるエラーを減らすことができました。

Sharon 氏は次のように述べています。「Alation と Tableau を組み合わせることで、GoDaddy のエンタープライズデータチームは表のデータがどこから来るかを理解し、1 つのフィールドに対して特定分野の複数データソースを検索し、可視性とコントロールを向上させることができるようになりました。」

たった数クリックで様々なデータソースの Tableau Server での使用頻度、使用場所、使用者が確認できるほか、特定分野の何千ものデータソースの中から検索できます。

Alation と Tableau が連携して大規模なガバナンスを可能にする方法の詳細は、こちらのオンラインセミナーホワイトペーパーをご覧ください。