Tableau と Amazon Aurora を利用した SQL 分析

SQL データベースは、ほとんどの組織で絶対的な存在です。来る日も来る日も DBA は、データベースで書き込み操作を保護してストレージ要件を守り、後々のために何があってもあらゆるデータが正確に記録されるようにしています。一方、分析はと言えば、ほとんどの場合は後回しにできます。データ抽出は、早朝などのアクセスが少ない時間帯にスケジュール設定することが可能です。営業時間 (ビジネスユーザーが実際に質問したい時間) 中に、データベースにライブ接続を行うことは危険ですし不要です。ですが、残念ながらその結果、入念に保存および管理されているデータの有用性は制限されてしまいます。

四半期も終わりにさしかかり、あなたのチームは取引をまとめようと今週ずっと忙しくしています。あなたも売上目標にどのくらい近づいているか知る必要がありますが、問題を抱えています。

使っている抽出されたデータセットは毎晩更新されており、今日まとめた取引が含まれていないのです。SQL データベースに接続しても、書き込み操作を保護するためにロックされています。頼りになるのは勘だけであり、その原因は何もかも、データベースがデータの保存と収集も行いながら会社の分析ニーズにしっかり応えることができないからです。

多くの方はこのような状況に覚えがあるでしょう。SQL データベースは、ほとんどの組織で絶対的な存在です。来る日も来る日も DBA は、データベースで書き込み操作を保護してストレージ要件を守り、後々のために何があってもあらゆるデータが正確に記録されるようにしています。

一方、分析はと言えば、ほとんどの場合は後回しにできます。データ抽出は、早朝などのアクセスが少ない時間帯にスケジュール設定することが可能です。営業時間 (ビジネスユーザーが実際に質問したい時間) 中に、データベースにライブ接続を行うことは危険ですし不要です。ですが、残念ながらその結果、入念に保存および管理されているデータの有用性は制限されてしまいます。

少なくとも最近までは、そのような状態でした。しかし Amazon Aurora (とそのリードレプリカ) では、Tableau ユーザーがデータベースに直接接続し、メインのデータベースの書き込み操作に干渉したり悪影響を与えたりせずに、いつでも自由にどのような分析でも行うことができます。

Tableau と Aurora の連携

リードレプリカは、書き込み操作専用の Aurora DB クラスタにおいて、基本的に独立したエンドポイントです。データベースが利用する AWS リージョン内では、3 つのアベイラビリティゾーンに最大 15 個のリードレプリカを分散させることができます。リードレプリカへのアクセスには、シングルリーダーエンドポイントを使います。あらゆる読み出しリクエストは、Aurora クラスタの全リードレプリカにわたって負荷分散されるため、会社の分析ニーズをすべて満たそうとして、単一のリードレプリカが過負荷になることがないようになっています。

リードレプリカは、Tableau を使った直接接続で非常に便利です。アナリストがデータベース自体に与える影響を心配せずに、どのようなフィールドでもドラッグ & ドロップし、どのようなクエリでも作成できるようになるからです。Tableau の最適化されたコネクタでは、Aurora に事前最適化済みの SQL が生成されるため、その効率的で直接的な SQL はパフォーマンスを自動的に最適化します。

そのうえ、Tableau ユーザーは階層、フォルダー、グループ、計算を作成したり、データのクリーニングとキュレーションに備えどのフィールドでも別名を変更したりすることが可能です。そのメタデータ定義は、Aurora のリードレプリカへの直接接続とともに、Tableau Server にパブリッシュできます。これによって、誰もが自由に接続して利用できる (もちろんパーミッションがあればの話ですが)、統一された情報源を効果的に保存できるようになります。

Aurora リードレプリカのアーキテクチャ

Tableau Server では、組み込みパーミッションを、Aurora インスタンスで設定済みの行レベルのパーミッションに依存させることもできます。また、Tableau Server 自体のビュー、ワークブック、フォルダー、グループにパーミッションのレベルを設定することも可能です。こうした細かいレベルのパーミッション管理によって、適切なユーザーだけがトラブルを起こさずに機密データを見られる状態を確保できるようになります。

つまり、Tableau と Aurora は強力な組み合わせであり、ほとんどの SQL データベースが持つ分析上の制限から組織を解放することができます。それは、データの分析を遅らせたり、データ抽出の更新を待ったりする必要がなくなるということです。セキュアで効率的な Aurora への直接接続、ドラッグ & ドロップ操作のビジュアライゼーション、そして簡単な共有ができる環境をご活用ください。

Tableau と Aurora の紹介ビデオをご覧になるには、11 月 2 日の詳しいオンラインセミナーとデモにご参加ください。