TabPy により Tableau で Python のパワーを活用

TabPy のベータ版リリースをお知らせします。TabPy は、Tableau ワークブックの中から Python コードの評価を行えるようにする新しい API です。 Tableau で TabPy を使うと Python で計算フィールドを定義できるため、ビジュアライゼーションから直接、多数の機械学習ライブラリのパワーを活用できます。

TabPy (英語) は、Tableau ワークブックの中から Python コードの評価を行えるようにする新しい API です。

Tableau で TabPy を使うと Python で計算フィールドを定義できるため、ビジュアライゼーションから直接、多数の機械学習ライブラリのパワーを活用できます。

Tableau への Python 統合により、強力なシナリオが実現可能になります。たとえば、オンライン小売企業で販売された製品のレビューに対するセンチメントスコアは、数行の Python コードで得られます。そしてその結果は、Tableau を使ってさまざまな方法で分析できます。

たとえば、ネガティブなレビューのみを表示するようにフィルタリングし、背後にある理由を理解するためにその内容を検討することができます。連絡する顧客のリストを取得することもできます。また、全体的なセンチメントの推移を視覚化することも可能です。

他の一般的なビジネスシナリオには次のようなものがあります。

  • リードスコアリング: ユーザーの行動を予測モデルでスコア化して、より効率的なコンバージョンファネルを作成します。
  • 顧客離れの予測: ユーザーがいつ、なぜ離れるかを知り、予測して未然に防ぎます。

TabPy サーバーは、コンピューターにもリモートサーバーにも簡単にインストールできます。このサービスに接続するように Tableau を設定するには、Tableau Desktop で、[ヘルプ] > [設定とパフォーマンス] > [外部サービス接続の管理] の順に選択し、サービスの URL とポート番号を入力します。すると、Tableau 8.1 以降に R で行えるようになったのと同様に、Tableau で計算フィールドの要素として Python スクリプトが使えるようになります。

TabPy は一般的な Anaconda 環境を使用します。Anaconda は、SciPy や NumPy、scikit-learn など数多くの一般的な Python パッケージがプリインストールされ、すぐに使用できるようになっていますが、ユーザーは、どのような Python ライブラリでもインストールしてスクリプトで使用することができます。

カスタムモデルを作成しているデータサイエンティストのチームが社内にいる場合、TabPy によって、パブリッシュされたモデルを用いて Tableau 内で活用したい他のユーザーと、そのカスタムモデルを円滑に共有できるようにもなります。

パブリッシュすると、モデルのタイプや複雑さにかかわらず Tableau で 1 行の Python コードを書くだけで、機械学習モデルを実行することができます。たとえば顧客離れの可能性は、新しいデータをモデルに渡すだけという簡単な操作で、ロジスティック回帰、多層パーセプトロンニューラルネットワーク、勾配ブースティング木を使って推定できます。

パブリッシュされたモデルの使用には、いくつかのメリットがあります。複雑な関数は、予測サービス環境に展開されたメソッドとして、保守、共有、再利用を簡単に行えるようになります。計算フィールドは変更せずに動作させ続けながら、エンドポイントの背後でモデルとコードの改良や更新を行えます。また、ダッシュボード作成者は、エンドポイントの背後にあるモデルの複雑さについて理解したり心配したりする必要はありません。

Tableau と Python を組み合わせることによって、さらに高度な分析のさまざまなシナリオが実現可能になり、ダッシュボードのインパクトを一層高めることができます。TabPy の詳細やダウンロードについては、GitHub ページ (英語) をご覧ください。

Tableau とビッグデータをさらに活用

どのような規模の組織でもビッグデータで直面する可能性があるさまざまな問題を、Tableau でどのように解決できるのかご覧ください。
詳しく読む