TabPy Tutorial: Integration von Python mit Tableau für Advanced Analytics

Bereits seit 2013 verfügt Tableau über eine Integration mit R und bietet die Möglichkeit, R-Skripte in berechneten Feldern zu verwenden. Das ermöglicht unter anderem K-means Clustering, Random Forest-Modelle und Sentimentanalyse. Mit dem Release von Tableau 10.2 gesellt sich ein weiteres, sehr nützliches Feature hinzu: Python-Integration durch TabPy, den Tableau Python Server.

tl;dr - Seit Version 10.2 verfügt Tableau mit TabPy über eine direkte Python-Integration. Dieses Tutorial zeigt die TabPy-Installation und ein Anwendungsbeispiel.

Dieser Beitrag erschien ursprünglich am 06. November 2016 in englischer Sprache auf alexloth.com
Übersetzt und herausgegeben mit freundlicher Genehmigung des Autors.

Python-Code mit TabPy direkt in Tableau ausführen

Bereits seit 2013 verfügt Tableau über eine Integration mit R und bietet die Möglichkeit, R-Skripte in berechneten Feldern zu verwenden. Das ermöglicht unter anderem K-means Clustering, Random Forest-Modelle und Sentimentanalyse. Mit dem Release von Tableau 10.2 gesellt sich ein weiteres, sehr nützliches Feature hinzu: Python-Integration durch TabPy, den Tableau Python Server.

Python ist eine weit verbreitete Programmiersprache für den generellen Einsatz und wird von Akademikern und in der Industrie gleichermaßen geschätzt. Python bringt eine ganze Reihe von Funktionen für statistische Techniken und Machine Learning mit, und lässt sich zudem auch noch stark erweitern. Zusammen bilden Tableau und Python ein Data Science Dream Team, mit dem Unternehmen alle ihre Anforderungen an Datenanalyse abdecken können.

In diesem Tutorial möchte ich Ihnen Schritt für Schritt zeigen, wie Sie TabPy installieren und mit Tableau verbinden. Anschließend verrate ich Ihnen noch mit einem Beispiel, wie Sie von Tableau aus eine Python-Funktion aufrufen, um Korrelationskoeffizienten für ein Trellis-Diagramm zu berechnen.

1. Python und TabPy installieren und starten

Klicken Sie auf die Schaltfläche für Klonen ("Clone") oder Herunterladen ("Download") in der oberen rechten Ecke des TabPy-Repository. Laden Sie die Zip-Datei herunter und extrahieren sie ihre Inhalte in ein leeres Verzeichnis (z.B. "C:\downloads\TabPy\").

TabPy download via GitHub

Wenn Sie bereits mit Git vertraut sind, können Sie TabPy mit folgendem Befehl auch direkt aus dem Repository herunterladen:

> git clone git://github.com/tableau/TabPy

TabPy download via Git-Kommandozeile

Führen Sie im Verzeichnis, in das Sie die Zip-Datei extrahiert haben, nun die Datei setup.sh (bzw. setup.bat unter Windows) aus. Dieses Skript übernimmt Herunterladen und Installation von Python, TabPy und alle benötigten Komponenten. Anschließend started TabPy und empfängt eingehende Verbindungen auf Port 9004.

2. Tableau mit TabPy verbinden

In Tableau 10.2 und höher können Sie eine Verbindung mit TabPy über die Menüpunkte Help > Settings and Performance > Manage External Service Connection herstellen:

Tableau Hilfe-Menü

TabPy port 9004

Stellen Sie hier Port 9004 ein

3. Python-Code in ein berechnetes Feld einfügen

Rufen Sie die Funktionen für berechnete Felder (SCRIPT_STR, SCRIPT_REAL, SCRIPT_BOOL und SCRIPT_INT) auf, um Ihr Python-Skript in Tableau einzubetten:

SCRIPT_REAL('
  import numpy as np
  return np.corrcoef(_arg1,_arg2)[0,1]
',
SUM([Sales]), SUM([Profit]))

Python-Skript in Tableau

Python-Skript in Tableau

4. Berechnete Felder in Tableau verwenden

Jetzt können Sie Ihre Python-Berechnung als berechnetes Feld in Tableau verwenden:

Tableau Worksheet

Tableau Arbeitsmappe

Die Beispiel-Arbeitsmappe finden Sie hier zum Download:
TabPy Korrelations-Koeffizienten (Rechtsklick > Speichern unter)