TabPy Tutorial: Integration von Python mit Tableau für Advanced Analytics
tl;dr - Seit Version 10.2 verfügt Tableau mit TabPy über eine direkte Python-Integration. Dieses Tutorial zeigt die TabPy-Installation und ein Anwendungsbeispiel.
Dieser Beitrag erschien ursprünglich am 06. November 2016 in englischer Sprache auf alexloth.com
Übersetzt und herausgegeben mit freundlicher Genehmigung des Autors.
Python-Code mit TabPy direkt in Tableau ausführen
Bereits seit 2013 verfügt Tableau über eine Integration mit R und bietet die Möglichkeit, R-Skripte in berechneten Feldern zu verwenden. Das ermöglicht unter anderem K-means Clustering, Random Forest-Modelle und Sentimentanalyse. Mit dem Release von Tableau 10.2 gesellt sich ein weiteres, sehr nützliches Feature hinzu: Python-Integration durch TabPy, den Tableau Python Server.
Python ist eine weit verbreitete Programmiersprache für den generellen Einsatz und wird von Akademikern und in der Industrie gleichermaßen geschätzt. Python bringt eine ganze Reihe von Funktionen für statistische Techniken und Machine Learning mit, und lässt sich zudem auch noch stark erweitern. Zusammen bilden Tableau und Python ein Data Science Dream Team, mit dem Unternehmen alle ihre Anforderungen an Datenanalyse abdecken können.
In diesem Tutorial möchte ich Ihnen Schritt für Schritt zeigen, wie Sie TabPy installieren und mit Tableau verbinden. Anschließend verrate ich Ihnen noch mit einem Beispiel, wie Sie von Tableau aus eine Python-Funktion aufrufen, um Korrelationskoeffizienten für ein Trellis-Diagramm zu berechnen.
1. Python und TabPy installieren und starten
Klicken Sie auf die Schaltfläche für Klonen ("Clone") oder Herunterladen ("Download") in der oberen rechten Ecke des TabPy-Repository. Laden Sie die Zip-Datei herunter und extrahieren sie ihre Inhalte in ein leeres Verzeichnis (z.B. "C:\downloads\TabPy\").
Wenn Sie bereits mit Git vertraut sind, können Sie TabPy mit folgendem Befehl auch direkt aus dem Repository herunterladen:
> git clone git://github.com/tableau/TabPy
Führen Sie im Verzeichnis, in das Sie die Zip-Datei extrahiert haben, nun die Datei setup.sh
(bzw. setup.bat
unter Windows) aus. Dieses Skript übernimmt Herunterladen und Installation von Python, TabPy und alle benötigten Komponenten. Anschließend started TabPy und empfängt eingehende Verbindungen auf Port 9004.
2. Tableau mit TabPy verbinden
In Tableau 10.2 und höher können Sie eine Verbindung mit TabPy über die Menüpunkte Help > Settings and Performance > Manage External Service Connection
herstellen:
3. Python-Code in ein berechnetes Feld einfügen
Rufen Sie die Funktionen für berechnete Felder (SCRIPT_STR
, SCRIPT_REAL
, SCRIPT_BOOL
und SCRIPT_INT
) auf, um Ihr Python-Skript in Tableau einzubetten:
SCRIPT_REAL(' import numpy as np return np.corrcoef(_arg1,_arg2)[0,1] ', SUM([Sales]), SUM([Profit]))
4. Berechnete Felder in Tableau verwenden
Jetzt können Sie Ihre Python-Berechnung als berechnetes Feld in Tableau verwenden:
Die Beispiel-Arbeitsmappe finden Sie hier zum Download:
TabPy Korrelations-Koeffizienten (Rechtsklick > Speichern unter)
Zugehörige Storys
Blog abonnieren
Rufen Sie die neuesten Tableau-Updates in Ihrem Posteingang ab.