GoDaddy nutzt Big Data Software von Tableau und skaliert die Data Governance auf 13 TB Daten pro Tag

Verbesserte Governance für ein in Hadoop gespeichertes Datenvolumen von mehr als 13 TB

Weniger Reporting-Fehler dank IT-zertifizierter Datenquellen

Optimierte Produktentwicklung für eine bessere Kundenerfahrung

GoDaddy ist ein internationaler Hostinganbieter und Domain-Registrar, der mehr als 17 Millionen Kunden bedient und täglich ein Datenvolumen von 13 Terabytes (TB) sammelt, speichert und in Hadoop verwaltet. Das Enterprise Data Team hat heute mit Tableau und Alation die Steuerungsmöglichkeiten für die Datengenauigkeit erhöht, sodass den Geschäftseinheiten Zugriff auf kuratierte und von GoDaddy-Datenverwaltern zertifizierte Datenquellen gewährt wird. Jetzt verbringen die Analysten weniger Zeit mit der Suche nach präzisen Daten und haben mehr Zeit für ihre Analysen. Folglich kann das Team die Produktentwicklung auch weiterhin mithilfe von datengesteuerten Entscheidungen vorantreiben, um eine bessere Kundenerfahrung zu bieten.

Indem wir die Daten in die Hände unserer Endbenutzer gaben, befähigten wir sie zu selbstständiger Berichterstellung auf Basisebene. Diese Mitarbeiter waren am nächsten an den Produkten und den Anwendungsänderungen dran und konnten schneller erkennen, wo Anpassungen erforderlich waren.

Große Datenmengen verwalten - Selfservice für mehr als 1400 Tableau-Benutzer bereitstellen

Hunderte von Datenquellen, die über Dutzende Plattformen und auf mehr als 1400 Tableau Server-Benutzer verteilt sind, waren für das Team bei GoDaddy Anlass genug, sich nach einer besseren Lösung für die Bereitstellung vertrauenswürdiger und verfügbarer Daten im ganzen Unternehmen umzusehen.

„Es gab mehrere Replikationen dieser Daten. Es gab berechnete Felder, die nicht dokumentiert waren“, erinnert sich Sharon Graves, Enterprise Data Evangelist und Tableau Server-Administrator bei GoDaddy. „Aus BI-Perspektive konnten wir nicht wirklich sagen: „Ja, okay, das ist genau, was ich brauche, um meine Berichte zu erstellen.“

Um die Mitarbeiter zu Selfservice-Analytics in großem Umfang zu befähigen, hat das Enterprise Data Team bei GoDaddy den Alation Data Catalog und Tableau eingeführt. Dieser Datenkatalog inventarisiert Datenquellen und liefert nutzungsbasierten Geschäftskontext.

Alation bietet eine Ergänzung zu dem Tableau-Konzept für Datensicherheit, indem es den Endbenutzern gestattet, mühelos Daten aus mehreren Quellen zu entdecken und die Nuancen dieser Daten zu verstehen. Hierzu verwendet Alation eine ganz besondere automatisierte Methode, indem es nicht nur die Daten einer Organisation durchforstet und katalogisiert, sondern auch die mit den Daten verbundene Geschäftssemantik und die Logik der Analyse. Letztere lässt sich der Analysegeschichte eines Unternehmens entnehmen, die durch SQL-Abfrageprotokolle dokumentiert ist.

Die kombinierte Lösung aus Tableau und Alation wird bei GoDaddy auf einem Hadoop-Fundament ausgeführt, das aus Apache Pig (einer Skriptplattform zur Verarbeitung und Analyse großer Datensätze), Apache Spark (einem Clustercomputing-Framework) sowie Apache Hive besteht.

Image

Mit Alation und Tableau konnte das Enterprise Data Team bei GoDaddy die Herkunft einer Tabelle untersuchen, mehrere Datenquellen nach einem Feld durchsuchen und die Transparenz und Kontrolle verbessern.

Mit dieser neuen Datenplattform konnte GoDaddy zahlreiche manuelle Prozesse automatisieren. Unter anderem wurden automatisierte Warnungen erstellt, um zu gewährleisten, dass die Daten ordnungsgemäß geladen werden. Außerdem werden Geschäftsregeln während der Verarbeitung einheitlich angewendet.

Und das ist längst nicht alles. „Ein Großteil der Metadaten wird automatisch mithilfe von Machine Learning in Alation erfasst, indem Abfrageprotokolldateien und Profildaten auf den GoDaddy-Servern gescannt werden“, erläutert Sharon.

Datenverwalter nutzen die Kombination aus Tableau und Alation, um Daten zu kuratieren, die im Alation Data Catalog automatisch inventarisiert werden. Mithilfe der Kuratierungsfunktionen in Alation können die Datenverwalter automatisch empfohlene Geschäftssemantik bestätigen, um den Kontext der Daten zu erfassen. Sie können Tags für Datensätze verteilen, die PII-Daten enthalten oder die aus anderen Compliance-Überlegungen die Verwaltung durch Datennutzungsrichtlinien erfordern. Darüber hinaus können sie Datenquellen auch bestätigen oder ablehnen, um deren Genauigkeit für den Unternehmensgebrauch zu zertifizieren und Analysten und Hauptbenutzer beim Erstellen von Analysen anzuleiten.

„Durch den Aufbau des Enterprise Data Team und die Implementierung dieser Produkte wurden alle Datenaktivitäten bei GoDaddy unter einem Dach vereint“, erklärt Sharon. „Das hat uns die Durchsetzung der Regeln und die Verwaltung vereinfacht und letztendlich auch die Endbenutzererfahrung erheblich verbessert.

Durch den Aufbau des Enterprise Data Team und die Implementierung dieser Produkte wurden alle Datenaktivitäten bei GoDaddy unter einem Dach vereint. Das hat uns die Durchsetzung der Regeln und die Verwaltung vereinfacht und letztendlich auch die Endbenutzererfahrung erheblich verbessert.

Optimierte Produkterfahrung für mehr als 17 Millionen Kunden

Das Data Enterprise Team bei GoDaddy muss täglich einen Dateneingang von 13 TB bewältigen. Das Spektrum reicht von Kennzahlen zum Website-Verkehr über die Verläufe von Kundenkäufen bis hin zu internen Statistiken. Sharon kann sich noch gut an die Zeit vor der neuen Lösung erinnern, als die Prozesse den Datenzugriff so sehr bremsten, dass die Analysten bei GoDaddy völlig irritiert und frustriert waren.

„Unsere Hauptbenutzer, die vermutlich mit den Daten nicht besonders vertraut sind, wussten nicht, wo die passenden Daten für ihre Analysen zu finden waren. Falls sie es doch wussten, waren sie sich nicht sicher, wie sie die Daten für ihren Bedarf nutzen konnten“, sagt Sharon.

Diese neue Plattform läutete den Umstieg auf Selfservice-Analytics bei GoDaddy ein. „Durch die Einrichtung einer Selfservice-Umgebung können die Produktmanager und Geschäftsanwender bei GoDaddy die Daten nutzen, um eine bessere Kundenerfahrung zu bieten und das Produkt zu finden und zu gestalten, das ihren Anforderungen gerecht wird, indem sie Trends erkennen und Probleme vorhersehen“, erläutert Sharon.

Jetzt wo die Benutzer die benötigten Analysen finden können, verbringen sie weniger Zeit mit der Suche nach Daten und haben mehr Zeit für die Verbesserung von Prozessen. Das schlägt sich in einer besseren Produkterfahrung bei den 17 Millionen GoDaddy-Kunden nieder.

Die Produktmanager und Funktionsteams verwenden Tableau-Dashboards, um Trends zu erkennen und potenzielle Probleme zu entdecken, bevor sie auftreten. Dadurch dass sich Daten einfach per Tastendruck abrufen lassen, können sie sich eingehend mit Website-Trends und E-Mail-Kampagnen befassen, um die Produktentwicklung zu optimieren.

„Indem wir die Daten in die Hände unserer Endbenutzer gaben, befähigten wir sie zur selbstständigen Berichterstellung auf Grundebene“, erklärt Sharon. „Wenn wir erkennen, dass Käufer an einer bestimmten Stelle des Kaufprozesses aussteigen, können wir uns diesen Flow noch einmal vornehmen, um vielleicht ein besseres Konzept zu finden. Diese Personen waren am nächsten an den Produkten und den Anwendungsänderungen dran und konnten schneller erkennen, wo Anpassungen erforderlich waren.“

Reduzieren kostspieliger Fehler durch bessere Datensicherheit

Zur Berichterstellung mussten die Analysten früher Daten aus SQL abrufen und in einem Arbeitsblatt ablegen und die Ergebnisse dann per E-Mail verschicken. Deshalb hatte das Enterprise Data Team kaum einen Einblick, wie die Daten verwendet wurden. Fehler ließen sich nur schwer zurückverfolgen. Noch kniffliger war es, die Fehler auszumerzen.

Jetzt verwenden die Datenverwalter bei GoDaddy Alation, um Tausende von Tableau-Arbeitsmappen zu scannen. Dabei werden die Hauptbenutzer jeder Datenquelle angezeigt. Mit diesem Wissen können die Analytics- und Business-Teams die Datennutzung im gesamten Unternehmen besser nachvollziehen, und sie wissen jetzt auch, an wen sie sich wenden müssen, um weitere Einblicke zu erhalten. So lassen sich weitreichende, kostspielige Fehler reduzieren.

„Durch die Kombination aus Alation und Tableau konnte das Enterprise Data Team bei GoDaddy die Herkunft einer Tabelle untersuchen, mehrere Datenquellen nach einem Feld durchsuchen und die Transparenz und Kontrolle verbessern“, erläutert Sharon.

Mit nur wenigen Klicks können sie sich die Beliebtheit verschiedener Datenquellen in Tableau Server anzeigen lassen und sehen, wo und von wem Daten genutzt werden. Darüber hinaus können sie Hunderte von Datenquellen nach einem bestimmten Feld durchsuchen.

Wie Alation und Tableau zusammenwirken, um Governance in großem Umfang zu ermöglichen, erfahren Sie in diesem Webinar bzw. in diesem Whitepaper.