8 Bücher über Data Science für Anfänger

In den letzten Jahren ist das öffentliche Interesse an Data Science sprunghaft angestiegen. Was einst als eher exotische Disziplin galt, ist heute allerorten Thema in Nachrichten, Politik, internationalem Recht und sozialen Netzwerken. Datenkompetenz entwickelt sich in Branchen aller Art zu einer wichtigen Anforderung, und Kunden greifen über Datenpunkte tagtäglich auf riesige Business-Intelligence-Systeme zu.

Ganz gleich, ob Sie sich nun einfach nur über das allgegenwärtige Thema Daten auf dem Laufenden halten oder als Experte für Data Science und Datenkompetenz durchstarten möchten, in diesem Artikel finden Sie einige Bücher, die Ihnen den Einstieg in die Welt der Datenwissenschaft erleichtern können.

1. „The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists“ von Carl Shan, William Chen, Henry Wang und Max Song

Verfasser: Carl Shan, William Chen, Henry Wang und Max Song
Website: The Data Science Handbook | Amazon

Wer verlässliche Informationen braucht, ist oft am besten beraten, sich diese aus erster Hand zu holen – von Profis auf dem jeweiligen Gebiet. Was wäre also naheliegender, als 25 führende Branchenexperten zu befragen? „The Data Science Handbook“ enthält Interviews mit herausragenden Datenwissenschaftlern – vom ehemaligen US-Datenschutzbeauftragten über Teamleiter großer Unternehmen bis hin zu aufstrebenden Datenwissenschaftlern, die eigene Programme entwickeln – und bietet damit einzigartige Einblicke ins Thema.

Die Auswahl der Gespräche führt Neueinsteiger durch die Branche und versorgt sie mit praxisnahen Datenratschlägen, Lernerfahrungen, Karrieretipps und Erfolgsstrategien für die Welt der Data Science. Die technischen Aspekte des Fachs spielen dabei keine große Rolle, auch erhebt das Buch nicht den Anspruch, ein allumfassender Leitfaden zu sein. Dafür ist es ein wahrer Schatz an praktischen Empfehlungen und Erkenntnissen.

2. „Doing Data Science: Straight Talk from the Frontline“ von Cathy O’Neil und Rachel Schutt

Verfasser: Cathy O’Neil und Rachel Schutt
Website: O’Reilly | Amazon

In „Doing Data Science“ wird nicht lang gefackelt. Das Buch basiert auf dem Einführungskurs der New Yorker Columbia University in die Data Science und zielt auf Einsteiger ab, die sich erstmals mit der Materie auseinandersetzen. Daher haben sich die Data-Science-Beraterin Cathy O’Neil und die Kursleiterin Rachel Schutt zusammengetan, um die Inhalte dieses Kurses auch der Allgemeinheit zugänglich zu machen.

Das Buch enthält aber nicht nur aufschlussreiche Vorlesungen zum Thema, sondern stellt anhand von relevanten Fallstudien und Code auch auf anschauliche Weise Praxisbeispiele vor. Behandelt werden Algorithmen, Methoden, Modelle und Datenvisualisierung. Das Ergebnis ist ein praxisnahes technisches Nachschlagewerk.

3. „Data Science – was ist das eigentlich?! Algorithmen des maschinellen Lernens verständlich erklärt“ von Annalyn Ng und Kenneth Soo

Verfasser: Annalyn Ng und Kenneth Soo
Website: Amazon

Data Science hat viel mit Mathematik zu tun und kann daher schwer zugänglich oder gar abschreckend wirken. „Data Science – was ist das eigentlich?!“ bietet jedoch eine laienverständliche, wenig mathelastige Einführung in Data Science und Algorithmen, die dem Thema seinen Schrecken nimmt.

Jedes Kapitel ist einem besonders nützlichen Algorithmus gewidmet und erläutert grob dessen Funktionsweise sowie reale Anwendungen in der Praxis. Anschauliche Grafiken erleichtern das Verständnis der zugrunde liegenden Prozesse. Abgerundet wird das Werk durch Übersichten mit den wichtigsten Vor- und Nachteilen jedes Algorithmus sowie durch ein praktisches Glossar häufiger Data-Science-Begriffe.

4. „The Art of Data Science“ von Roger D. Peng und Elizabeth Matsui

Verfasser: Roger D. Peng und Elizabeth Matsui
Website: Amazon

„The Art of Data Science“ geht darauf ein, wie sich praktisch aus jeder beliebigen Datenquelle wertvolle Datenerkenntnisse gewinnen lassen. Der Schwerpunkt liegt dabei auf dem Prozess der Datenanalyse und -filterung, um der Datenbotschaft auf den Grund zu gehen. Aufbauend auf eigenen Erfahrungen führen die Autoren Themenneulinge und Manager Schritt für Schritt durch die Datenwissenschaft und die damit verbundenen Analyseprozesse.

Beide Autoren haben selbst Datenprojekte geleitet und Analystenteams geführt. Ausgehend von ihrer eigenen beruflichen Praxis erläutern sie, welche Methoden zuverlässig zum Erfolg führen und welche Fallstricke Datenprojekten zum Verhängnis werden können.

5. „Data Science für Dummies“ von Lillian Pierson

Verfasser: Lillian Pierson
Website: Amazon

Die „Dummies“-Reihe ist seit Langem dafür bekannt, Laien in allgemein verständlicher Form mit ihnen unbekannten Themen vertraut zu machen. Genau dies hat sich auch der Band „Data Science für Dummies“ zum Ziel gesetzt. Er konzentriert sich vor allem auf die betriebswirtschaftlichen Aspekte der Data Science und dient somit als Einführung für alle, die auf diesem Gebiet beruflich tätig werden möchten. Als Einstiegshilfe gibt er einen umfassenden Überblick über die Disziplin. Leser lernen so die wichtigsten Begriffe aus dem Bereich Big Data kennen und erfahren, wie sich Data Science im Alltag anwenden lässt.

Das Buch streift auch verwandte Themenfelder, darunter Data Engineering, Programmiersprachen wie R und Python, maschinelles Lernen, Algorithmen, künstliche Intelligenz und Datenvisualisierungstechniken. Wenn Sie also neugierig auf das Thema Data Science sind oder einfach nur in der Lage sein möchten, Ihren Eltern in Grundzügen zu erklären, was Data Science ist, ist dieses Buch ein guter Start.

6. „Big Data for Dummies“ von Judith Hurwitz, Alan Nugent, Fern Halper und Marcia Kaufman

Verfasser: Judith Hurwitz, Alan Nugent, Fern Halper und Marcia Kaufman
Website: Amazon

Wo wir gerade bei Data Science und der „Dummies“-Reihe sind: Die Buchreihe bietet auch einen Einstieg ins Thema Big Data und dessen Bedeutung. Das Buch beantwortet die zentrale Frage „Was ist Big Data?“ und beleuchtet sie sowohl aus technischer als auch aus unternehmerischer Perspektive. Es zeigt, wie Big Data in Business-Intelligence-Anwendungen zum Einsatz kommt und Analysten bei der Problemuntersuchung und -lösung helfen kann.

Darüber hinaus beinhaltet das Buch technische Ratschläge, beispielsweise dazu, wie Sie erhobene Daten organisieren und unterstützen oder wie Sie Methoden und Hilfsmittel zur Datenanalyse für ihre Zwecke anpassen können. „Big Data for Dummies“ ist hilfreich, wenn Sie aus Ihren Daten schlau werden, Daten sinnvoll nutzen und sie in einer geschäftlichen Umgebung praktisch anwenden möchten.

7. „Data Jujitsu: The Art of Turning Data into Product“ von DJ Patil

Verfasser: DJ Patil
Website: Amazon

Wenn Sie nur eine einzige Person um Rat in Sachen Data Science bitten dürften, wäre der ehemalige Chief Data Scientist des United States Office of Science and Technology Policy – die Behörde, die den US-Präsidenten zur Wissenschafts- und Technologiepolitik berät – sicher nicht der schlechteste Ansprechpartner. DJ Patil gilt als Erfinder des Begriffs „Data Science“, und in „Data Jujitsu“ präsentiert er Data Science als eine Art Problemlösungsmentalität.

Dabei geht er auf verschiedene Problemstellungen in datengesteuerten Branchen ein und betont, dass es einen Unterschied zwischen lediglich schwer lösbaren und wirklich unlösbaren Problemen gibt. Komplexe Probleme lassen sich lösen, indem sie in einfachere Bestandteile zerlegt und diese dann mit Datenanalysemethoden untersucht werden. „Data Jujitsu“ führt zahlreiche Beispiele an und hält Empfehlungen bereit, wie Sie die Macht der Daten für sich nutzen können.

8. „Big Data: A Revolution That Will Transform How We Live, Work, and Think“ von Viktor Mayer-Schönberger und Kenneth Cukier

Verfasser: Viktor Mayer-Schönberger and Kenneth Cukier
Website: Amazon

Das Thema Big Data ist in den Nachrichten mittlerweile ein Dauerbrenner. Datenunternehmen gewinnen immer mehr Einfluss, Hacker vergreifen sich an Bank- und Personendaten, politische Debatten toben, und neue Datenschutzgesetze treten in Kraft. Dieses Buch diskutiert die Auswirkungen, die Daten auf nahezu alle Bereiche unseres Lebens haben – im Privat- und Geschäftsleben ebenso wie auf Regierungsebene und in einzelnen Disziplinen der Wissenschaft.

Mayer-Schönberger und Cukier erklären, wie Algorithmen allein durch die Analyse unseres Onlineverhaltens Dinge über uns verraten können, die wir bisher für unser Geheimnis gehalten haben. Online-Einzelhändler können anhand unseres Surfverhaltens Produkte empfehlen oder Kaufmuster vorhersagen, soziale Netzwerke bedienen politische Vorurteile und fungieren als Echokammern. Selbst unser Liebesleben ist betroffen, denn auch Dating-Apps nutzen Daten. Wer versucht, den Strom an personenbezogenen Daten einzudämmen, muss zudem darauf achten, dass seine Daten nicht in die falschen Hände geraten. Dieses Buch behandelt die beängstigenden, faszinierenden oder einfach nur hochinteressanten Methoden, mit denen unsere Daten nicht nur in Zukunft, sondern schon heute unser Leben prägen.

Haftungsausschluss: Die in diesem Artikel vorgestellten Publikationen und die darin enthaltenen Standpunkte geben weder den offiziellen Standpunkt von Tableau wieder, noch zieht Tableau Nutzen daraus. Diese Seite steht in keinerlei Zusammenhang mit Affiliate-Link-Programmen. Dieser Artikel dient ausschließlich Informationszwecken; die oben angeführten Informationen über Produkte und Publikationen werden lediglich zur Verfügung gestellt, um Lesern eigenständige, sachkundige Entscheidungen zur ermöglichen.