L'intérêt pour la data science a explosé ces dernières années. Ce domaine, qui paraissait encore hier relativement abstrait, est aujourd'hui au centre des discussions notamment sur les médias sociaux. Il trouve des applications aussi bien en politique que dans le domaine du droit international. La connaissance des données est aujourd'hui une compétence très recherchée dans tous les secteurs. Chaque jour, nous créons des points de données qui viennent alimenter des systèmes de BI à grande échelle.
Vous souhaitez vous tenir informé sur l'évolution du monde des données ? Vous vous lancez dans le domaine de la data science ? Vous cherchez à développer vos connaissances ? Quel que soit votre objectif, vous trouverez dans cet article une liste de livres destinés aux débutants pour découvrir ce secteur.
1. « The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists » par Carl Shan, William Chen, Henry Wang et Max Song
Auteurs : Carl Shan, William Chen, Henry Wang et Max Song
Site : The Data Science Handbook | Amazon
Souvent, le meilleur moyen de s'informer est d'écouter les experts. Et il n'y a pas de meilleure façon de développer ses connaissances qu'en discutant avec 25 des plus grands experts du secteur ! « The Data Science Handbook » est une compilation d'entretiens avec de nombreux data scientists éminents, de l'ancien Chief Data Officer des États-Unis aux responsables d'équipes dans de grandes entreprises, en passant par les étoiles montantes du secteur qui créent leurs propres programmes. L'idée est de proposer un aperçu unique sur la data science.
Dans ces différentes interviews, les débutants trouveront des conseils, des enseignements tirés d'erreurs et des stratégies de développement de carrière pour les aider à réussir dans l'univers de la data science. Ce livre n'explore pas les aspects techniques de la data science et n'a pas vocation à servir de guide exhaustif sur ce thème, mais propose plutôt un ensemble de conseils pratiques et éclairés.
2. « Doing Data Science: Straight Talk from the Frontline » par Cathy O'Neil et Rachel Schutt
Auteurs : Cathy O'Neil et Rachel Schutt
Site : O'Reilly | Amazon
« Doing Data Science » va droit au but. Il se base sur le cours d'introduction à la data science de l'Université de Columbia, et est destiné aux débutants qui souhaitent découvrir le sujet. Cathy O'Neil, consultante en data science, a travaillé avec Rachel Schutt, enseignante, pour proposer le contenu de ce cours au grand public.
Ces expertes proposent des cours informatifs sur le sujet, ainsi que des études de cas pertinents et des extraits de code, pour présenter des exemples accessibles. Ce livre constitue une ressource technique de choix en abordant algorithmes, méthodes, modèles et visualisation de données.
3. « Numsense! Data Science for the Layman: No Math Added » par Annalyn Ng et Kenneth Soo
Auteurs : Annalyn Ng et Kenneth Soo
Site : Amazon
En raison de ses nombreux points communs avec les mathématiques, la data science peut paraître inaccessible et compliquée. Ce livre sert d'introduction à la data science et aux algorithmes. En employant des termes simples sans approfondir le côté « mathématique », il rend le sujet moins intimidant et plus facile à comprendre.
Chaque chapitre est dédié à un algorithme spécifique et utile, dont il explique le fonctionnement à l'aide d'exemples concrets. Les nombreux éléments visuels facilitent également la compréhension, des fiches de référence listent les avantages et inconvénients de chaque algorithme et un glossaire utile récapitule la terminologie importante en data science.
4. « The Art of Data Science » par Roger D. Peng et Elizabeth Matsui
Auteurs : Roger D. Peng et Elizabeth Matsui
Site : Amazon
Ce livre aborde l'exploration des lacs de données et la recherche d'informations. Il se focalise sur le processus d'analyse et de filtrage des données pour y découvrir des informations inédites. Les auteurs s'appuient sur leurs expériences pour aider aussi bien les débutants que les managers dans leurs projets d'analyse.
Tous deux ont déjà géré de nombreux projets et encadré des équipes d'analystes dans le monde professionnel. Ils expliquent comment produire des résultats véritablement pertinents et présentent les pièges à éviter dans des projets data.
5. « Data Science For Dummies » par Lillian Pierson
Auteur : Lillian Pierson
Site : Amazon
La série de guides « pour les nuls » est connue pour expliquer les moindres concepts en termes simples, et ce livre sur la data science ne déroge pas à la règle. Il se focalise sur le côté métier de la data science et sert de guide d'introduction pour devenir professionnel dans le domaine. Il donne aux débutants un aperçu complet de la discipline, pour leur permettre de se familiariser avec les concepts du Big Data et avec les applications de la data science dans notre quotidien.
Il explore également de manière assez large des domaines comme le data engineering, les langages de programmation comme R et Python, le machine learning, les algorithmes, l'IA et les techniques de visualisation des données. Ce livre est un bon point de départ si vous éprouvez de la curiosité pour la data science ou si vous souhaitez avoir un aperçu de cette discipline.
6. « Big Data For Dummies » par Judith Hurwitz, Alan Nugent, Fern Halper et Marcia Kaufman
Auteurs : Judith Hurwitz, Alan Nugent, Fern Halper et Marcia Kaufman
Site : Amazon
Toujours dans la série de guides « pour les nuls », voici un livre qui présente le Big Data et son importance. Ce livre pose une question essentielle : qu'est-ce que le Big Data ? Pour y répondre, il présente ce concept d'un point de vue technique et métier. Il explique comment le Big Data est utilisé en BI et comment il permet aux analystes de faire des découvertes et de résoudre des problématiques.
Il donne également des conseils techniques sur la manière d'organiser et de gérer les données que vous collectez, ainsi que sur la façon d'adapter les méthodes et outils pour analyser vos données. « Big Data for Dummies » vous aide à comprendre le sens de vos données et à leur trouver une application dans votre environnement métier.
7. « Data Jujitsu: The Art of Turning Data into Product » par DJ Patil
Auteur : DJ Patil
Site : Amazon
S'il y a une personne à qui demander conseil sur la data science, c'est bien à DJ Patil, ancien Chief Data Scientist de l'Office of Science and Technology Policy des États-Unis. En effet, c'est à lui que l'on attribue l'expression « data science ». Dans ce livre, il présente cette discipline sous l'angle de la résolution de problématiques.
Il expose les différents défis rencontrés par les secteurs qui s'appuient sur les données, et souligne la différence entre les problèmes qui sont juste difficiles à résoudre et ceux qui sont impossibles à résoudre. Pour résoudre un problème complexe, il est possible de le décomposer en parties simplifiées, puis d'examiner chacune de ces parties à l'aide de l'analyse de données. Ce livre présente plusieurs exemples et donne des conseils pour apprendre à maîtriser la puissance des données.
8. « Big Data: A Revolution That Will Transform How We Live, Work, and Think » par Viktor Mayer-Schönberger et Kenneth Cukier
Auteur : Viktor Mayer-Schönberger et Kenneth Cukier
Site : Amazon
Le Big Data est au cœur de toutes les conversations. La montée en puissance des entreprises qui misent sur leurs données, les fuites de données personnelles et bancaires de plus en plus fréquentes, le débat sur l'utilisation des données et l'encadrement de la confidentialité des données sont autant de thèmes qui s'y rapportent. Ce livre aborde les effets des données sur tous les aspects de notre quotidien, sur le plan professionnel comme sur le plan personnel, voire même dans le secteur public et dans les différentes disciplines scientifiques.
Les auteurs expliquent comment les algorithmes mettent en lumière des informations insoupçonnées, simplement en analysant notre comportement en ligne. Les revendeurs en ligne peuvent recommander des produits ou prédire des tendances d'achats en fonction des données de navigation, tandis que les flux des médias sociaux ciblent nos affinités politiques et s'adaptent en conséquence. Même les applications de rencontres s'appuient sur les données pour modeler notre vie affective. Alors que nous prenons des mesures pour limiter le volume de données personnelles collectées, nous devons veiller à ce que ces données ne tombent pas entre de mauvaises mains. Ce livre aborde toutes les manières, à la fois utiles et effrayantes, dont les données façonnent notre quotidien.
Avis de non-responsabilité : Tableau ne soutient pas les produits présentés et les opinions formulées, et n'en tire aucun profit. De ce fait, cette page ne fait partie d'aucun programme d'affiliation. Le présent article est proposé dans un objectif pédagogique, et les informations sur les produits et les publications sont fournies pour aider les utilisateurs à prendre des décisions en connaissance de cause.