Les données sont partout... Mais vous le saviez probablement déjà. Après tout, elles sont constamment évoquées dans l'actualité et représentent un domaine professionnel en pleine expansion, sans compter que les compétences data sont de plus en plus recherchées dans tous les secteurs professionnels. Mais la data n'est pas uniquement réservée aux grandes entreprises et vous n'avez pas besoin de collecter des données pour pouvoir les analyser. De nombreux ensembles de données publiques n'attendent qu'à être analysés !
Que vous souhaitiez apprendre à analyser des données, à créer des visualisations ou simplement à améliorer vos compétences data, les ensembles de données publiques constituent un point de départ idéal. Voici quelques excellents ensembles gratuits de données publiques, que vous pouvez commencer à analyser dès aujourd'hui. Si vous avez besoin d'un coup de pouce pour mettre en forme vos découvertes, nous proposons également des blogs à suivre et des exemples de visualisation de données pour vous aider à trouver l'inspiration.
1. Google Trends
Préparé par : Google
Exemple d'ensemble de données : Résultats de recherche pour le terme « Cupcake »
Ces ensembles de données publiques comptent parmi les plus volumineux et les plus intéressants. Le moteur de recherche de Google suit les données des recherches pour rendre compte des types de termes recherchés et de leur évolution dans le temps. Vous pouvez remonter jusqu'à 2004 pour explorer les statistiques quantitatives de presque tous les termes de recherche. Saisissez le ou les termes de votre choix et cliquez sur le bouton de téléchargement pour analyser les données en dehors du site Web de Google Trends.
Les filtres disponibles vous permettent d'affiner les tendances par zone géographique (dans le monde entier ou par pays), par fourchette de temps, par catégorie ou même par type de recherche spécifique (résultats de type Web, image ou YouTube). Vous pouvez facilement identifier les sujets populaires et les tendances du moment sur la page d'accueil de Google Trends. Google y propose également plusieurs exemples intéressants de tendances, accompagnées de visualisations.
Si vous désirez découvrir d'autres données Google, consultez Google Finance, Google Public Data et Google Scholar.
2. Le National Climatic Data Center
Préparé par : National Centers for Environmental Information (anciennement NOAA)
Exemple d'ensemble de données (en anglais) : Données climatologiques locales
Si la météorologie et la climatologie vous intéressent, le Centre américain des données climatologiques (National Climatic Data Center) propose des données détaillées. Les data centers de l'Agence américaine d'observation océanique et atmosphérique (National Oceanic and Atmospheric Administration, ou NOAA) ont été fusionnés suite à des remaniements internes. Ils font aujourd'hui partie des Centres américains des données environnementales (National Centers for Environmental Information, ou NCEI).
Vous y trouverez la plus grande archive mondiale de données environnementales, contenant des ensembles de données climatiques et météorologiques pour l'ensemble du territoire américain. Cette énorme source d'informations comporte toutes sortes de données (météorologiques, océaniques, climatiques, atmosphériques, géophysiques, etc.).
3. Données de l'Observatoire de la santé mondiale
Préparé par : Organisation mondiale de la Santé (OMS)
Exemple d'ensemble de données (en anglais) : Accès universel à la santé reproductive
L'objectif principal de l'Organisation mondiale de la santé est d'améliorer l'information sur la santé à l'échelle internationale. À cet égard, elle met ses données à la disposition du public, par l'intermédiaire de l'Observatoire de la santé mondiale. Celui-ci se présente comme un portail d'accès qui permet d'analyser des conditions sanitaires et des thèmes importants.
Les différents ensembles de données y sont classés par thème : mortalité, systèmes de santé, maladies transmissibles et non transmissibles, médicaments et vaccins, risques sanitaires, etc. Les statistiques de santé de l'OMS constituent une référence en matière de santé mondiale. Elles sont également utilisées par les Centres pour le contrôle et la prévention des maladies aux États-Unis.
4. Data.gov.sg
Préparé par : État de Singapour
Exemple d'ensemble de données (en anglais) : Résidents de Singapour par groupe d'âge, groupe ethnique et sexe, fin juin, annuel (2017)
Il existe de nombreux sites Web de qualité dédiés aux données d'État. La plupart d'entre eux offrent une quantité incroyable de données et d'informations. Les États-Unis possèdent l'un des sites les plus connus, data.gov, mais les sites du Royaume-Uni et de l'Australie sont tout aussi excellents. Combinez ces sites avec de grands échantillons de population, et vous obtenez une énorme quantité de données à analyser. Pourquoi donc choisir Singapour ?
Tout simplement parce que le site de Singapour offre des données d'État remarquablement accessibles d'un point de vue visuel. Sa page d'accueil regorge de petites visualisations qui racontent une histoire pour chaque ensemble de données. La visualisation des données ne consiste pas simplement à afficher les informations d'une façon précise et pertinente. Il faut également savoir les rendre intéressantes, afin de capter l'attention du public. La plupart des sites dédiés aux données d'État sont purement fonctionnels et se contentent d'offrir des données facilement compréhensibles. Singapour a choisi au contraire de présenter des visualisations et des graphiques aux couleurs vibrantes, tout en encourageant les lecteurs à explorer des ensembles de données similaires.
5. Earthdata
Préparé par : NASA
Exemple d'ensemble de données (en anglais) : Électricité atmosphérique (éclairs)
Earthdata fait partie du Programme des systèmes de données des sciences terrestres de la NASA, et plus particulièrement du Système de données et d'informations du Système d'observation de la Terre (Earth Observing System Data and Information System, ou EOSDIS). EOSDIS est un système de traitement et de diffusion des données scientifiques terrestres provenant de satellites, d'avions et de mesures sur le terrain.
Grâce à Earthdata, les données, l'actualité et les évènements de la NASA sont mis à la disposition du public. Les données proposées portent sur l'atmosphère terrestre, le rayonnement solaire, la cryosphère (zones arctiques/gelées), les océans, la surface terrestre (gravité, géomagnétisme, tectonique, etc.) et les environnements humains.
6. Registre des données ouvertes d'Amazon Web Services
Préparé par : Amazon
Exemple d'ensemble de données (en anglais) : Projet 1000 Genomes
De plus en plus d'organisations mettent leurs données à la disposition du public. Amazon a décidé de créer un registre pour faciliter la recherche et le partage de différents ensembles de données. Le registre d'Amazon inclut une cinquantaine d'ensembles de données publiques, allant des déclarations fiscales américaines (IRS) aux images satellites de la NASA, en passant par le séquençage de l'ADN et l'exploration Web. Les ensembles de données incluent également des exemples de visualisation réalisés par d'autres organisations ou groupes.
7. Pew Internet
Préparé par : Pew Research Center
Exemple d'ensemble de données (en anglais) : Adolescents, médias sociaux et technologies en 2018
La mission du Pew Research Center est de collecter et d'analyser des données provenant du monde entier. Les domaines couverts sont variés : politique, médias sociaux, journalisme, économie, confidentialité en ligne, religion, tendances démographiques, etc. Le centre publie ses propres études et analyses impartiales, mais met également les données brutes à la disposition du public. Pour y avoir accès, il suffit de s'inscrire sur le site, de créditer le Pew Research Center comme source des données et de mentionner que le centre n'est pas tenu responsable des conclusions tirées de ces données.
Dans un certain sens, le partage des données est un projet de recherche en soi. Les équipes du Pew Research Center savent en effet déjà comment les données sont employées dans le cadre de leurs propres projets, et s'intéressent aujourd'hui à leur utilisation par d'autres parties. Notez que le centre demande à recevoir un avis par e-mail si les données téléchargées donnent lieu à une publication.