7 conseils pour maîtriser le Big Data
Le Big Data continue de prendre de l'ampleur et devient plus utile. Certaines entreprises hébergeaient des données avant même d'être en mesure de gérer le Big Data, et elles en récoltent les bénéfices aujourd'hui.
En réalité, le Big Data ne cesse de croître. Que vos données se trouvent dans une feuille de calcul, une base de données, un entrepôt de données, des systèmes de fichiers open source tels que Hadoop, ou tout cela à la fois, vous devez pouvoir vous y connecter rapidement et les consolider. Peu importe la quantité, l'important est de collecter vos données, mais surtout d'en tirer profit.
Ce livre blanc vous explique par où commencer. Voici les sept meilleures pratiques qui vous aideront à aborder le Big Data et à exploiter tout ce potentiel.
Nous vous proposons ici quelques pages extraites du début du livre blanc. Téléchargez le PDF pour lire la suite.
Contre toute attente, le Big Data a encore gagné du terrain. Quel que soit le volume réel qu'il représente, son intérêt est évident. Partout dans le monde, les entreprises disposent de telles données, quelles qu'en soient la forme et la taille. Elles ont conscience de leur importance, de l'opportunité qu'elles représentent et même de la nécessité de leur porter une attention particulière. À l'évidence, le Big Data survivra à ceux qui l'ignorent.
Les entreprises qui ont déjà apprivoisé le Big Data, c'est-à-dire la masse multi-structurée qu'elles stockaient avant d'en connaître la valeur, optimisent leur efficacité opérationnelle, la croissance de leur chiffre d'affaires et la mise en place de leurs nouveaux modèles d'entreprise.
Comment procèdent-elles ? Leurs techniques fructueuses peuvent être résumées en sept conseils.
1. Prévoir à long terme en réfléchissant à court terme
Vous n'êtes pas seul à vous préoccuper de l'évolution des technologies liées au Big Data. Tout change si rapidement qu'il est impossible de connaître les outils, les plates-formes et les méthodologies qui seront à l'œuvre l'année prochaine.
Détendez-vous. Vous pouvez parfaitement vous adapter à cette évolution rapide.
Chaque année, les fournisseurs maîtrisent de mieux en mieux le Big Data. Les systèmes relationnels et de traitement transactionnel en ligne (OLTP) deviennent plus efficaces et plus intelligents, qu'ils soient utilisés sur site ou dans le cloud. Les dernières avancées techniques facilitent l'interfaçage entre Hadoop et les entrepôts de données. Et de nouveaux produits apparaissent constamment sur le marché, répondant toujours plus précisément à vos besoins.
Inutile, donc, de vous inquiéter. Restez à l'écoute des possibilités offertes par ces nouveaux produits s'ils sont suffisamment bénéfiques pour justifier leur intégration à votre environnement actuel. Conservez une plate-forme d'aide à la décision permettant de se connecter à de nombreux formats différents. Vous serez alors préparé à tout ce que le marché peut produire.
2. Détecter les fausses interrogations
Votre entreprise a-t-elle besoin d'Hadoop ou d'un entrepôt de données ? C'est une question piège. Non seulement Hadoop et les entrepôts de données fonctionnent parfaitement en parallèle, mais les entreprises profitent même des capacités de collaboration de ces systèmes.
L'entrepôt de données convient mieux pour gérer vos données importantes et structurées, et pour les stocker là où vos outils BI et vos tableaux de bord peuvent les trouver facilement. Cette solution sera toutefois moins efficace et plus lente pour le traitement analytique et d'autres types de transformation.
Utilisez plutôt Hadoop. De plus, bien qu'Hadoop soit peu adapté aux requêtes interactives et à la gestion des données, il excelle dans l'intégration des données brutes, non structurées et complexes.
Ensemble, ces systèmes fonctionnent en symbiose. Prenons par exemple les données sur lesquelles s'appuient vos dirigeants lorsqu'ils dressent la liste de leurs besoins pour l'année à venir. Cet ensemble de données est probablement gigantesque et vous n'avez pas assez de temps pour le modéliser, le restructurer ou le préparer d'une manière ou d'une autre avant de l'intégrer à votre entrepôt de données. Lorsqu'ils auront terminé, parfois au bout d'une semaine seulement, les dirigeants s'en débarrasseront. C'est à ce moment précis qu'Hadoop intervient pour stocker et affiner ces données, avant d'en envoyer un échantillon dans l'entrepôt de données.
« Le Big Data ne remplace pas le stockage dans un entrepôt de données », déclare Mark Madsen, PDG de Third Nature, dans son article « What Big Data is Really About » (La vérité sur le Big Data). « Ce n'est pas non plus quelque chose à gérer séparément. Ces données font partie du nouvel environnement IT. »
Ne tombez pas dans le piège, vous n'avez pas à choisir entre Hadoop et l'entrepôt de données. Vous pouvez et devez utiliser ces deux ressources.
3. Rendre le Big Data perceptible
Le Big Data devient perceptible lorsque vous pouvez afficher ces données graphiquement. Selon un rapport d'Aberdeen Group établi en 2013, « dans les entreprises qui utilisent des outils d'exploration visuelle, 48 % des utilisateurs de solutions BI sont capables de trouver les informations dont ils ont besoin sans solliciter l'IT ». Sans l'exploration visuelle, ce taux chute à 23 % seulement.
Cette étude montre également que les responsables ayant recours à l'exploration visuelle des données ont 28 % de chances supplémentaires de trouver rapidement des informations que leurs collègues qui n'utilisent pas d'outils visuels.
Il y a un point sans doute capital en matière de Big Data : le rapport précise que la visualisation encourage aussi l'interaction avec les données. Les responsables qui manipulent des visualisations de données sont plus de deux fois plus enclins (33 % contre 15 %) à interagir énormément avec celles-ci. Ils sont, en outre, plus susceptibles de poser des questions spontanément, souvent inspirées par des découvertes faites quelques instants auparavant.
L'exploration visuelle permet de laisser les données s'exprimer pleinement, d'une manière que le cerveau peut comprendre instantanément. « C'est comme un éclair de génie », commente Dana Zuber, vice-présidente de la planification stratégique chez Wells Fargo. « Il est tout simplement impossible d'obtenir le même résultat avec une feuille de calcul. »
L'analyse visuelle vous permet d'effectuer deux actions à tout moment :
- Changer les données que vous visualisez, car des questions différentes nécessitent souvent d'autres données.
- Changer votre façon de les observer, car chaque vue peut fournir des réponses à différentes questions.
Grâce à ces étapes simples, vous entrez dans ce que l'on appelle le « cycle de l'analyse visuelle » : obtenir des données, visualiser ces données, poser des questions et trouver des réponses, et ainsi de suite. À chaque nouveau cycle, vos questions se précisent en fonction des informations que vous obtenez. Vous pouvez explorer les données dans toutes les directions, en descendant ou en remontant dans la hiérarchie, ou transversalement. Vous pouvez également intégrer de nouvelles données. Vous pouvez créer plusieurs vues successives, à mesure que vos visualisations accélèrent et développent votre réflexion.
Lorsque vous êtes prêt, vous n'avez plus qu'à partager vos découvertes. Vos collaborateurs posent leurs propres questions et trouvent les réponses, ce qui améliore la perception, la réactivité et les résultats de toute votre équipe.