Nous sommes en 2016, les entreprises ont enfin arrêtées d’utiliser le terme « Big Data » à outrance, pour le plus grand bonheur des consultants BI du monde entier. Néanmoins, les Data Scientists sont toujours autant chassés sur Linkedin qu’auparavant. Et pour cause, l’émergence du buzzword Big Data à permis de mettre un véritable coup de projecteur sur la complexité de l’analytics. Une démarche qui exige une prise de conscience générale, de la part des entreprises et des individus à pouvoir utiliser la data comme une véritable ressource.

Pour décortiquer ce phénomène, nous avons interviewé notre expert, Jean Pierre-Riehl, à la fois responsable Data & BI chez AZEO, et MVP Data Platform. Le but ? Obtenir son éclairage sur cette situation, qu’il vit au plus près dans son quotidien.

  • Que représente selon toi le concept de Big Data ?

Pour moi, le mot Big Data est un Buzz à 100%, qui a occupé presque l’ensemble éditeurs de logiciels afin de développer une offre Data. Pendant la période de 2011 à 2014, Il y a eu beaucoup de buzz autour de cette première vague Big Data, dans le sens où tous les éditeurs se sont mis à inscrire la mention Big Data sur leurs offres, sans forcément avoir changé quoi que ce soit. C’est pour ça que j’ai une réelle aversion pour le mot Big Data. Toutefois, il est vrai qu’il existe un vrai changement de paradigme dans l’approche sur les données.

Historiquement, la démarche analytique a pour ambition de toujours chercher à trouver les modèles les plus optimums, celui qui prend le moins de place, celui qui est le mieux orchestré… Auparavant la démarche était de collecter la donnée, ne pas vraiment réfléchir à sa structure et voir plus ultérieurement comment on allait l’utiliser. La technologie de l’époque n’était pas en mesure de traiter ces données.

Le vrai paradigme qui a changé l’approche du Big Data est Hadoop. Grâce à cette première vague technologique, nous étions enfin à même de traiter des grands formats de données avec une approche différente. Auparavant, nous aurions eu des problèmes de performances, des problèmes de requête impossible à lancer… Le premier paradigme fût donc technologique plus qu’un simple « Buzzword ». Si les premiers projets étaient avant tout technologiques, il y avait une réelle désillusion quant à la finalité des projets en eux-mêmes.

Néanmoins, je suis moi-même rentré dans le moule et j’utilise le mot Big Data. Je le vois comme un standard de fait, car le mot est porteur de sens et de valeur. Si cela ne peut représenter une technologie ou une façon de faire, cela représente un nouveau paradigme majeur dans notre industrie. L’offre Big Data est maintenant beaucoup plus mûre.

En dehors de la vague technologique, nous sommes rentrées maintenant dans une phase « Analytics », qui s’inscrit dans la continuité et sur le même concept du Big Data. Cette phase propose de chercher à travailler différemment avec la donnée tout en se distinguant des modèles très formatés et très relationnels. Le mot Big Data est donc maintenant porteur de sens pour toute une industrie, et permet à chacun de voir ce qui s’y trouve derrière.

Au final, si je devais donner une définition, cela concernerait la manière d’utiliser la data en se disant « On peut trouver des choses avec des façons de requêter non conventionnelles en utilisant des algorithmes, qui vont extraire une information non triviale et/ou non conventionnelle sur des données ».

Il existe des grands classiques tels que le deep learning, la segmentation, le prédictif… Je vais donc extraire des données mais je ne vais pas extraire leurs valeurs, je vais plutôt extraire leurs valeurs futures à titre d’exemple.

  • Au final, est ce donc une approche vraiment différente ?

Ce qui est intéressant pour les anciens de l’industrie, ce que toutes ces nouvelles méthodes ne sont pas si nouvelles en soi. Ce sont des méthodes qui existent depuis presque 15 ans mais qui ont évoluées et se sont concrétisées grâce à l’arrivée d’un nouveau paradigme : Le Hardware est devenu plus performant, les Framework sont plus accessibles, les langages se sont démocratisés… Tout s’est donc finalement aligné.

Mais le principal révélateur est surement la prise de conscience de professionnels qui se sont dit qu’il y avait une démarche à exploiter, que ce soit de la part des populations techniques mais également de la part des populations métiers. Grâce à la maturité de ces populations, nous entrons donc dans une phase d’extension des outils de Business Intelligence.

Un autre argument que l’on peut avancer est peut-être dût au contexte de mondialisation, il devient plus dur de se différencier pour les entreprises. Il faut savoir mieux vendre. Pour mieux vendre il y a deux solutions : recruter les meilleurs vendeurs ou être plus malins que les autres, et c’est sans doute cette deuxième solution qui « drive » les projets « Data ».

A titre d’exemple, on l’utilise depuis maintenant longtemps des méthodes d’analyse des ventes mais nous sommes uniquement dans une démarche de consulting, nous ne possédons aucune indication sur là où on doit aller. Nous avons donc besoin de plus d’informations, de plus de données afin de nourrir notre vision. Ces nouveaux algorithmes apportent une vision différente des données qui nous permet de récolter plus de données et de construire une vision prédictive.

  • Penses tu que l’industrie est suffisamment mature concernant l’approche Big Data ?

Je pense que la vision de l’approche Big Data est en train de se consolider et de « frémir ». Si l’on reprend les études de Gartner, la « Hype Circle » du Big Data est en chute libre, notamment car il y a eu trop de buzz d’un coup et que l’approche était trop technique.

En 2015, le termes Big Data avait déjà disparu de la Hype Circle pour éclater en plusieurs thématiques.

A mes yeux, la vraie différence, le vrai tournant, c’est les algorithmes, ce que l’on en faits. Sur ce sujet, les métiers semblent reprendre la main avec une nouvelle approche :

« J’ai cassé le mindset que je possédais concernant mon approche classique de la donnée, je suis maintenant à la recherche de nouvelles pistes de réflexions, de nouveaux résultats ». Même si nous ne sommes pas dans un marché mature, la vague semble définitivement derrière.

La maturité des technologies est réelle et une multitude d’éditeurs proposent des offres packagées. De nos jours, un « Proof Of Concept » peut maintenant se matérialiser en une demi-journée, chose qui était impensable il y 5 ans.

Nous sommes désormais dans une phase qui sera forcément plus longue car l’industrie cherche maintenant à répondre à des vrais besoins. Il faut donc une vraie démarche de la part des métiers pour identifier les besoins et réfléchir à une solution data potentielle.

La démarche Big Data se transforme donc pour pouvoir être en mesure de fournir des vrais ROI et des vrais objectifs de transformation. La maturité est progressive mais sera certainement longue à atteindre car c’est une toute nouvelle vision et approche de la donnée qui doit se formaliser au sein des entreprises afin d’obtenir des retours utiles pour les utilisateurs.

  • A ce sujet, que penses tu de la démarche d’appropriation des métiers quant à cette nouvelle approche de la donnée et de ses outils ?

En France, la démarche risque d’être compliquée mais il y a un réel sujet concernant l’enjeu de la « Data-Culture » ou les « Data-Driven Organization ». Ces termes ont été récemment mentionnés par Microsoft et il s’agit de mon sujet de prédilection. Cette vision correspond au fait que pour s’en sortir, les entreprises du futur se devront d’avoir un « mindset » orienté vers la donnée. Une vision que je prône depuis plusieurs années. Une entreprise ou un collaborateur sera plus performant si on a une approche ou on considère les données comme étant une ressource tangible et un outil que l’on va utiliser au quotidien. La donnée doit être appropriée, elle ne doit plus rester inerte dans une base de données.

Toutes données deviennent importantes, la possibilité de pouvoir croiser des informations avec d’autres permet de faire ressortir des pistes de réflexions afin d’amener de la valeur potentielle utile à tous. J’insiste sur le mot « tous », le personnel du bureau ne sera pas le seul à profiter de cette Data-Culture : le personnel de terrain, les ouvriers… La Data permettra potentiellement d’améliorer la manière de travailler pour la majorité des métiers. Il sera néanmoins proportionnel à l’enjeu du métier bien sûr. Néanmoins, tout le monde peut potentiellement améliorer sa productivité, sa performance et son efficacité avec un mindset plus orienté Data.

  • En termes opérationnel, comment conçoit tu cette approche ?

Je pense que les acteurs de niche y seront pour beaucoup dans l’appropriation de cette approche opérationnelle. On étend beaucoup parler de solutions clés en main qu’il suffit de « brancher » pour avoir tout un tas de résultats qualifiés. Ces acteurs ont un rôle à jouer en offrant des solutions packagées car la plupart des métiers n’ont pas encore la prise de conscience nécessaire quant au maniement des outils Big Data. Toutefois, on constate une lame de fond qui se manifeste dans les entreprises. Il s’agit de CDO, pour Chief Data Officer ou Chief Digitalization Officer. Ces derniers, à la différence de la plupart des exécutifs métiers ont le mindset pour entamer et réussir la transformation numérique des entreprises. Leur mission est d’apporter ce mindset aux différents acteurs de l’entreprise.

La révolution est donc enfin en train d’arriver par le haut de la hiérarchie avec des acteurs qui possèdent un réel pouvoir et les moyens de changer les choses. Tous les signes qu’on peut lire dans la presse et les offres d’emploi, montrent qu’il y a vrai intérêt pour ce métier. Il est presque sûr qu’on en parlera bientôt de la même manière que l’on parlait des Data Scientist. Je reste confiant sur la direction de l’industrie pour les 5 prochaines années.

L’éducation a certainement un rôle à jouer sur ce sujet. Les écoles se devront d’instruire un nouveau mindset orienté data. Même si ces juniors ne seront pas opérationnels à la sortie de l’école, à cause des questions budgétaires et techniques, le fait de posséder ce mindset particulier leur permettra de propulser la transformation digitale des entreprises. Les nouveaux responsables métiers de demain posséderont une vision beaucoup plus aboutie de la donnée.

  • Quelles sont selon toi les principales problématiques d’implémentation de cette démarche ?

Pour moi, il existe deux problèmes principaux. Le premier est la qualité des données, qui pourrait sembler être un sujet technique mais qui est au final un sujet métiers également. Comme il n’y a pas de prise en compte de la donnée comme un asset de l’entreprise, le fait de savoir qu’elle soit propre ou bien ordonnée est le cadet des soucis de la plupart des métiers, marketing compris.

Cependant pour réaliser des analyses valables, la donnée se doit d’être de bonne qualité, sous peine de représenter une perte de temps et de valeur pour l’entreprise. A terme, cela peut représenter un vrai manque à gagner pour le futur de l’entreprise. Au final, le besoin de structurer la donnée est réel. Si le sujet est peut-être moins vrai en ce qui concerne le Big Data, il est important d’un point de vue méthodologique afin d’analyser les données.

Le deuxième sujet concerne également les métiers en particulier. Comme les utilisateurs ne sont pas habitués à ce mode de fonctionnement, ils ne sont pas habitués à définir et formaliser leur besoin et leurs questions.

Le manque de culture de la donnée conduit les utilisateurs à définir de mauvais cahier des charges et de mauvais objectifs en ce qui concerne les projets liés à la Data. Pour régler ceci, il convient d’adopter des méthodes de travail agiles, en prenant bien en compte les attentes des utilisateurs finaux.

Dans ce cas précis, l’adoption d’une meilleure Data Culture constitue l’une des clés pour y parvenir. Dans notre métier, nous organisons également de nombreuses sessions entre l’équipe IT et les métiers afin de définir des interviews. La plupart du temps, la qualité de l’intervieweur définira la pertinence des données récoltées. C’est une phase critique du projet qu’il ne faut pas louper sous peine de perdre son temps à tous. En résumé, un projet Data doit donc se doter de plusieurs caractéristiques : beaucoup d’agilité, une appétence à poser les bonnes questions aux utilisateurs ainsi qu’une certaine maturité envers la donnée.

Jean Pierre est responsable de notre division Data & BI chez AZEO, en intervenant comme architecte ou consultant BI. Il participe activement à la vie de l’écosystème Microsoft en tant que Président du GUSS, le Groupe des Utilisateurs francophones SQL Server. Quand il n’est pas en mission ou en conférence aux quatres coins du globe, il communique et partage son actualité Data depuis son blog personnel https://blog.djeepy1.net/ ou sur @djeepy1.

Jean Pierre Riehl