Il y a quelques temps, j'ai découvert le terme "data driven". C'est peut-être une innovation majeure. Jusqu'ici l'analyse de données partait d'hypothèses, de modèles. Les hommes des Lumières semblent avoir cru que le monde obéissait à des lois que l'esprit humain pouvait saisir. Ensuite, c'était à l'expérience de mettre au point le modèle. "Hypothesis driven" semble partager cette idée.
Avec le "data driven", pas d'hypothèse. Le "data driven" repère des anomalies sans que vous n'ayez rien à lui dire. Et cela a un bénéfice colossal : c'est le changement. Hypothesis driven ne voit pas apparaître la nouveauté. Or, c'est elle qui a, de loin, le plus de valeur. Car c'est le changement qui nous fait et nous défait. Comme disait Maurice Lévy, de Publicis: les modes viennent des marges. (Ainsi que les Macron ou les de Gaulle !)
Malheureusement, peu de logiciels sont data driven. Déjà, selon les "datas" que vous mettez dans l'algorithme, il vous "drivera" d'un côté ou d'un autre. Ensuite, les dits datas ne représentent pas la réalité, mais un échantillonnage de celle-ci. (Par exemple l'atmosphère d'un jour d'été ne se ramène pas à la mesure de la température et de l'hygrométrie en un point donné.) Enfin, j'ai de plus en plus l'impression que les algorithmes font des hypothèses plus ou moins bien cachées. (La structure de l'algorithme, elle-même, tend à biaiser le résultat.)
J'en suis arrivé à penser qu'une forme de data driven est possible. A condition de renoncer à l'algorithme "boîte noire" (ou "non interprétable"). En effet, la collaboration entre l'homme et la machine permet de naviguer dans un monde de données incomplètes. L'algorithme cherche les anomalies, l'homme leur cherche une interprétation, qu'il teste ensuite. Curieusement, il est encore question d'hypothèse. Peut-être est-ce la façon de penser de l'homme ? Mais l'hypothèse n'est pas première, elle résulte de l'analyse.
Aucun commentaire:
Enregistrer un commentaire