samedi 14 janvier 2017

Représentations des données

Il y a quelque-chose d'incohérent dans la façon dont on représente les données. On utilise la technique de la carte d'identité : taille, couleur des yeux, endroit de résidence, date de naissance... Or, lorsque l'on parle d'une question, par exemple qui va voter pour qui ?, on place naturellement les individus de la population concernée dans des catégories : les bobos, les fachos, les ménagères de plus de 50 ans, la génération 68, les diplômés, les retraités, les chômeurs, les riches, les 0,01%, les provinciaux, les fonctionnaires, etc. Nous les représentons par leur appartenance à des groupes. On espère ainsi expliquer simplement un phénomène : "les riches votent à droite". Or, ces catégories sont rarement pertinentes. Celles qui le sont sont généralement une représentation hybride. Par exemple, le "bricoleur pro" va poser ses fenêtres, sans assistance. 

Voilà pourquoi l'analyse relationnelle est une manière naturelle de représenter les individus d'une population. Contrairement à celle que l'on emploie. Elle les décrit par leur appartenance à des catégories qui semblent importantes. Puis, à partir de là, elle constitue des groupes que le plus de choses possible rapprochent, et le moins de choses possible éloignent. 

Curieux que l'on n'y ait pas pensé plus tôt.