Pages

lundi 11 mai 2020

Le virus et le mathématicien

Un mathématicien, professeur de statistiques, répond à un de mes billets. Un peu long, mais très intéressant.
Pour ce qui est de ta question sous tendue par la phrase : corona virus : le waterloo de l’IA ? Je trouve effectivement que c’est le moment de se la poser,  même si insister sur ce point avec le terme de "waterloo"  est  certes un peu caricatural mais c’est là une critique nécessaire, car elle montre les écueils  classiques  de l’IA, c’est-à-dire avoir beaucoup de données validées,  pour au minimum fonctionner dans des conditions acceptables.
Or dans le cas du coronavirus, les données ne sont pas centralisées au niveau mondial, d’où des collectes de données incomplètes, parcellaires ou erronées. De plus, la connaissance par le milieu médical des vrais paramètres clefs concernant le Covid19 est très très partielle, car ces paramètres sont hyper changeants et surtout ce changement se produit tous les jours(*)  d’une école  de santé à l’autre, d’une expérimentation à l’autre. Ceci obère fâcheusement  le fait de faire apprendre par un moteur d’I.A  type réseau de neurones, les possibles  évolutions des malades atteints, en particulier quand on a une mauvaises connaissance des situations finales possibles,  ça revient à de l'apprentissage supervisé  (le seul qui marche vraiment en IA d’ailleurs) pour lequel on n'a malheureusement pas les configurations potentielles finales sûres  et validées à atteindre.
D’où ce sentiment factuel (pour l’instant) que l’approche I.A. pure n’a pas donné des résultats probants. Seuls les mathématiques via les modèles épidémiologiques (fondés sur un système d'équations au dérivées partielles EDP du type : SIR (Susceptibles, Infectés et Retirés (car Guéris)  ou SEIR (plus complet, rajout de l’état d’Exposés), aboutissent à des solutions de types lois de Poisson ou lois exponentielles pondérées (ceci c’est des maths appliquées et rarement de l’I.A.).  Disons que si ces approches ont été parfois  efficaces,  exemple : un modèle du type SIR a assez bien prévu l’évolution de l'épidémie de chikungunya à la Réunion (en particulier la deuxième vague),  malheureusement ce type de prévisions est  en général  soit trop alarmiste (modèle de Neil Ferguson de l’Imperial college de Londres qui prévoyait 300.000 à 500.000 morts en France et qui a paniqué E.Macron), soit  au contraire le modèle est plus près de la réalité mais à condition d’être recalculé  très souvent, ce qui freine un peu l’enthousiasme, car, après tout, ce qu’on attend d’un modèle, c’est de la prévision et pas de la vérification de l’existant. Ceci dit c’est déjà pas mal d’avoir des ordres de grandeur…
Conclusion : quand on connait mal la population que l’on doit analyser  et sur laquelle on doit faire des calculs de prévision ou des modèles,  on a de grandes chances de dire des "conneries". La théorie des sondages, par exemple, nous le dit, si l'on ne peut redresser un sondage par une bonne connaissance de la distribution des strates de cette population, on prédit des sottises (voir prévisions électorales lors de l’élection présidentielle de Eltsine en Russie,  par les instituts français, pourtant réputés : 20% d’erreur, etc.
Dans le cas du Corona virus Covid19, sauf à affiner les connaissances très fluctuantes, on est comme dans le cas de l’élection présidentielle en Russie, quiconque prédit… risque gros pour le moment, mais à la longue on y parviendra avec une certaine précision, qui s’améliorera avec le temps… on fera de la prévision... rétrospective!!.
(*) Par exemple on avait dit que les malades prenant certains médicaments inhibiteurs de l’angiotensine II (des anti hypertension ) étaient plus vulnérables que d’autres dans la phase  dite de l’orage cykotinique, or il se trouve que certains hôpitaux testent cette classe de médicaments qui pourraient être au contraire positifs contre le Coronavirus. De même le Dialtazem un beta bloquant contre l’angine de poitrine donne des résultats très positifs dans la phase aiguë de la maladie, alors qu’il était considéré comme nocif dans une première analyse.   
Je profite d’être en phase d’écriture pour répondre à ta deuxième question, celle sur le  nombre de victimes du Coronavirus égal à 0 au Cambodge.  C’est une excellente question, que je me suis posée  depuis longtemps et qui prouve qu’on ne sait pas tout sur le Coronavirus. Cette question,  on   pourrait  la poser aussi à propos du  Rwanda (0 mort pour  12.000.000  d’habitants), de l'Ethiopie, 5 morts mais pour 108.000.000 d’habitants, du Viet Nam, 0 mort pour 98.000.000 d’habitants etc.). Ces résultats surprenants comparativement à ceux des USA, de l’Italie et de la France, etc. laissent supposer qu’il y a des causes non encore connues  à ce jour pour expliquer cette disparité. En fait il y a certainement de multiples causes dont voici une liste non exhaustive:
  • Le manque immense de connaissances sur l’étiologie des maladies à coronavirus, en général, 
  • La pollution : elle fait partie des bonnes idées qui semblent logiques mais qui  sont infirmées immédiatement : exemple la pollution des grands pays européens et des USA, on pourrait d’ailleurs y ajouter la Chine qui a eu un nombre de morts supérieur à ce qu’elle a annoncé, mais des pays comme le Viet-Nam ou le Cambodge ou Addis Abeba ou Bombay c’est de la pollution à la puissance 2 par rapport à Paris ou Londres et pourtant ces pays ont un faible niveau de morts comparés à leur population. 
  • La Latitude : là il semble qu’il y ait une légère corrélation avec la latitude : Sahel nord de l’Equateur + Inde + Amerique Centrale,  Afrique des lacs, versus USA/ EUROPE. Certes pas absolue mais intéressante : peu de morts au Sahel: (Sénégal, Mali, Niger, Nigéria, Cameroun, RCA, etc., Soudan.) Ethiopie, Yemen,  en Inde en Birmanie  en Thailande, au Zaire, etc. ? Oui mais quid de la Turquie, de l'Iran, du Brésil : des exceptions qui confirment  la règle? 
  • La densité, là encore ça semble une bonne idée : Paris, Londres, New York, Philadelphie, Madrid, Milan, Turin Barcelone, Bruxelles, Istanbul, etc. sont des villes super denses mais alors quid de Bombay, Calcutta, de Ho Chi Minh Ville, Hanoï, de Taipeh, ou Seoul. La densité ne suffit pas pour expliquer la mortalité  ou alors appuyée par une autre  caractéristique : la distanciation et l’hygiène ?
  • Les mesures de distanciation et de protection (masques, distances et propreté) et respect fort de ces consignes. Les pays qui ont totalisé le plus de morts sont des pays où les consignes de port de masque et distanciation n’ont pas été respectées au départ, d’où le confinement. Ces pays un peu livrés au début "au  chacun pour soi", et  gérés selon des directives contradictoires ont réagi un peu plus tard que les pays aux tendances soit autoritaires : Viet Nam, Cambodge, Laos, Chine, Philippines, Birmanie, certains pays d’Amérique Centrale, Rwanda, etc.  Soit au contraire ayant un sens civique  fort et des us et coutumes fondées sur l’hygiène et le respect des consignes  de protection : Corée du Sud, Taiwan, Japon, et à un degré moindre : Hong Kong,  Thaïlande,  . 
  • Enfin les statistiques et leur fiabilité il est évident que si dans nos pays européens ou occidentaux en général, on peut dire que les statistiques sont peu dépendantes  des  circonstances  ou du contexte (quoi que?) ce n’est pas le cas dans certains pays dont la liste est longue. De ce fait certaines statistiques données par l’OMS peuvent être sujettes à caution et au minimum à sévère questionnement. 
  • La présentation de ces statistiques : même dans les pays les plus libéraux et démocratiques on peut néanmoins s’étonner de la présentation brute des chiffres et du manque de nuance et de recul associés. Même chez nous (en France) si on avait présenté les chiffres dans leur contexte diachronique, on aurait eu quelques surprises, voici, ci joint une liste fournie par l’INSEE que m’a envoyée un ami, ça mérite une certaine discussion non ???

Décès enregistrés (recensés) par l’INSEE
  • 1er trimestre 2015 : 172.983;  
  • 1er trimestre 2016 : 159.792;  
  • 1er trimestre 2017 : 173.197
  • 1er trimestre 2018 : 174.67;. 
  • 1er trimestre 2019 : 171.918;  
  • 1er trimestre 2020 : 157.371

Aucun commentaire:

Enregistrer un commentaire