CeRePP recrute des participants
pour son étude PROGENE...
en savoir plus
  

CeRePP communique les derniers
résultats de ses recherches
cliquer ici
  
 
English presentation
 
 

 

  

 

 

 

Prédiction et intelligence artificielle

La variabilité inter-individuelle en médecine

Une grande variabilité inter-individuelle entrave l’établissement de lois générales utilisables en médecine prédictive. Les traits quantitatifs et la survenue de nombreuses affections sont régies par des règles complexes d’interactions entre des facteurs génétiques et environnementaux. L’observateur perçoit l’existence de facteurs influents mais ne parvient pas à les organiser. En autorisant l’usage d’algorithmes de modélisation relativement complexes, les techniques d’apprentissage statistique permettent de séparer l’information utile et généralisable de la variabilité naturelle des données.

Intelligence artificielle et apprentissage statistique en médecine

Les réseaux de neurones (comme le perceptron multicouches) sont une famille d’algorithmes largement utilisés en apprentissage statistique, en particulier, pour des problèmes d’apprentissage supervisé. Dans une première phase d’apprentissage, on soumet aux modèles des cas clairement étiquetés (exemple: malades, sains) et toutes les variables d’entrée que l’on pense être pertinentes (exemple: âge, antécédents, poids, dosages biologiques….) mais dont l’influence n’est pas clairement établie (quel poids donner aux variables d’entrée ?). Le réseau de neurones se comporte, dans cet exemple, comme un “étudiant en médecine” qui apprendrait à reconnaître des personnes à risque en consultant un nombre suffisant de dossiers. Les règles qu’il établit sont complexes et sans doute non linéaires. Pourvu qu’elles soient pertinentes, les variables d’entrée utilisées peuvent être très nombreuses. Dans une deuxième phase, dite phase de test, on montre quelques nouveaux cas aux réseaux de neurones et on mesure leurs performances. Lorsque les modèles arrivent à reconnaître les malades avec une performance satisfaisante, on estime qu’ils ont trouvé une règle liant les variables d’entrée et la décision attendue. On peut ensuite les sauvegarder et les utiliser dans un logiciel de dépistage pour traiter de nouveaux cas, similaires à ceux que le réseau aura traité au cours de son apprentissage.

Autres techniques de modélisation prédictive en médecine

Les réseaux de neurones ne sont qu’un sous-ensemble des algorithmes d’apprentissage statistique. Des algorithmes bien connus du monde médical, comme la régression logistique, les nomogrammes (qui peuvent être vus comme une version simplifiée du perceptron multicouches), et les réseaux bayesiens, ont leur place dans le monde des algorithmes d’apprentissage. Les performances des modèles et les indications des médecins guident le choix des ingénieurs dans leur recherche du meilleur outil et dans la sélection de nouvelles variables. Ainsi, si on possède une bonne connaissance a priori d’un phénomène, on pourra préférer l’utilisation d’un modèle bayesien construit sur cette connaissance. Si, au contraire, on estime n’avoir aucune connaissance a priori du phénomène ni des interactions possibles entre les variables d’entrée, un perceptron multicouches pourrait se révéler un choix acceptable avant d’en savoir plus.

Limites de l’apprentissage statistique en médecine prédictive

En pratique, toute la difficulté de l’apprentissage statistique en médecine prédictive réside dans la qualité des informations disponibles plus que dans la complexité des phénomènes étudiés. L’étiquetage des patients utilisés en apprentissage doit être fiable or une personne saine peut aussi être un patient dont la maladie n’a pas encore été détectée. De même, certaines variables influentes peuvent ne pas être connues ou être noyées dans un flot de variables d’entrée sans influence majeure mais qui peuvent perturber la phase d’apprentissage du modèle. La variabilité individuelle signe de complexité ou fruit du hasard ? L’existence d’une forme de «bruit de fond» dans le processus étudié n’est pas systématiquement rédhibitoire dans l’usage d’algorithmes d’apprentissage qui sont conçus pour «faire la part des choses».