Pourquoi l'apprentissage automatique est-il à la mode dans la recherche médicale mais pas dans les cabinets de nos médecins ?
MaisonMaison > Nouvelles > Pourquoi l'apprentissage automatique est-il à la mode dans la recherche médicale mais pas dans les cabinets de nos médecins ?

Pourquoi l'apprentissage automatique est-il à la mode dans la recherche médicale mais pas dans les cabinets de nos médecins ?

Jul 22, 2023

Technologie scientifique

L'apprentissage automatique (ML) programme les ordinateurs pour qu'ils apprennent comme nous le faisons, grâce à l'évaluation continue des données et à l'identification de modèles basés sur les résultats passés. Le ML peut identifier rapidement les tendances dans les grands ensembles de données, fonctionner avec peu ou pas d'interaction humaine et améliorer ses prédictions au fil du temps. En raison de ces capacités, il trouve rapidement sa place dans la recherche médicale.

Les personnes atteintes d'un cancer du sein pourraient bientôt être diagnostiquées par le ML plus rapidement que par une biopsie. Le ML peut également aider les personnes paralysées à retrouver leur autonomie en utilisant des prothèses contrôlées par des modèles identifiés dans les données d'analyse cérébrale. La recherche ML promet ces possibilités et bien d'autres pour aider les gens à mener une vie plus saine. Mais alors que le nombre d'études sur le ML augmente, son utilisation réelle dans les cabinets de médecins ne s'est pas développée.

Les limites résident dans la petite taille des échantillons de la recherche médicale et dans les ensembles de données uniques. Ces petites données empêchent les machines d'identifier des modèles significatifs. Plus il y a de données, plus les diagnostics et les prédictions de ML sont précis. Pour de nombreuses utilisations diagnostiques, un nombre massif de sujets par milliers serait nécessaire, mais la plupart des études utilisent des nombres plus petits dans les dizaines de sujets.

Mais il existe des moyens de trouver des résultats significatifs à partir de petits ensembles de données si vous savez comment manipuler les chiffres. L'exécution de tests statistiques maintes et maintes fois avec différents sous-ensembles de vos données peut indiquer une signification dans un ensemble de données qui, en réalité, peut n'être que des valeurs aberrantes aléatoires.

Cette tactique, connue sous le nom de P-hacking ou feature hacking en ML, conduit à la création de modèles prédictifs trop limités pour être utiles dans le monde réel. Ce qui semble bon sur papier ne se traduit pas par la capacité d'un médecin à nous diagnostiquer ou à nous traiter. Ces erreurs statistiques, souvent commises sans le savoir, peuvent conduire à des conclusions dangereuses.

Pour aider les scientifiques à éviter ces erreurs et à faire avancer les applications ML, Konrad Kording, professeur à l'Université Penn Integrates Knowledge, a été nommé au département de neurosciences de la Perelman School of Medicine et aux départements de bioingénierie et d'informatique et des sciences de l'information de la School of Ingénierie et sciences appliquées, dirige un aspect d'un vaste programme financé par les NIH connu sous le nom de CENTER - Création d'un lien éducatif pour la formation à la rigueur expérimentale. Kording dirigera la cohorte de Penn en créant la Communauté pour la rigueur, qui fournira des ressources en libre accès sur la conduite d'une science solide. Les membres de cette communauté scientifique inclusive pourront participer à des simulations ML et à des cours basés sur la discussion.

"La raison du manque de ML dans les scénarios du monde réel est due à une mauvaise utilisation statistique plutôt qu'aux limites de l'outil lui-même", explique Kording. "Si une étude publie une affirmation qui semble trop belle pour être vraie, c'est généralement le cas, et nous pouvons souvent remonter à leur utilisation des statistiques."

Pour faire des progrès significatifs dans le domaine du ML dans la recherche biomédicale, il sera nécessaire de sensibiliser à ces problèmes, d'aider les chercheurs à comprendre comment les identifier et les limiter, et de créer une culture plus forte autour de la rigueur scientifique dans la communauté de la recherche.

Kording vise à communiquer que ce n'est pas parce que l'intégration de l'apprentissage automatique dans la recherche biomédicale peut introduire une marge de partialité que les scientifiques doivent l'éviter. Ils ont juste besoin de comprendre comment l'utiliser de manière significative.

La Communauté pour la rigueur vise à relever les défis du domaine avec des plans spécifiques pour créer un module sur l'apprentissage automatique dans la recherche biomédicale qui guidera les participants à travers des ensembles de données et des tests statistiques et identifiera les endroits exacts où les biais sont couramment introduits.

Cette histoire est de Melissa Pappas. En savoir plus sur Penn Engineering Today.