2026-02-24
Des chercheurs américains montrent que des outils capables de générer du code à partir d’instructions en langage naturel peuvent construire des modèles prédictifs fiables en un temps record. Cette accélération pourrait réduire l’un des principaux freins de la science des données et rapprocher plus vite les analyses des applications cliniques.
Dans les laboratoires, l’analyse des données reste souvent l’étape la plus longue et la plus laborieuse. Entre le nettoyage des fichiers, l’écriture du code et les tests successifs, des mois peuvent s’écouler avant d’obtenir des résultats exploitables. Une nouvelle expérience menée sur des données de grossesse montre pourtant que ce rythme pourrait bientôt changer. Grâce à des outils d’intelligence artificielle capables de générer du code et de construire des modèles prédictifs, certaines tâches autrefois réservées à des équipes spécialisées ont été réalisées en un temps record.
Pour mesurer concrètement l’impact de ces outils, des chercheurs de l’Université de Californie à San Francisco et de Wayne State University ont organisé une comparaison directe. Des équipes humaines et des systèmes d’intelligence artificielle ont reçu la même mission, construire des modèles capables de prédire le risque de naissance prématurée à partir de données issues de plus de 1 000 grossesses.
L’un des résultats les plus frappants concerne la génération du code. Là où des programmeurs expérimentés auraient eu besoin de plusieurs heures, voire de plusieurs jours, certains systèmes ont produit des scripts fonctionnels en quelques minutes seulement. Cette automatisation a permis d’enchaîner rapidement les tests et d’affiner les modèles sans mobiliser de grandes équipes techniques.
Même un duo composé d’un étudiant en master et d’un lycéen a réussi à produire des modèles viables avec l’aide de l’IA. Libérés des contraintes techniques, ils ont pu vérifier leurs résultats et soumettre leurs travaux à une revue scientifique en quelques mois. Selon les chercheurs, ces outils pourraient lever l’un des principaux goulets d’étranglement de la science des données, la construction des pipelines d’analyse, comme le rapporte SciTechDaily.
L’expérience ne reposait pas sur un simple exercice théorique. La naissance prématurée constitue la première cause de mortalité néonatale et une source majeure de troubles moteurs et cognitifs à long terme chez l’enfant. Aux États-Unis, près de 1 000 bébés naissent prématurément chaque jour, ce qui rend la mise au point d’outils prédictifs particulièrement urgente.
Pour identifier des signaux précoces, les chercheurs ont rassemblé des données microbiologiques issues d’environ 1 200 femmes enceintes, collectées dans neuf études distinctes. Ce type d’approche collaborative repose sur le partage massif de données et sur l’analyse de volumes d’informations que les méthodes classiques peinent à exploiter efficacement.
Avant l’arrivée de l’IA, plus de 100 équipes internationales avaient déjà travaillé sur ces jeux de données dans le cadre des compétitions DREAM. Si la plupart avaient réussi à produire des modèles en trois mois, la compilation des résultats et leur publication avaient ensuite nécessité près de deux ans. D’après Eurekalert, l’écart entre la production scientifique et sa diffusion illustre le poids des contraintes techniques dans la recherche biomédicale.
Dans un second temps, les chercheurs ont demandé à huit systèmes d’intelligence artificielle de construire des modèles à partir des mêmes données, sans assistance humaine pour la programmation. Quatre d’entre eux ont généré des codes exploitables et leurs performances se sont révélées comparables à celles des meilleures équipes humaines, voire supérieures dans certains cas.
L’ensemble du projet, de la conception à la soumission de l’article scientifique, a été réalisé en seulement six mois. Ce gain de temps pourrait transformer la pratique quotidienne des chercheurs, en leur permettant de consacrer moins d’énergie au débogage et davantage à l’interprétation des résultats et à la formulation de nouvelles hypothèses.
Les travaux montrent également que ces modèles peuvent égaler les performances obtenues lors des défis internationaux de référence. Une analyse complémentaire indique que certains grands modèles de langage réussissent à générer des pipelines complets en R ou en Python et atteignent des niveaux comparables aux meilleures équipes du challenge.
Les chercheurs restent toutefois prudents. Tous les systèmes testés n’ont pas fonctionné et certains peuvent produire des résultats erronés ou incohérents. L’expertise humaine reste indispensable pour formuler les bonnes questions, vérifier la validité des analyses et éviter les interprétations trompeuses. Mais en automatisant les étapes les plus techniques, l’IA générative en recherche médicale pourrait accélérer considérablement le passage des données brutes aux découvertes utiles pour les patients.
Partagez sur vos réseaux sociaux :