Aller au contenu principal

Gaël Varoquaux : l’IA au service de tous et toutes

Portraits de chercheurs Article publié le 12 mai 2023 , mis à jour le 26 mai 2023

Gaël Varoquaux est chercheur en informatique et responsable de l’équipe-projet Soda au centre Inria de Paris-Saclay. Acteur incontournable dans le domaine de l'intelligence artificielle (IA), il figure parmi les Highly Cited Researchers 2022, les scientifiques dont les publications sont les plus citées par leurs pairs. 

Chercheur accompli dont les travaux ont été précurseurs dans le domaine de l'IA, Gaël Varoquaux est particulièrement réputé pour ceux concernant l'apprentissage statistique. Autre particularité du chercheur reconnue par la communauté : son engagement en faveur des sciences ouvertes et le développement de logiciels libres, notamment à travers le projet Scikit-learn. Très curieux des domaines scientifiques, il interroge constamment les frontières de la science, tout en favorisant la coopération et l'échange entre scientifiques.

 

D’une trajectoire classique à la voie singulière

Après une classe préparatoire scientifique option MathsSup et un cursus à l'ENS Paris, Gaël Varoquaux entame en 2005 un doctorat en physique quantique. Sous la direction du lauréat du prix Nobel de physique 2022, Alain Aspect, les recherches de Gaël Varoquaux se tournent vers le refroidissement d'atomes et l'utilisation de l'interférométrie atomique pour mesurer les champs gravitationnels.
 
C’est à cause des défis logiciels rencontrés durant sa thèse que Gaël Varoquaux passe de la physique quantique au machine learning. Passionné d'informatique, de mathématiques et d'abstraction, il est rapidement attiré par le traitement de données et s'engage au cours de sa thèse dans le développement de logiciels libres, notamment Mayavi, un logiciel de visualisation 3D de données. Après diverses expériences à l'étranger, comme un post-doctorat en Italie en 2007 en physique quantique et un passage au sein de la start-up de calcul scientifique Enthought aux États-Unis en 2008, il rentre en France cette même année pour travailler sur l'imagerie cérébrale en collaboration avec des chercheurs et chercheuses en sciences cognitives de l’équipe Inria Parietal.
 
Très vite, la recherche de sens et la quête d'utilité orientent Gaël Varoquaux vers le machine learning. Son intérêt pour les problèmes de la vie réelle et la santé en sont des illustrations frappantes. Au sein de ses équipes Parietal puis Soda, il développe des outils destinés à faciliter la vie des individus. Il souligne que, pour être véritablement utiles, les questions à traiter doivent aller au-delà des aspects quantitatifs et englober des aspects qualitatifs liés à la qualité de vie.

 

Le problème des rouages de la science

L'importance accordée aux questions qualitatives en recherche est un élément clé pour Gaël Varoquaux. « Je suis persuadé qu'il est possible de mener une démarche scientifique sans recourir à un modèle mécanistique, tout en conservant une approche quantitative grâce à la statistique », explique le chercheur. Un modèle mécanistique décrit les mécanismes sous-jacents d'un phénomène en spécifiant les relations mathématiques entre ses éléments constitutifs. Pour Gaël Varoquaux, il y a une vraie nécessité d'intégrer les sciences humaines et sociales aux recherches en IA, afin de dépasser les limites inhérentes aux chiffres. « Par exemple, si l'on examine les données de prévalence de la Covid-19, l'analyse révèle qu'elles sont influencées par la politique de tests mise en œuvre. C'est similaire dans le cas des sondages, où les gens ont tendance à s'autocensurer. » Au cœur de la réflexion du chercheur se trouve l'idée d'une science non seulement quantitative, mais intégrant les données observationnelles, c’est-à-dire en dehors du cadre d’expérimentation où l’on peut manipuler librement les objets.

 

Artisan de la science ouverte…

Avec le développement de Scikit-Learn en 2010, Gaël Varoquaux et son équipe œuvrent rapidement en faveur de la science ouverte. Cette bibliothèque d’analyse de données en Python, pensée pour des besoins d'imagerie cérébrale, est conçue pour être indépendante de ses possibles domaines d'application. Destinée à un large public, elle facilite l'utilisation des outils statistiques par des personnes moins familiarisées avec ces méthodes. « Notre approche diffère des autres outils qui simplifient tellement les choses qu'elles en deviennent opaques. L'objectif est de s'adresser à des personnes compétentes, mais pressées », précise le chercheur. Le choix du langage de programmation Python est délibéré, car étant ni complexe ni spécifique, ce langage est capable d'atteindre un public étendu.

Une des ambitions fortes de la science ouverte est également l'accès au partage et au stockage des données. Parmi les travaux les plus cités de Gaël Varoquaux figurent notamment des réflexions sur les infrastructures de données. « Nous nous sommes battus pour faciliter le partage et le stockage public des données », insiste l’intéressé. À la tête de l'équipe Soda au centre Inria de Paris-Saclay, il travaille à l'intersection entre l'informatique, les statistiques, les sciences humaines et sociales, et la santé. Ses recherches actuelles portent sur le traitement de données complexes en santé publique. Les projets futurs exploreront l'adaptation de l'IA et du deep learning aux données tabulaires, des avancées qui pourraient avoir un impact significatif sur les décisions individuelles et collectives en matière de santé.


 
… et défenseur d’une science libre et juste

Réaliste et modeste, Gaël Varoquaux regrette que trop souvent l’attention en science se focalise sur des personnalités, alors que les connaissances acquises sur un sujet se construisent essentiellement en équipe. Pour lui, la science s'appuie avant tout sur la force du collectif, les échanges et l'entraide. Le chercheur insiste sur la nécessité de reconnaître davantage les jeunes chercheurs et chercheuses pour leurs contributions et le besoin de distribuer de manière plus équitable les financements, afin de soutenir des projets atypiques et novateurs. « Il est essentiel d'éviter de n'accorder des ressources qu'à celles et ceux qui ont déjà réussi ou sont dans la norme. Il faut aussi soutenir les projets, même insolites, qui cherchent à réaliser quelque chose d'intéressant. Il est crucial pour la recherche de ne pas se contenter de financer des projets comme Scikit-learn, par exemple », conclut le chercheur.

 

Gaël Varoquaux