Nina Otter : un parcours distingué en analyse topologique des données

Portrait de chercheur ou chercheuse Article publié le 18 janvier 2024 , mis à jour le 19 janvier 2024

Nina Otter est chercheuse Inria et membre du Laboratoire de mathématiques d'Orsay (LMO – Univ. Paris-Saclay, CNRS). Spécialiste de l’analyse topologique des données, elle crée des ponts entre des domaines mathématiques jusqu'alors distincts, témoignant de l’approche créative et interdisciplinaire de la chercheuse.

Nina Otter débute ses études à l'École polytechnique fédérale de Zurich (ETH) en 2008, initialement en physique, avant de réaliser l'importance des mathématiques pour comprendre des domaines comme l'électrodynamique et la mécanique classique. Elle se réoriente vers les mathématiques et réalise un mémoire d’études sur les courbes elliptiques tropicales. Elle poursuit en master de mathématiques pures et souhaite allier cette expertise avec un engagement envers les enjeux sociétaux. Influencée par les travaux de John Baez sur l'application des mathématiques en biologie, elle le rejoint à l'Université de Californie, où elle rédige en 2014 son mémoire de master. « Étant une des rares femmes dans mon domaine, j’ai dû surmonter mes doutes sur ma capacité à mener une carrière en recherche mathématique, mais les encouragements de John Baez ont été déterminants pour renforcer ma confiance. » Leur collaboration débouche sur une publication sur l'application des méthodes catégoriques en phylogénétique.
Une thèse en analyse topologique des données

En 2018, Nina Otter soutient à l’Université d’Oxford une thèse intitulée Homologie des données, qui porte sur le développement d'outils topologiques pour analyser efficacement des données complexes. Son travail s'articule autour de l’homologie persistante, une méthode pour identifier et quantifier des structures variées comme les clusters ou les lacunes. Ce projet aboutit en 2017 à une publication évaluant et comparant diverses implémentations logicielles de la méthode. « Dans le second volet de ma thèse, j'adapte ces méthodes à des données multiparamétriques, un défi majeur pour les applications concrètes, car cela implique de traiter la complexité et les interactions inhérentes aux ensembles de données réels. » Cette difficulté figure parmi les enjeux majeurs de l'analyse topologique des données, étant donné l'absence d'invariants capables de généraliser l'homologie persistante pour les ensembles de données multiparamétriques. Pour relever ce défi, Nina Otter emploie des techniques d'algèbre commutative afin de concevoir de nouveaux invariants, ce qui contribue à l'enrichissement de l'analyse des structures complexes de données. Elle explore également les connections entre l'homologie persistante et la théorie de la magnitude - introduite en 2010 par le mathématicien Tom Leinster afin de mesurer la taille d'un objet mathématique - pour créer une nouvelle théorie homologique.

Fusion entre analyse topologique des données et apprentissage profond

Après son doctorat, Nina Otter consacre six mois au Max Planck Institute à Leipzig, avant de rejoindre l'Université de Californie à Los Angeles (UCLA) pour un post-doctorat. Elle y explore les interactions potentielles entre l'apprentissage profond et l'analyse topologique des données, un sujet qui captive la communauté scientifique. Son premier projet, réalisé avec un collaborateur, vise à déterminer si une architecture de réseau neuronal est capable d’apprendre à générer des résumés topologiques obtenus par l’homologie persistante, malgré leur complexité non-linéaire. « À ma grande surprise, nous sommes parvenus à former certains réseaux pour qu'ils apprennent ces résumés dans des situations spécifiques. » Cette collaboration s’étend ensuite à d'autres projets avec des scientifiques de l’UCLA, du Max Planck Institute et de l'Université de Cambridge, avec un focus sur l'adaptation des architectures neuronales pour analyser des structures combinatoires plus complexes que les simples relations binaires. Ces initiatives ouvrent de nouvelles perspectives dans l'apprentissage profond géométrique et influencent grandement la modélisation des phénomènes naturels et sociaux, comme celui de la pandémie de COVID-19.

Approfondissement de l’homologie persistante

En juillet 2021, Nina Otter rejoint l'Université Queen Mary de Londres en tant que professeure assistante. Elle s’attèle au projet novateur d’élucider l'efficacité de l’homologie persistante. « Malgré sa présence dominante en analyse topologique des données, cette approche suscite une certaine vigilance dans la communauté scientifique à cause d'un potentiel engouement excessif. » En collaboration avec des collègues de UCLA, elle explore la capacité de cette méthode à résoudre des problèmes analytiques complexes, même dans des tâches jugées auparavant inaccessibles. « Nous avons été ravis de découvrir qu’elle parvient à résoudre des problèmes considérés hors de sa portée. » De nouvelles conclusions théoriques sont établies, notamment celle qui porte sur la capacité à distinguer les formes concaves des convexes. « Contrairement aux méthodes d'apprentissage profond souvent considérées comme des boîtes noires, l’homologie persistante offre une compréhension claire des caractéristiques des données qui influencent les résultats. » Nina Otter envisage d'explorer davantage pourquoi et comment cette méthode fonctionne efficacement pour divers problèmes, s'inspirant des recherches sur l'interprétabilité en apprentissage profond.

Innovation et inclusion en recherche scientifique

En mars 2021, Nina Otter crée DeMoS, une association visant à transformer les méthodes de recherche scientifique pour relever les défis modernes. Cette initiative promeut les approches interdisciplinaires, alliant science et arts, et se concentre sur l'inclusion de chercheurs et chercheuses de divers horizons, notamment ceux généralement exclus du discours scientifique en raison de discriminations linguistiques, géographiques ou sociales.

Des recherches innovantes sur le climat

Motivée par un contexte académique post-Brexit moins favorable pour les scientifiques, la chercheuse rejoint en octobre 2023 l'équipe DataShape d’Inria Saclay, au sein du LMO. « C’est une opportunité idéale pour poursuivre mes recherches car l’équipe est reconnue mondialement dans le domaine de l'analyse topologique des données. » Nina Otter y développe des méthodes avancées pour améliorer la modélisation du climat, afin de fournir une meilleure compréhension et prévision des phénomènes climatiques. Il s’agit d’une nouvelle perspective de modélisation des phénomènes atmosphériques complexes, un sujet jusqu'alors difficile à aborder en raison de l'absence de définitions universelles des régimes météorologiques. Dans cette perspective, Nina Otter explore également la quasi-périodicité du phénomène El Niño. « En plus de la haute dimensionnalité et du bruit inhérent aux données climatiques, la nature changeante de ces données dans le temps présente des défis uniques pour l'analyse topologique. »

Généralisation des méthodes pour l'analyse des réseaux complexes

Nina Otter prévoit de poursuivre ses travaux de recherche initiés durant son post-doctorat en appliquant l'analyse topologique des données à des réseaux sociaux complexes. Son objectif est d'intégrer les relations binaires et d'ordre supérieur, nécessaires pour caractériser les positions et les rôles au sein de ces systèmes. Il s’agit de simplifier la compréhension de ces structures en regroupant les éléments similaires, pour faciliter la révélation de modèles sous-jacents. « Les réseaux sont des outils polyvalents pour modéliser divers phénomènes, y compris les interactions moléculaires, les flux de trafic et même les séries temporelles climatiques. Ce qui offre des perspectives prometteuses pour une meilleure compréhension et analyse de systèmes complexes. »