Partenaires

CNRS
IN2P3
Sorbonne Universite
Universite de Paris
Initiative Physique des Infinis
UPMC


Rechercher

Sur ce site


Accueil > Thèses, Stages, Formation et Enseignement > Propositions de thèses 2023 > Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques.

Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques.

par Tristan Beau - 19 janvier 2023

Titre : Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques

Directrice/directeur de thèse : Olivier Martineau

Co-encadrant.e : Aurélien Benoit-Levy

Groupe d’accueil :GRAND

Webpage du projet : https://grand.cnrs.fr/

Collaboration : GRAND

Description :

L’utilisation des techniques d’apprentissage profond, notamment à base de réseaux de neurones, a connu un formidable essor ces dernières années dans de nombreux domaines. Toutefois des verrous techniques existent encore, qui empêchent le déploiement de ces modèles pour des applications à haut niveau de criticité. Les réseaux de neurones artificiels représentent des fonctions ayant un très grand nombre de paramètres, à la fois différentiables (donc entraînables) ainsi que fortement non linéaires. Cette dernière propriété leur confère un fort pouvoir de représentation, à l’origine de leur utilisation massive, mais elle implique également que les réseaux de neurones sont, par nature, sensibles à de faibles variations des données d’entrée. Ainsi la question de la détermination des incertitudes sur les prédictions des réseaux de neurones est aujourd’hui l’un des enjeux majeurs en machine learning.

L’objectif de cette thèse est de travailler sur l’utilisation de réseaux de neurones sur graphes, dans l’optique de pouvoir déterminer des quantités physiques et leurs erreurs, à partir des mesures effectuées avec des réseaux de capteurs distribués spatialement. L’utilisation de réseaux de neurones sur graphes (GNN) se prête particulièrement bien à cette problématique dans la mesure où le réseau de capteurs peut être irrégulier, avec ajout ou suppression de capteurs en fonction du temps.

Le cas d’application principal sera le projet GRAND[1], qui vise à déterminer l’origine des rayons cosmiques d’ultra-haute énergie à l’aide d’un réseau de 200 000 antennes radio déployées à l’horizon 2030. Si la construction de cet instrument est prévue pour les années 2030, le déploiement d’un premier prototype de 300 antennes radio, GRANDProto300, est imminent dans le désert du Gansu en Chine et des antennes tests sont d’ores et déjà déployées sur le site du radio-télescope de Nançay (Cher). Celui-ci sera un banc de test idéal pour développer de nouvelles techniques d’analyse, basées sur l’utilisation de méthodes d’apprentissage automatique, et pour investiguer l’origine des rayons cosmiques dans une gamme d’énergie peu étudiée.

Les particules cosmiques induisent dans l’atmosphère des cascades de particules secondaires qui vont générer une émission électromagnétique brève (< 100 ns) que les antennes de GRAND détecteront dans la gamme 50-200 MHz. Il s’agira ainsi, à partir des mesures radio des antennes, de reconstruire les paramètres primaires des particules incidentes (nature, énergie, direction d’arrivée, etc.). Pour estimer ces quantités, il est nécessaire d’exploiter les données de plusieurs antennes qui détectent en coïncidence l’émission radio des particules. Il s’agit ainsi de résoudre un problème inverse par des techniques d’apprentissage machine. Des expériences similaires utilisent déjà des GNN (Choma et al. 2018), mais l’originalité du travail proposé est que les données mesurées sur chaque noeud du graphe seront des séries temporelles.

Le travail envisagé dans cette thèse sera ainsi structuré autour de deux axes :

  • Mise en place et utilisation d’une architecture de type GNN pour la reconstruction
    des paramètres physiques des évènements mesurés par le réseau de capteur de
    GRAND.
  • Quantification des erreurs de prédictions pour cette tâche de régression, et
    extension des méthodes existantes pour déterminer les erreurs et covariance de
    plusieurs paramètres simultanément.

Le doctorant ou la doctorante pourra s’appuyer sur l’expertise en simulation de l’équipe GRAND du Laboratoire de Physique Nucléaire et des Hautes Énergies (CNRS IN2P3) pour générer des jeux de données synthétiques, mais également sur les données de TREND (Ardouin et al. 2011), une expérience passée, précurseuse de GRAND, et sur les données de GRANDProto300. Des simulations seront nécessaires pour entrainer les réseaux de neurones. Toutefois ces simulations sont parfois coûteuses, et il pourra être intéressant d’étudier des approches mixtes AI et simulation.

Les méthodes développées à travers l’étude de ce cas d’application physique seront applicables par la suite à d’autres cas d’usages, par exemple en radio-protection ou en sismologie. L’étudiant(e) sera également associé(e) à la collaboration GRAND et des contacts fréquents avec les équipes de GRAND au LPNHE et à l’Institut d’Astrophysique de Paris auront lieu.

Lieu(x) de travail : LIST (CEA Saclay ) et LPNHE (Paris)

Déplacements éventuels : Etats-Unis (Pennslvania State University)

Stage proposé avant la thèse : Oui

Bourse : Oui (cea)

Important : Thèse déjà pourvue

Facebook

Dans la même rubrique :

Enregistrer au format PDF