XVIe Journées de Géostatistiques
7 & 8 septembre 2023 à Fontainebleau
Appel à contribution :
« Un nouvel estimateur des niveaux de densité utilisant les complexes simpliciaux. Application à la détection des clusters de galaxies ».
Par Louis Hauseux, Centre Inria d'Université Côte d'Azur, Sophia-Antipolis. Encadré par Konstantin Avrachenkov et Josiane Zerubia.
Thématiques abordées : grands jeux de données spatiales ; estimateurs de densité ; clusterisation ; complexes simpliciaux ; percolation.
Les galaxies ne se répartissent pas uniformément au sein de l'univers mais se regroupent au sein de « structures à grandes échelles » : 1° des super-amas de galaxies (volumes hyper-denses de ℝ³) ; 2° des feuillets ou « murs » de galaxies (surfaces) ; 3° des « filaments » de galaxies (courbes). Ces différents clusters délimitent de grandes régions quasiment vides de galaxies.
Pour identifier ces différentes structures à partir du nuage de galaxies (vues comme des points de ℝ³), il est assez naturel d'utiliser des estimateurs de densité. Par exemple celui des k-Plus-Proches-Voisins. De façon plus adaptée au problème précis des clusters de galaxies (hiérarchiques à la fois en termes de dimension et de densité), d'autres estimateurs ont été proposés, construits à partir de la triangulation de Delaunay ou du diagramme de Voronoï.
Quant à nous, nous nous proposons de construire des complexes simpliciaux sur l'ensemble des galaxies (les complexes simpliciaux sont une généralisation des graphes permettant de modéliser des interactions entre plus de deux points). Ces complexes dépendent d'un rayon r ; en le faisant varier, on voit apparaître autour de certains rayons critiques de grandes composantes – c'est le phénomène de percolation.
Là est le point clef : à partir de contraintes locales (sur le rayon r), la percolation s'observe de façon macroscopique : c'est le moment précis où l'on voit apparaître des macro-structures. Contrairement aux estimateurs précédents qui n'avaient qu'une vue locale, jouer avec la percolation permet d'avoir un regard plus ample sur les données.
De plus, la percolation est un phénomène rapide ; cette propriété est très intéressante pour bien distinguer deux zones voisines à densités différentes : la percolation sera terminée sur la zone à forte densité avant d'avoir commencé sur la zone à faible densité.
L'intérêt de recourir aux complexes simpliciaux plutôt qu'à de simples graphes géométriques est double : 1° la vitesse de percolation des complexes est plus rapide, permettant ainsi une meilleure identification de différents clusters voisins ; 2° un graphe (vu dans l'espace comme une courbe avec des branchements) permet naturellement de modéliser des « filaments » de galaxies, pas des « murs » ou des super-amas ; les complexes simpliciaux (et leur réalisation géométrique), de dimensions plus élevées, s'y prêtent mieux.
- Poster