3-5 Jul 2013 Villeneuve d'Ascq (Lille) (France)

By author > Govaert Gérard

Wednesday 3
Machine Learning

› 12:00 - 12:30 (30min)
Caractérisation topologique d'un jeu de données images avec les nombres de Betti et un modèle génératif
Maxime Maillot  1@  , Michaël Aupetit  1  , Gérard Govaert  2  
1 : CEA LIST
CEA/ DRT/LIST
2 : Heuristique et Diagnostic des Systèmes Complexes  (HEUDIASYC)  -  Website
Université de Technologie de Compiègne, CNRS : UMR7253
Université de Technologie de Compiègne - Centre de Recherches de Royallieu - BP 20529 - 60205 COMPIEGNE cedex -  France

Dans cet article, nous proposons un modèle génératif qui permet d'extraire les nombres de Betti d'un ensemble de variétés de $\mathbb{R}^D$ à partir d'un échantillon. Ce modèle est basé sur le Complexe Simplicial Génératif, un modèle de mélange dont les composantes sont des simplexes géométriques convolués à une distribution gaussienne multivariée. La nouveauté de la méthode consiste à optimiser BIC, un critère statistique de vraisemblance pénalisée, pour obtenir une estimation des invariants topologiques des variétés génératrices des données, les nombres de Betti. Les résultats d'une telle méthode montrent une plus grande robustesse au bruit que ceux d'une méthode fondée sur une approche purement géométrique. Le Complexe Simplicial Génératif est comparé au Witness Complex (WitC) et la persistance homologique sur des données jouet (sphère, tore, bouteille de Klein) et un jeu de données réelles, COIL-100, une base d'images d'objets en rotation.

Dans cet article, nous proposons un mod`ele g ́en ́eratifqui permet d'extraire les nombres de Betti d'un en-semble de vari ́et ́es de RD `a partir d'un ́echantillon. Cemod`ele est bas ́e sur le Complexe Simplicial G ́en ́eratif,un mod`ele de m ́elange dont les composantes sont dessimplexes g ́eom ́etriques convolu ́es `a une distributiongaussienne multivari ́ee. La nouveaut ́e de la m ́ethodeconsiste `a optimiser BIC, un crit`ere statistique devraisemblance p ́enalis ́ee, pour obtenir une estimationdes invariants topologiques des vari ́et ́es g ́en ́eratricesdes donn ́ees, les nombres de Betti. Les r ́esultats d'unetelle m ́ethode montrent une plus grande robustesseau bruit que ceux d'une m ́ethode fond ́ee sur une ap-proche purement g ́eom ́etrique. Le Complexe SimplicialG ́en ́eratif est compar ́e au Witness Complex (WitC)et la persistance homologique sur des donn ́ees jouet(sph`ere, tore, bouteille de Klein) et un jeu de donn ́eesr ́eelles, 


Online user: 1