3-5 Jul 2013 Villeneuve d'Ascq (Lille) (France)
Wednesday 3
Machine Learning

› 9:30 - 10:00 (30min)
Un nouveau Modèle Autorégressif Vectoriel basé sur les Noyaux à Valeur Opérateur et son application à l'inférence de réseaux
Néhémy Lim  1, 2, *@  , George Michailidis  3  , Cédric Auliac  4@  , Florence D'alché-Buc  2, 5, 6, *@  
1 : Laboratoire Analyse de Données et Intelligence des Systèmes  (LADIS)  -  Website
CEA/ DRT/LIST
bat. 565 CEA Saclay 91191 GIF SUR YVETTE CEDEX -  France
2 : Informatique, Biologie Intégrative et Systèmes Complexes  (IBISC)  -  Website
Université d'Evry-Val d'Essonne : EA4526
23 boulevard de France; 91037 Evry Cedex -  France
3 : Department of Statistics, University of Michigan
4 : Laboratoire Analyse de Données et Intelligences des Systèmes  (LADIS)  -  Website
CEA/ DRT/LIST
bat. 565 CEA Saclay 91191 GIF SUR YVETTE CEDEX -  France
5 : TAO  (INRIA Saclay - Ile de France)  -  Website
Université Paris XI - Paris Sud, CNRS : UMR8623, INRIA
LRI, Bat. 490, Université Paris-Sud, 91405 Orsay Cedex -  France
6 : AMIB  (INRIA Saclay - Ile de France)  -  Website
CNRS : UMR7161, Polytechnique - X, INRIA, Université Paris XI - Paris Sud, CNRS : UMR8623
LIX Route de Saclay 91128 PALAISEAU CEDEX -  France
* : Corresponding author

La rétro-ingénierie de systèmes dynamiques à partir de données de séries temporelles est un problème canonique difficile en fouille de données. Pour réaliser cette tâche d'apprentissage, un certain nombre d'approches principalement fondées sur des modèles linéaires parcimonieux ou sur la causalité de Granger ont été proposées dans la littérature. Cependant, lorsque les dynamiques sont non-linéaires, il n'existe pas de réponse systématique qui tienne compte de la nature du système sous-jacent. Nous introduisons une nouvelle famille de modèles autorégressifs vectoriels basés sur les noyaux à valeur opérateur pour identifier le système dynamique et extraire le réseau cible. De même que dans le cas linéaire, il est essentiel de pouvoir contrôler la parcimonie du modèle. Ce contrôle peut être réalisé à travers l'apprentissage conjoint de la structure du noyau et des vecteurs de base. Pour résoudre cette tâche d'apprentissage, nous proposons un algorithme d'optimisation alterné basé sur des procédures de gradient proximal qui permet d'apprendre à la fois la structure du noyau et les vecteurs de base. Les résultats obtenus sur les réseaux de régulation génique de taille 100 de la compétition DREAM montrent que notre modèle est plus performant que des méthodes existantes. Une autre application du modèle sur des données du climat a permis d'identifier des interactions pertinentes et interprétables entre des facteurs naturels et ceux liés à l'activité humaine, confirmant ainsi la capacité de notre procédure d'apprentissage à extraire des dépendances entre les variables d'état.


Online user: 1