Changer de langue :   English version   Version française  

jdhp.org

Cette page contient mes articles de recherche rédigés en français. La plupart de mes travaux de recherche sont rédigés en anglais et sont disponibles ici.

D'autres articles écrits en anglais sont disponibles ici.


Liste de mes publications académiques: PDF, HTML, BibTex.

Mes publications scientifiques sont également disponibles sur HAL - Inria (archive ouverte).

Contenu

Thèse de doctorat en Informatique  

L'hybridation de méthodes d'optimisation dynamique  

Dans ce manuscrit de thèse, mes travaux portent sur la comparaison et la combinaison de méthodes pour la prise de décision séquentielle (plusieurs étapes de décision corrélées) dans des environnements complexes et incertains. Ces travaux ont été exercés dans le cadre d'un partenariat ("Inria Innovation Lab") entre l'équipe TAO (LRI-Inria) et l'entreprise Artelys, spécialisée dans l'optimisation de systèmes complexes. Les méthodes mises au point sont essentiellement appliquées à des problèmes de gestion et de production d'électricité ("unit commitment") tels que l'optimisation de la gestion des stocks d'énergie (réservoirs d'eau dans les centrales hydrauliques, etc.) dans un parc de production afin d'anticiper au mieux la fluctuation de la consommation des clients.


Présentée et soutenue publiquement le 28 novembre 2014 à Orsay, France.


Laboratoire : Inria Saclay / LRI (Université Paris-Sud 11).
Directeur de Thèse : Olivier Teytaud.
Rapporteurs : Pierre-Olivier Malaterre et Liva Ralaivola.

Référence:

Jérémie Decock. Hybridization of dynamic optimization methodologies. Theses, Université Paris-Sud, November 2014.

Archive Ouverte : HAL
Télécharger : Manuscrit (PDF)   Présentation (PDF)  

Travaux de recherche rédigés en français  

Apprentissage de politiques efficaces avec XCSF et CEPS  

Nous proposons dans cette contribution une méthode qui permet d'obtenir une politique efficace dans un cadre où l'état et l'action sont continus. Le système contrôlé est un bras à deux degrés de liberté actionné par six muscles. Nous apprenons par démonstration une politique paramétrique avec le système de classeurs xcsf à partir de trajectoires quasi-optimales et nous étudions la capacité d'xcsf à généraliser ce qu'il a appris le long de ces trajectoires sur l'ensemble de l'espace atteignable. De plus, nous montrons qu'une méthode d'optimisation stochastique appelée Cross-Entropy Policy Search permet d'améliorer encore la performance du contrôleur paramétrique.

Référence:

Didier Marin, Jérémie Decock, Lionel Rigoux, and Olivier Sigaud. Apprentissage de politiques efficaces avec XCSF et CEPS. In Sixièmes journées francophones MFI/JFPDA, pages 298-310, Rouen, France, 2011.

Archive Ouverte : HAL
Télécharger : Article (PDF)  

Travaux de recherche rédigés en anglais  

Travaux de recherche rédigés en anglais  

La plupart de mes travaux de recherche sont rédigés en anglais et sont disponibles ici.