Information auxiliaire non paramétrique : géometrie de l'information, processus empirique et applications - Université Toulouse 1 Capitole Accéder directement au contenu
Thèse Année : 2022

Nonparametric auxiliary information : information geometry, empirical process and applications

Information auxiliaire non paramétrique : géometrie de l'information, processus empirique et applications

Résumé

The first aim of this thesis was to develop a method for the optimal use of auxiliary information, i.e. information external to the observed statistical experiment. Thus we propose to search for the discrete probability measure that has as support the sample verifying the auxiliary information and that is the closest to the empirical measure in the sense of the information geometry. We prove that there are two solutions to this problem and we show that there is also a common approximation of these two solutions allowing to define the informed empirical measure. Subsequently, we study the properties of this informed empirical measure by establishing non-asymptotic concentration and asymptotic results of the P-Glivenko-Cantelli and P-Donsker type. The major consequence of accurate information is the uniform decrease in the asymptotic variance of the empirical process. The second aim of this thesis was to generalize the empirical informed measure to so-called weak auxiliary information (e.g. expert preference). After generalizing the empirical informed measure to these weak auxiliary information, we establish asymptotic results of the type P-Glivenko-Cantelli and P-Donsker. The third aim of this thesis was to study the impact of using false auxiliary information and to set up an adaptive procedure to select the relevant auxiliary information for the estimation of a parameter of interest. Finally, we conclude this thesis by proposing applications of the informed empirical measure to various problems in statistics and stochastic simulation (use of auxiliary variables, improvement of the Monte Carlo method, informed maximum likelihood, least squares estimator with auxiliary information, learning, etc). These applications illustrate the positive and relatively immediate impact of auxiliary information.
Le premier objectif de cette thèse a été de développer une méthode d'injection optimale d'une information auxiliaire c'est à dire une information extérieure à l'expérience statistique observée. Ainsi nous proposons de rechercher la mesure de probabilité discrète ayant pour support l'échantillon vérifiant l'information auxiliaire et qui soit la plus proche de la mesure empirique au sens de la géométrie de l'information. Nous prouvons qu'il existe deux solutions à ce problème et nous montrons qu'il existe aussi une approximation commune explicite et facilement calculable de ces deux solutions. Nous la définissons comme étant la mesure empirique informée. Par la suite, nous étudions les propriétés de cette mesure empirique informée en établissant des résultats non asymptotiques de concentration et asymptotique du type P-Glivenko-Cantelli et P-Donsker. La conséquence majeure d'une information exacte est la diminution uniforme de la variance asymptotique du processus empirique. Le deuxième objectif de cette thèse a été de généraliser la mesure empirique informée à des informations auxiliaires dites faibles (préférence d'un expert par exemple). Après avoir généralisé la mesure empirique informée à ces informations auxiliaires faibles, nous lui étendons des résultats asymptotiques du type P-Glivenko-Cantelli et P-Donsker. Le troisième objectif de cette thèse a été d'étudier l'impact de l'utilisation d'une information auxiliaire fausse et de mettre en place une procédure adaptative permettant de sélectionner les informations auxiliaires pertinentes pour l'estimation d'un paramètre d'intérêt. Enfin nous terminons cette thèse en proposant des applications de la mesure empirique informée à des problèmes variés issus de la statistique et de la simulation stochastique (utilisation de variables auxiliaires, amélioration de la méthode de Monte-Carlo, maximum de vraisemblance informé, moindres carrés avec informations auxiliaires, apprentissage etc). Ces applications illustrent l'impact positif et relativement immédiat d'une information auxiliaire.
Fichier principal
Vignette du fichier
2022TOU30096b.pdf (1.79 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03783626 , version 1 (22-09-2022)

Identifiants

  • HAL Id : tel-03783626 , version 1

Citer

Sofiane Arradi-Alaoui. Information auxiliaire non paramétrique : géometrie de l'information, processus empirique et applications. Théorie de l'information [cs.IT]. Université Paul Sabatier - Toulouse III, 2022. Français. ⟨NNT : 2022TOU30096⟩. ⟨tel-03783626⟩
48 Consultations
67 Téléchargements

Partager

Gmail Facebook X LinkedIn More