APPLICATIONS DE LA STATISTIQUE EN SCIENCES DU VIVANT
C. Larédo, Laboratoire MIA, INRA,78350 Jouy-en-Josas.
Tout au long de ce cours, nous utiliserons des modèles plus ou moins complexes pour décrire la dynamique de populations stochastiques en Ecologie, Epidémiologie, Génétique des populations ou pour l’analyse de séquences d’ADN.
Ces modèles sont un outil fondamental de la démarche statistique :
ils ont pour mission de fournir une description satisfaisante du phénomène étudié tant pour la compréhension des processus biologiques impliqués que pour la prédiction.
Souvent, il n’existe pas de bon modèle qui s’impose naturellement, tandis que les méthodes sont définies pour un modèle et leurs propriétés démontées par rapport à lui.
Nous étudierons dans ce cours plusieurs modélisations d’un même phénomène et comparerons leurs propriétés.
Chaines de Markov à temps discret ou temps continu.
Notations et rappels: générateur, premières propriétés.
Chaines de Markov en Epidémiologie: modèle de Greenwood, de Reed-Frost, modèle SIR en population fermée.
Modèles d’évolution en Génétique des populations: modèles de Wright-Fisher avec sélection et mutation, modèle de Moran à K allèles.
Processus de branchements unitypes ou multitypes: modèles de croissance de populations cellulaires, modèle de survie de gènes mutants.
Modèle statistique, famille d’expériences
Notations et rappels: générateur, premières propriétés.
Chaine canonique: construction, définition de la loi du processus.
Vraisemblances et contrastes.
Consistance des estimateurs de maximum de vraisemblance (MV) ou minimum de contraste (MC).
Application aux exemples précédents
Estimation des paramètres de sélection et mutation dans les modèles de Wright-Fisher.
Estimation des paramètres (taux de transmission et de guérison) dans le modèle SIR.
Estimation des transitions d’une chaine de Markov en espace d’états finis.
Application à l’analyse de séquences d’ADN.
Vitesses de convergence et lois limites des estimateurs.
Martingales à temps discret: rappels; T.C.L. pour les martingales.
Lois limites des estimateurs de maximum de vraisemblance ou de minimum de contraste.
Estimation des paramètres (alpha,gamma) de l’AR(1): Xi = aXi−1 + εi où les εi sont indépendantes, centrés de variance γ2
Retour aux exemples du chapitre I
Statistique des processus de branchements
Rappels probabilistes et exemples.
Estimation de la loi de reproduction.
Etude de la croissance de populations cellulaires.
Modèles de diffusion
Approximation diffusion des chaines de Markov.
Application au modèle de Wright-Fisher, au modèle de Moran à K-allèles et au modèle SIR.
Estimation des paramètres de ces diffusions.
Comparaison avec les estimateurs précédents.