Thèse : Statistique appliquée à l ’épidémiologie moléculaire (h/f)
Référence
1496996851
Date limite pour postuler
30/06/2017
Date de publication
09/06/2017

Caractéristiques

Précision sur la nature du contrat
Contrat de thèse
Durée du contrat
3 ans
Date de début de contrat
01/10/2017

Affectation

Nom de l'unité d'affectation
Biostatistique et Processus Spatiaux (BioSP)
Adresse de l'unité d'affectation
INRA - Domaine Saint-Paul - Site Agroparc - 84914 AVIGNON CEDEX 9
Région de l'unite d'affectation
Provence-Alpes-Côte d'Azur

Descriptif

Environnement de travail

Résumé :

Les virus sont la cause d'épidémies à fort impact dans les pays développés et en voie de développement. Pour de tels pathogènes, inférer les liens de transmission au sein d'une population hôte permet de bâtir des modèles épidémiologiques et concevoir des stratégies de lutte. Dans cette optique, pour les pathogènes à évolution rapide, l'analyse statistique de données de séquençage du pathogène permet d'identifier les hôtes qui contiennent des variants du pathogène proches les uns des autres et donc d’inférer « qui a infecté qui ». Cependant, les modèles existants ont principalement exploité une quantité limitée de données de séquençage, telles que les séquences consensus, alors que les méthodes de séquençage haut-débit peuvent fournir plus d’information en révélant le polymorphisme intra-hôte des populations de pathogènes.

 

Le doctorant développera une approche de modélisation et de statistique qui exploitera les données de séquençage haut-débit pour inférer les liens de transmission de maladies infectieuses causées par des pathogènes à évolution rapide. Cette approche nécessitera de mobiliser plusieurs outils de la statistique et des mathématiques appliquées (estimateurs à noyaux, estimation de paramètres, sélection de modèles, algorithmes numériques, processus spatiaux de points, réduction de la dimension, analyse de données massives, modélisation des dynamiques virales) dont certains seront acquis au cours de la thèse.

Le doctorant travaillera au sein de l’unité de recherche BioSP, et dans le cadre du projet ANR SMITID qui regroupe une dizaine de scientifiques. BioSP mène des recherches en statistique et mathématiques autour de questions en écologie, épidémiologie et sciences du climat. BioSP est une unité de l’INRA, qui est l’un des plus importants instituts de recherche d’Europe (www.inra.fr).

 

Pour les candidats actuellement en master 2, la thèse pourra être précédée d’un stage. Dans ce cas, les candidats doivent se manifester le plus rapidement possible (avant la période de stage).

 

Publications récentes des encadrants, en lien direct avec le sujet de la thèse :

Mollentze N., Nel L. H., Townsend S., le Roux K., Hampson K., Haydon D. T., Soubeyrand S. (2014). A Bayesian approach for inferringthe dynamics of partially observed endemic infectious diseases from space-time-genetic data. Proceedings of the Royal Society B 281:20133251.

Morelli M. J., Thébaud G., Chadoeuf J., King, D. P., Haydon D. T., Soubeyrand S. (2012). A Bayesian inference framework to reconstruct transmission trees using epidemiological and genetic data. PLOS Computational Biology 8(11): e1002768.

Richard J. Orton, Caroline F. Wright, Marco J. Morelli, Nicholas Juleff, Gaël Thébaud, Nick J. Knowles, Begoña Valdazo-González, David J. Paton, Donald P. King, Daniel T. Haydon (2013) Observing micro-evolutionary processes of viral populations at multiple scales. Phil. Trans. Roy. Soc. B 368: 20120203.
Soubeyrand S (2016). Construction of semi-Markov genetic-space-time SEIR models and inference. Journal de la SFDS 157: 129-152.

Valdazo-Gonzalez B, Kim JT, Soubeyrand S, Wadsworth J, Knowles NJ, Haydon DT, King DP (2015). The impact of within-herd genetic variation upon inferred transmission trees for foot-and-mouth disease virus. Infection, Genetics and Evolution 32: 440-448.

Wright CF, Morelli MJ, Thébaud G et al. (2011). Beyond the consensus: dissecting within-host viral population diversity of foot-and-mouth disease virus by using next-generation genome sequencing. J. Virology 85: 2266-2275.

Formations et compétences attendues

Formation et compétences souhaitées: statistique (estimation de paramètres, statistique non-paramétrique, analyse de données), mathématique appliquée, ou tout autre cursus intégrant une formation solide en statistique et modélisation ; programmation sous R, Matlab ou logiciel équivalent, intérêt pour les questions d’épidémiologie, d’écologie ou de biologie évolutive, bon niveau en anglais, aisance dans le travail d’équipe.

 

Unité de Recherche d’accueil: Biostatistique et Processus Spatiaux (BioSP) – www.biosp.org

 

 

Encadrement et contact:

  • Samuel Soubeyrand (Avignon, samuel.soubeyrand@inra.fr – samuel.biosp.org ) 
  • Gaël Thébaud (Montpellier, gael.thebaud@inra.fr – http://umr-bgpi.cirad.fr/annuaire-detail-thebaud.htm )

Financement de la thèse: Projet SMITID (Méthodes Statistiques pour Inférer les Transmissions de Maladies Infectieuses à partir de Données de Séquençage Haut-Débit) financé par l’Agence Nationale de la Recherche (ANR) sur la période 2016-2021.

Contact

Nom
Samuel Soubeyrand / Gaël Thébaud
Email
samuel.soubeyrand@inra.fr;gael.thebaud@inra.fr