Stage M2 : Classification des micropolluants dans l'environnement : amélioration de l'algorithme online TyPol
Référence
1510816179
Date limite pour postuler
31/12/2017
Date de publication
16/11/2017

Caractéristiques

Précision sur la nature du contrat
Stage
Durée du contrat
4 à 6 mois
Date de début de contrat
05/03/2018

Rémunération
taux légal (environ 554 euros)
Domaine professionnel
Informatique, statistiques et calcul scientifique

Affectation

Nom de l'unité d'affectation
UR0050 LBE Laboratoire de Biotechnologie de l'Environnement
Adresse de l'unité d'affectation
INRA-NARBONNE avenue des Étangs 11100 NARBONNE
Région de l'unite d'affectation
Occitanie

Descriptif

Environnement de travail

Contexte

Dans le cadre d'un projet de recherche INRA sur les micropolluants, les contaminants organiques sont classés non plus par familles chimiques mais selon leurs propriétés (la rétention irréversible, leur transfert vers l'air ou les eaux, leurs effets toxicologiques, etc.). Ce projet a donné lieu à un outil informatique appelé TyPol, basé sur le logiciel RStudio, permettant de réaliser cette classification online sur une base de donn_ees MySQL. Cet outil, qui a été publié (Servien et al., 2014), est basé sur une régression PLS combiné _a une classification hiérarchique. Il permet actuellement de classer plus de 300 molécules (pesticides, composés pharmaceutiques ...) et a été récemment utilisé pour explorer le comportement environnemental de métabolites potentiels de certains pesticides (Storck et al., 2016 ;Benoit et al., 2016).

Mission

Le stagiaire devra analyser les besoins en discutant avec les statisticiens et biologistes de ce projet. En particulier, l'implémentation d'options (visualisation facilitée, comparaison de critères de choix de modèles ...) pour la régression PLS et la classification sera réalisée. L'utilisation de méthodes parcimonieuses, basées sur des estimateurs LASSO et spécialement adaptées à ces bases de données de grande dimension, sera également envisagée. De plus, TyPol est de plus en plus utilisé et touche un public de plus en plus large, principalement des biologistes ne maîtrisant pas forcement le langage informatique ou le logiciel R. Il est également attendu une amélioration substantielle du programme au niveau accessibilité afin de rendre l'interface avec l'utilisateur facilement utilisable. Dans ce but, un passage de TyPol sous l'environnement Galaxy, basé sur le langage de structure XML, pourra être envisagé dans l'esprit de ce qui a déjà été réalisé en Chimiométrie (Rossard et al., 2016). Ce passage se fera également pour des raisons de reproductibilité et de partage des résultats dans le cadre d'une démarche de science collaborative. Cela nécessitera une analyse conceptuelle en vue de la construction des briques de la chaine de traitement des données. Enfin, l'étudiant pourra être co-auteur d'une publication scientifique dans un journal international.

 

Date début de contrat : A partir de février jusqu'en avril

Formations et compétences attendues

Profil recherché

Master 2 en mathématiques appliquées, informatique ou dernière année d'école d'ingénieur ;

Maitrise d'un langage de programmation scientifique (R, Matlab) ;

Bonnes connaissances en statistiques multivariées ;

Aucune connaissance préalable en chimie ou en biologie n'est nécessaire mais un goût pour ce domaine appliqué serait un plus.

 

Bibliographie

1. R. Servien, L. Mamy, Z. Li, V. Rossard, E. Latrille, F. Bessac, D. Patureau and P. Benoit. TyPol – a New Methodology for Organic Pollutants Clustering based on their Molecular Characteristics and Environmental Behavior, Chemosphere (2014), 111, 613-622.

2. V. Storck, L. Lucini, L. Mamy, F. Ferrari, E. S. Papadopoulou, S. Nikolaki, P. A. Karas, R. Servien, D. G. Karpouzas, M. Trevisan, P. Benoit and F. Martin-Laurent. Identi_cation and characterization of tebuconazole transformation products in soil by combining suspect screening and molecular typology, Environmental Pollution (2016), 208 B, 537-545.

3. V. Rossard, J.-C. Boulet, F. Gog_e, E. Latrille et J.-M. Roger. ChemFlow, chemometrics using Galaxy. Presented at Galaxy Community Conference - GCC2016, Bloomington, USA (2016), 5 :1671.

4. P. Benoit, L. Mamy, R. Servien, Z. Li, E. Latrille, V. Rossard, F. Bessac, D. Patureau and F. Martin-Laurent. Categorizing chlordecone potential degradation products to explore their environmental fate, Sciences of the Total Environment (2017), 574, 781-795.

 

Pour postuler envoyer CV et lettre de motivation à eric.latrille@inra.fr ; virginie.rossard@inra.fr ; remi.servien@inra.fr

Date limite de candidature 31 décembre 2017

Contact

Nom
Eric LATRILLE / Virginie ROSSARD / Rémi SERVIEN
Email
eric.latrille@inra.fr;virginie.rossard@inra.fr;remi.servien@inra.fr