Stage master 2 : exploration base de données graphe pour données de génomique comparative
Référence
1511343867
Date limite pour postuler
31/12/2017
Date de publication
22/11/2017

Caractéristiques

Précision sur la nature du contrat
Stage
Durée du contrat
6 mois
Date de début de contrat
08/01/2018

Rémunération
Selon barème en vigueur
Domaine professionnel
Informatique, statistiques et calcul scientifique

Affectation

Nom de l'unité d'affectation
UR1164 URGI Unité de Recherche Génomique-Info
Adresse de l'unité d'affectation
INRA Versailles - route de Saint-Cyr RD 10 78026 VERSAILLES CEDEX
Site web de l'unité d'affectation
https://urgi.versailles.inra.fr/
Région de l'unite d'affectation
Ile-de-France

Descriptif

Environnement de travail

Le/la stagiaire recruté(e) travaillera au sein de l'unité URGI (https://urgi.versailles.inra.fr/) du centre INRA de Versailles. Cette unité de recherche en bio-informatique du département de Biologie et Amélioration des Plantes travaille sur l'intégration de données (équipe SI, système d’information) et l'analyse des génomes (équipe Anagen). Composée de 20 à 25 de personnes, elle héberge une plateforme bio-informatique d'envergure nationale (intégrée dans l'infrastructure nationale RENABI-IFB) et internationale (intégrée dans l'infrastructure européenne ELIXIR et coordonnant le système d'information de la Wheat Initiative). Elle centralise, intègre et analyse les données de génomique, de génétique et de phénomique des plantes d'intérêt agronomique, assure le développement et l'exploitation d'un système d'information et de pipelines d'analyses de données hauts débits.

L'équipe SI a développé depuis 2011 l'outil SyntenyViewer valorisé dans plusieurs publications (https://urgi.versailles.inra.fr/synteny/synteny/viewer.do) qui permet de visualiser des résultats de génomique comparative et évolutive entre espèces de plantes (céréales et dicotylédones). L'outil a évolué au fil du temps afin de présenter d'autres types de données (QTL, couverture en éléments transposables, publications) et doit intégrer à terme des informations génétiques (données QTL, GWAS, SNP), génomiques (domaines fonctionnels, données d'expression, bibliographiques) disponibles dans les archives internationales (EBI, InterPro, NCBI) et dans les bases de données de partenaires.

 

Missions

Afin de faciliter les mises à jour récurrentes de jeux de données visualisés dans SyntenyViewer, le/la stagiaire recruté(e) devra contribuer à une évaluation de l'intérêt et des conséquences pour le système d'information GnpIS d'évoluer d'une gestion des données en modèle relationnel (implémenté dans une base PostgreSQL) vers un modèle graphe, plus souple et plus à même de représenter la richesse des relations entre les données.

Il/elle aura ainsi à réaliser un travail exploratoire sur l'utilisation d'un modèle de données graphe et d'outils de visualisation de graphe pour préparer une refonte de l'outil mieux adaptée au volume et à la variété des données à mettre en relation.

 

Environnement dans lequel le/la stagiaire évoluera : 

Le/la stagiaire recruté(e) travaillera dans l'équipe SI, pratiquant des méthodes agiles (Scrum, intégration continue, TDD), dans le cadre d'un projet Institut Carnot Plant2Pro (http://www.instituts-carnot.eu/fr/institut-carnot/plant2pro) au sein duquel l'URGI aura en charge l'évolution de l'outil SyntenyViewer. Il/elle sera donc également amené à réfléchir et présenter son travail dans un cadre large incluant des biologistes, spécialistes en génomique comparative.

Il/elle aura accès à un environnement informatique diversifié incluant: Java, Shell, web services, PostgreSQL, Neo4J, Talend, Elasticsearch, SolR.

Formations et compétences attendues

Stage Master 2 - Curiosité pour les nouvelles technologies. Goût pour le travail en équipe. Connaissance de l’environnement GNU/Linux.

Contact

Nom
Raphaël Flores
Email
raphael.flores@inra.fr