présentation du projet de mission professionnelle
DESCRIPTION
Arnaud Felten – M2.1 Bioinfo. Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes. Présentation du projet de mission professionnelle. Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis . Mardi 27 Mars 2012. - PowerPoint PPT PresentationTRANSCRIPT
1
Présentation du projet de mission professionnelle
Conception et réalisation d’un environnement logiciel pour l’exploration
et l’analyse phylogénétique des microbiomes
Mardi 27 Mars 2012
Encadrant : Catherine Dauga
Tuteur universitaire : Josselin Bodilis
Arnaud Felten – M2.1 Bioinfo
2
Objectifs
Janvier 2012
① Comparer la performance des technologies 454 et Illumina pour le séquençage de microbiome
② Evaluer différentes méthodes d’analyses : logiciel et banque Proportion d’artefacts et de chimères Proportion des OTUs rares Qualité de l’identification taxonomique Efficacité du filtrage
③ Concevoir une stratégie d’analyse des microbiomes utilisant les meilleurs outils testés et leurs paramètres intégrés dans un système de Workflow
3
Méthodologie
pblastall Best hit
ptaxoptimizer
Serveur
Seq 16S
Syntheticdata
traitement des résultats et représentations graphiques
Optimisation du fichier de sortie tabulation taxonomique
script
script
NCBI/RDPII
Silva/Greengenes
NCBI/RDPII
Silva/Greengenes
Analyse et représentation des données avec R
4
Bibliothèque de fonction
lecture csv dénombrement de la taxonomie calcule sensibilité/spécificité
Script modèle « à trous »
Création d’un script adapté aux données à partir de la technologie et du domaine
utilisé ainsi que de la nature des séquences initiales
Scripts représentations graphiques
histogramme nuage de points (radar plot) ajout des légendes/titres… production d’un PDF
5
pblastall Best hit
ptaxoptimizer
Serveur
Seq 16S
Syntheticdata
script
script
NCBI/RDPII
Silva/Greengenes
NCBI/RDPII
Silva/Greengenes
Automatisation
NGS read simulators :
MetaSim, ART, …
Simulation : “Mono bacteria”
6
Mock communities : “mono bacteria”
Une seule espèce d’un seul genre bactérien
Acinetobacter, Helicobacter, Enterococcus, (Akkermansia)
454 / Illumina ARNr 16S : complet / régions V5-V6
1000 reads par échantillon Temps d’analyse : 1h pour 1 bactérie / 1 technologie / 1 domaine
11/2 semaines pour répétitivité X100 (400 000 BLAST)
Analyse sur la base de données RDP II
7
Analyse « mono-bacteria » 454/illumina
8
Analyse « mono-bacteria »V5-V6/full length
Simulation “multi-phyla”
9
Plusieurs espèces d’un ou plusieurs phyla Protéobacteria, Firmicutes, Bacteroidetes, Actinobacteria, Fusabacteria
454 / Illumina ARNr 16S : complet / régions V5-V6 (V4)
5 000 reads
Mock communities
10
Bases de données ARNr 16S
16S Microbial SSURef
Mothur
SSURef Ref Souche type
RDPII
BLAST2011
10.28
10.28
11/11
05/11
108
11
Analyse « multi-phyla » 454
12
Analyse « multi-phyla »Illumina
Analyse « multi-phyla »Rapport faux positifs et NA sur correctement identifiés
13
Simulations “microbiote cryptes souris”
14
Plusieurs espèces venant d’un même phylum Proteobacteria,
454 / IlluminaARNr 16S : complet / régions V5-V6 (V4)
Mock communities
50 000 reads
Composition microbiote cryptes souris (données réelles)
15
Pseudomodales
Composition et phylogénie des données synthétiques
16
90%
0,5%
0,5%
2,5%
2,5%
2,5%
1,5%
Analyse des résultats de la simulation crypte souris454
17
Analyse des résultats de la simulation crypte sourisIllumina
18
Analyse des résultats de la simulation crypte sourisIdentification à l’espèce
19
Perspectives à court et moyen terme
20
Simulation et analyse crypte souris : Firmicutes
Simulation d’un microbiote complet de souris 37 bactéries provenant de 5 phyla
Génération de données avec ART et évaluation des méthodes de filtrage (qualité)
Evaluation des détecteurs de chimères sur les données réelles
Autres méthodes (MEGAN, RDP classifier)
Analyse des séquences :
Analyse des OTUs :
Uclust, QUIME, Mothur, TreePhyler, ARB
Poursuite des simulations de données: