anotación automática dante travisany. temas pipeline tools bases de datos conceptos ejemplos...
TRANSCRIPT
![Page 1: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/1.jpg)
Anotación Automática
Dante Travisany
![Page 2: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/2.jpg)
Temas
• Pipeline
• Tools
• Bases de Datos
• Conceptos
• Ejemplos
• Ensembl
![Page 3: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/3.jpg)
Identificación del Problema
• Virus : 15 – 20
• Bacteria 3000 - 5000
• Eucariontes: sobre los 10000
![Page 4: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/4.jpg)
Pipeline
Pipeline• Unix
• Símbolo: |
• Segmentación
![Page 5: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/5.jpg)
Tools• BLAST • InterProScan• AmiGO• Pathway Tools• Infernal• Glimmer• Critica• GeneMark• GeneWise• BedTools• Samtools• GenomicTools• KEGG-API
![Page 6: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/6.jpg)
Base de Datos
BLAST DB Protein-KEGG-PRIAM-SWISSPROT-UNIPROT-NR
BLAST DB Nucleotide- NT- REFSEQ- RDP
InterProScan - Databases
- Pfam- SSF- Gene3D- TIGRfam
![Page 7: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/7.jpg)
Nuevo Problema
• Gran cantidad de bases de datos.
• Errores en Anotación, doble anotación.
• Necesidad de Crear un vocabulario Controlado
• Gene Ontology, UniPROT, SwissPROT, InterProScan.
• Capacidad de realizar referencias cruzadas en las bases de datos.
![Page 8: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/8.jpg)
Algunos Conceptos Importantes
• Gene Name
• Vocabulario Controlado
• IFAA
![Page 9: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/9.jpg)
GeneName:
Para cada Organismo existen gene names particulares, según la base de datos de Referencia.
HUGO:www.genenames.org
![Page 10: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/10.jpg)
Gene Ontology ConsortiumGene Ontology:
Proyecto colaborativo entre variadas instituciones.
Vocabulario:EstructuradoPrecisoComún Controlado
Permite describir los roles de los genes y los productos génicos en cualquier organismo.
![Page 11: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/11.jpg)
División Gene Ontology
• Proceso Biológico
• Función Molecular
• Componente Celular
![Page 12: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/12.jpg)
COG - KOG
![Page 13: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/13.jpg)
Idea
• Filtrar por bases de datos
• Generar una rutina automática capaz de iterar el proceso, para cada set de genes.
![Page 14: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/14.jpg)
Tools & Databases
![Page 15: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/15.jpg)
![Page 16: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/16.jpg)
![Page 17: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/17.jpg)
Resumen
• Hasta ahora, se han visto:
NGS sequencing.Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation
![Page 18: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/18.jpg)
Caso Transcriptómica
![Page 19: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/19.jpg)
Nannochloropsis salina transcriptomics
![Page 20: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/20.jpg)
![Page 21: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/21.jpg)
![Page 22: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/22.jpg)
RNA processing and modification
Chromatin structure and dynamics
Energy production and conversion
Cell cycle control, cell division, chromosome partitioning
Amino acid transport and metabolism
Nucleotide transport and metabolism
Carbohydrate transport and metabolism
Coenzyme transport and metabolism
Lipid transport and metabolism
Translation, ribosomal structure and biogenesis
Transcription
Replication, recombination and repair
Cell wall/membrane/envelope biogenesis
Cell motility
Posttranslational modification, protein turnover, chaperones
Inorganic ion transport and metabolism
Secondary metabolites biosynthesis, transport and catabolism
General function prediction only
Function unknown
Signal transduction mechanisms
Intracellular trafficking, secretion, and vesicular transport
Defense mechanisms
Extracellular structures
Nuclear structure
Cytoskeleton
AB
CD
EF
GH
IJ
KL
MN
OP
QR
ST
UV
WY
Z
0 5 10 15 20 25
KOG Category N.salina v/s C.reindhardtii
N.salinaC.reindhartii
Category Percentage
KOG
Cate
gory
![Page 23: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/23.jpg)
23
GenDB
– Automatic Annotation System for Prokaryotic genomes
• Development for the University of Bielefeld since 2002.
• Modular system developed using an OOP and a relational database (O2DBI).
• Provide an Application program Interface (API).
![Page 24: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/24.jpg)
24
GenDB
• Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003
![Page 25: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/25.jpg)
25
GenDBPipeline
25
![Page 26: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/26.jpg)
26
GenDB
![Page 27: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl](https://reader035.vdocuments.net/reader035/viewer/2022062309/5665b4411a28abb57c9072b8/html5/thumbnails/27.jpg)
Ensembl
• Inicio:1999
• Objetivo: generar herramientas de anotación automática.
Ensembl Pipeline.
• Website:http://www.ensembl.org/