università degli studi di genova laurea specialistica in biotecnologie medico-farmaceutiche corso...

22
Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico- Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo di Database in studi di Biologia Molecolare. Eva Bertini

Upload: amedea-cossu

Post on 02-May-2015

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Università degli Studi di Genova

Laurea Specialistica in Biotecnologie Medico-Farmaceutiche

Corso di: Biotecnologie Diagnostiche

A.A. 2004/2005

Utilizzo di Database in studi di Biologia Molecolare.

Eva Bertini

Page 2: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Disponibilità dei dati on-line con possibilità di utilizzare un buon motore di ricerca:

Fronteggiare l’incremento del numero dei dati disponibili…

…integrare le informazioni…

…e semplificare il lavoro!

Page 3: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di sequenze nucleotidiche

GENEBANK

Progetto di collaborazione internazionale: EMBL/EBI, DDBJ, NHI/NCBI

Aggiornamento automatico ogni 24 h

130000 organismi > 32 milioni di sequenze > 38 miliardi di basi (febbraio 2004)

Page 4: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di sequenze nucleotidiche

Tipologie di sequenze accettate da GENEBANK:

• Genomi completi

• ESTs

• HTGs

• STSs

• WGSs Problema: •database ridondante

•molti errori

UniGene

Caratteristiche delle sequenze:

A. Accession Number (AC): codice di identificazione univoco

B. Sequenze “annotate”

Page 5: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di sequenze nucleotidiche

Ricerca: pou genes zebrafish

Page 7: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di sequenze proteiche

Database universali Database specializzati

Semplici archivi di dati Database annotati

Swiss-Prot/SIB (Swiss Institute of

Bioinformatics) http://www.expasy.ch

PIR (Protein Information Resource)

Famiglie proteiche

Gruppi di proteine

Proteomi

NCBI:

• “genomes and maps” (più di 1000 organismi, eucarioti e procarioti, virus, plasmidi e organelli)

• “entre genome” e ProtTable

6000 specie > 85000 entries annotate

Supplemento TrEMBL

Page 8: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di sequenze proteiche

Home page di SWISS-PROT

Page 9: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

BLAST

(Basic Local Alignment Search Tool)

(Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ: Basic local alignment search tool. J Mol Biol. 1990 Oct 5;215(3):403-10.)

Algoritmo di allineamento che ha permesso di interrogare in modo costruttivo i database di sequenze.

Attivo a pieno regime dal 2003

280 processori

Più di 100000 richieste di allineamento al giorno

Ogni richiesta completata in media in 40 secondi

Page 10: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

BLAST

(Basic Local Alignment Search Tool)

Tipologie di utilizzo:

I. Nucleotide BLAST

II. Protein BLAST

III. Translated BLAST

IV. Genomes BLAST

V. Special BLAST

Query = sequenza nucleotidica

• GEO BLAST

• Immunoglobin BLAST

• SNP BLAST

• VecScreen

• Align

Query = sequenza nucleotidica

• Nucleotide-nucleotide

• Megablast

• Discontigous megablast

Query = sequenza proteica

• Protein-protein

• Allineamenti brevi con alta similarità

• Domini conservati

Query = sequenza amminoacidica

• Proteina-TrEMBL

• Sequenza tradotta-proteine

• Sequenza tradotta-TrEMBL

Query = sequenza nucleotidica

Scelta dell’organismo

Page 11: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

BLAST

(Basic Local Alignment Search Tool)

Page 12: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di strutture biomolecolari

Archivi di strutture macromolecolari tridimensionali, determinate tramite esperimenti biocristallografia a raggi X.

MMDB (Molecular Modeling Database)Query = coordinate 3D28000 struttureAggiornamento settimanale da PDBVAST (Vector Alignment Search Tool)

CDD (Conserved Domain Database)Query = sequenza aaCollezione di moduli e domini ottenuti da allinamenti multipliCn3D

PUBCHEMStrutture 3D di piccole molecole organiche ad attività biologica

Page 13: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di strutture biomolecolari

Query: sequenza proteica Brn3b zebrafish

Page 14: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di 2D PAGE e SDS PAGE

SWISS-2D PAGE: mappatura di gel elettroforetici 2D PAGE o SDS PAGE.

7 organismi > 36 mappe proteiche > 1265 entries

Link a tutti i siti che mettono a disposizione mappature di 2D PAGE e SDS PAGE

Query per informazione chiave sulla proteina o selezione diretta dello spot

Page 15: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di 2D PAGE e SDS PAGE

Page 16: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di espressione genica

GEO (Gene Expression Ominibus)

Disponibile da luglio 2000

Raccolta di dati sperimentali high-throughput riguardanti l’espressione genica

• Microarray singolo o doppio canale

• Analisi seriale di espressione genica (SAGE)

• Spettrometria di massa

Page 17: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di espressione genica

Interrogare il database:

1) Entrez GEO Profiles: profili di espressione genica specifici

2) Entrez GEO DataSet: tutte le annotazioni sperimentali relative alla query disponibili nel database

1) Entrez GEO Profiles

Profile neighbors: geni con profilo di espressione simile (funzione o regolazione comune)

Sequence neighbors: geni con similarità di sequenza (famiglie geniche o paragone fra specie diverse)

Page 18: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database di espressione genica

Page 19: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database tassonomici

A. Taxonomy Browser (NCBI): 130000 organismi, viventi o estinti, rappresentati in banca dati da almeno una sequenza nucleotidica o proteica

B. Tree of life web project

C. Species 2000: supporto a studi di biodiversità, comprende circa il 40% delle specie viventi note

D. Integrated taxonomic information system

Page 20: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database tassonomici

Page 21: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database bibliografici

Più di 5000 riviste biomediche (con impact factor) in 70 paesi.

MEDLINE/NML (National Library of Medicine): 13 milioni di citazioni dal 1966 ad oggi.

NCBI:

1. PubMed: tutte le pubblicazioni contenenti la parola chiave ricercata

2. PubMed Central: tutti i full-text disponibili, con link ad altre risorse di NCBI; progetto di digitalizzazione di pubblicazioni “datate”

3. Books: libri interamente disponibili sul web

4. OMIM (Online Mendelian Inheritance in Man): pubblicazioni riguardanti patologie genetiche

Altri database:

BIOSIS: pubblicazioni, anche di vecchia letteratura, in tutti I settori della ricerca biologica

CAB International: più di 4 milioni di riferimenti, di varia origine, relativi a nutrizione e agricoltura

Page 22: Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo

Database bibliografici