lezione12 - homology...

25
Homology Modelling

Upload: others

Post on 26-Jan-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

HomologyModelling

Page 2: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Homology modelling

L’omology modeling delle proteine è il tipo di predizione di struttura terziaria più semplice ed affidabile. Viene richiesta soltanto una (o più) sequenze di riferimento su cui modellare la struttura. Le procedure sono semplici, ma la validazione è complessa come tutti gli altri tipi di predizione strutturale.

⇒ Costruire un modello è semplice.

⇒ Rifinire un modello è complesso.

⇒ Validare un modello è molto complesso, e serve una partesperimentale.

Per l’homology modelling sono disponibili dei server dedicati all’automazione delle operazioni di base (raccolta degli omologhi strutturali, allineamenti, validazioni ecc.)

Page 3: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

E’ il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.

Vi si accede on-line, oppure

è interfacciato con Swiss PDB Viewer

che lancia le procedure base e poi permette di perfezionare i risultati grazie ai suoi strumenti di editing.

Page 4: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Il protocollo Swiss-Model

Scaricate e leggete l’articolo http://www.nature.com/nprot/journal/v4/n1/pdf/nprot.2008.197.pdf

Page 5: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Gli strumenti di Swiss-Model

Dopo la registrazione, Swiss-Model mette a disposizione uno workspacepersonale da cui si accede ai vari strumenti.

Ogni richiesta è gestita secondo una “coda” di arrivo e man mano le richieste sono evase: una legenda indica lo stato del job.

Page 6: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Modelli di submission

Tutto automatico, adatto per identità elevate

Si immette un allineamento rifinto a mano, indicando quale proteina è il templato e il suo file pdb

Interazione con DeepView

Page 7: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Template identification

Tutte le informazioni in banca dati concorrono alla individuazione di un buon templato

1. Ricerca di domini per trovare regioni conservate e modellarle in modo separato

2. Blast per similarità locali

3. PSI-Blast: per trovare sequenze distanti

4. Modelli di Markovaddestrati sui profili PSI-Blast e contenenti informazioni sulla struttura secondaria.

Page 8: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Template identification

La ricerca dei domini viene fatta secondo criteri si similarità locale, allo scopo di identificare sottoregioni ad alto score per avere buoni templati pe ril modelling: è meglio avere più regioni piccole e molto simili piuttosto che una sola regione con bassa similarità…

Page 9: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Domain annotation

Si va alla ricerca di informazioni funzionali e strutturali per avere la massima copertura in termini di informazioni strutturali.

PsiPred va alla ricerca di strutture secondarie utilizzando il metodo dei profili Psi-Blast

DisoPred è specifico per le regioni disordinate, quelle che per definizione non sono modellabili e quindi da non prendere in considerazione.

MemSat è dedicato all’identificazione di domini trnsmembrana, delle eliche particolari molto idrofobiche che non devono essere modellate.

Ancora una volta i domini, se identificati, danno una grossa mano al modellingperché indicano dei templati che magari non hanno una struttura nota, ma fanno capo ad una famiglia con topologia nota.

Page 10: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Structure assessment

Una volta ottenuto un modello strutturale, bisogna valutarlo in base ad una serie di regole geometriche e termodinamiche

Anolea, GROMOS e QMEAN usano campi di forza e geometrie per produrre grafici 2D che descrivono a l ivello locale (residuo per residuo) la compatibilità della predizione con una struttura proteica “reale”. DFire fa la stessa cosa ma restituisce uno ascore globale.

DSSP e ProMotif sono usati per determinare caratteristiche strutturali utili allaverificasperimentale del modello (es. accessibilità al solvente dei vari residui).

Si possono usare sia modelli sia strutture sperimentali, che non sempre sono buone…

Page 11: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Structure assessment

I campi di forza mostrano dei report energetici per ogni posizione (residuo): le regioni negative (in verde) sono favorevoli, quelle positive (in rosso) sono sfavorevoli e necessitano di intervento manuale per renderle “conformi” ad una struttura 3D veritiera.

Anche i vincoli geometrici vanno rispettati, considerando insieme le strutture secondarie previste, quell emisurate (DSSP) e il plot di Ramachandran che identifica amino acidi con torsioni “anomale” potenzialmente errate.

Page 12: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Template library

Scegliendo a mano un templato, dobbiamo considerare alcuni aspetti importanti per il suo utilizzo:

1. Spesso le strutture si presentano come dimeri, di cui slo 1 è il templato vero.

2. Se una struttura è composta da un etero-multimero, io non ho scelto un templato ma una serie di templati di cui solo uno mi interessa.

ExPDB nasce come derivazione di PDB e contiene le singole catene, che sono i veri templati che vanno usati per ilmodelling. Questa sezione del server è funzionale a “decomporre” il file PDB cercando nella banca dati ExPDB.

2vh7

Page 13: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Affidabilità di Swiss-Model

Page 14: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Affidabilità di Swiss-Model

Page 15: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Alla fine viene prodotto un file contenente tutte le strutture utilizzate per la modellazione e la struttura incognita modellata (TARGET), con tutti gli allineamenti strutturali.

I risultati, compresa tutta la lista delle operazioni svolte dai vari programmi, vengono visualizzati nel proprio workspace e la struttura modellata si presenta come un progetto di Swiss PDB Viewer (nomefile.pdb).

Risultati della procedura automatica

Page 16: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

La struttura modellata contiene anche informazioni riguardanti la confidenza della predizione . Nell’ultima colonna dei record ATOM del file PDB in genere sono contenuti i dati sulla mobilità dell’atomo ottenuta dai dati NMR o di cristallografia:

In questo caso il B-FACTOR non è sperimentale ma è ottenuto da un’analisi statistica della struttura modellata con tutti i templati disponibili ed è legato a

1 - Numero dei templati utilizzati per il modelling

2 - Deviazione di posizione del modello dai templati

3 - Distance trap (la soglia di distanza considerata d iinattendibilità )

Qualità dei modelli: il B-factor

Page 17: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Utilizzare Swiss PDB Viewer per il modelling

In generale, Swiss PDB Viewer viene considerato un programma per valutare la qualità di un modello strutturale e per il manual refining delle strutture.

In effetti però è possibile iniziare e portate a termine un progetto di modellazione senza utilizzare la versione on-line di SWISS-MODEL.

In alternativa, si effettua il modelling con il server e poi si apre il progetto che arriva via e-mail e si corregge a mano.

Page 18: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Valutare la qualità del modello

1 - Osservare il r.m.s.d. tra modello e templato.

2 - Colorare tutto in base al B-factor (se c’è).

3 - Osservare il plot di Ramachandran.

4 - Selezionare gli amino acidi in collisione tra loro.

5 - Selezionare gli amino acidi in collisione con il backbone.

6 - Selezionare gli amino acidi con legami idrogeno impropri.

7 - Osservare le polarità dei residui esposti e sepolti.

8 - Calcolare l’energia libera.

Page 19: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Modificare la struttura del modello

Permette di modificare un residuo con un altro, ma anche di cambiare il ROTAMERO della catena laterale: in natura infatti ogni residuo presenta la catena laterale in un certo numero finito di disposizioni (rotameri) archiviate in una libreria apposita.

Permette di modificare tutti gli angoli di legame del residuo selezionato: se si cambiano gli angoli phi e psi naturalmente si sposta anche il backbone della proteina e bisogna decidere se può spostarsi l’N o il C terminale.

Per evitare gli spostamenti delle estremità si può rompere temporaneamente il legame peptidico, per poi effettuare le modifiche e la nuova ligazione.

Page 20: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Perfezionamento dell’allineamento

La finestra Alignment mostra l’allineamento strutturale come è stato generato dal server di modelling. E’ possibile modificare l’allineamento selezionando il residuo da spostare e:

- spacebar/del: inserimento/rimozione di un gap

- freccia dx/sx: spostamento del residuo

Ogni modifica si riflette anche sulla struttura. Il plot riguarda la “threading energy”, cioè un valore che indica quanto è adatto il residuo a stare in quell’intorno di residui.

Page 21: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Ramachandran plot

Giallo: aree permesseBlu: aree limiteQuadrati: glicineCrocette: altri residui

Per ogni residuo vengono plottati i rispettivi ψ su ϕ: solo certe combinazioni sono permesse. Inoltre è possibile cambiare gli angoli trascinandoli nel grafico. Il backbone della proteina cambia!

Le glicine vanno trattate a parte parlando di angoli permessi: l’amino acido è così piccolo che non ha in pratica angoli vietati...

Page 22: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Riorientamento delle catene laterali

E’ possibile riorientare le catene laterali in termini di rotameri dal menu Tools -> Fit Selected Sidechains

Quick and Dirty : mette il rotamero a minor scoreExaustive search : prova tutti gli angoli possibili Simulated annealing : non funziona

Lo score (clash score) di uno spostamento è calcolato secondo:

4 x numero di scontri tra atomi del legame peptidico+ 3 x numero di scontri con gli ossigeni del backbone+ 2 x numero di scontri delle catene laterali- numero di idrogeni- 4 x numero di ponti disolfuro formati

Page 23: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Ponti idrogeno

Possono essere “facilmente” localizzati osservando i tipi di atomi e le distanze tra di essi. Di default viene assegnato un ponte idrogeno se un donatore e un accettore si trovano:

- tra 1.2 e 2.76 Å e con un angolo di 90° se non c’è l’idrogeno

- tra 2.35 e 3.2 Å e 120° se c’è l’idrogeno.

D H A D A

D H

A

A

A

D H

A

A

A

120° 90°

Page 24: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Superimposizione delle strutture

L’allineamento tridimensionale si può effettuare secondo vari criteri:

1 - Magic fit : fa un allineamento pairwisecon una PAM e poi adatta le strutture.

2 - Iterative : fa un magic, poi un improve, poi minimizza l’r.m.s.d.

3 - Explore : non considera la sequenza primaria, ma solo le coordinate degli atomi.

Le superimposizioni e l’r.m.s.d si possono applicare al backbone, ai C-alfa, alle catene laterali o a tutti gli atomi...

Page 25: Lezione12 - Homology modellingm.docente.unife.it/matteo.ramazzotti/bioinfo/11-Homology_modelling.pdf · Homology modelling L’omology modeling delle proteine è il tipo di predizione

Rimodellare dei loops

Molto spesso nei modelli le stime peggiori si fanno sulle zone più mobili (i loops).

Esistono però delle banche dati dove sono scritti i vari modi di connettere strutture secondarie. E’ possibile pertanto modellare i loops non sulla strutture vecchia, ma su un loop di questo database (Scan ). Inoltre è possibile minimizzare l’energia libera del loop solo (Build ).

Threading energyCampi di forzaDeviazioni

Cliccando sopra tutti i possibili loops generati vengono ordinati in base al criterio di scelta fatto, permettendo la scelta del loop.