métodos bioinformáticos para el estudio de interacciones...

55
Métodos bioinformáticos para el estudio de Métodos bioinformáticos para el estudio de interacciones proteína-ligando interacciones proteína-ligando El problema del plegamiento El problema del plegamiento Universidad Nacional Autónoma de México Rogelio Rodríguez-Sotres Facultad de Química

Upload: duonglien

Post on 16-Oct-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos bioinformáticos para el estudio deMétodos bioinformáticos para el estudio deinteracciones proteína-ligandointeracciones proteína-ligando El problema del plegamiento El problema del plegamiento

Universidad Nacional Autónoma de México

Rogelio Rodríguez-Sotres

Facultad de Química

Page 2: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Las proteínas son heteropolímerosLas proteínas son heteropolímerosasimétricos y no son monótonosasimétricos y no son monótonos

Rodríguez-Sotres (2004) Educación Química 16(1): 56-62.Rodríguez-Sotres (2004) Educación Química 16(1): 56-62.

Page 3: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Sólo

20

mon

ómer

osSó

lo 2

0 m

onóm

eros

apolarapolarneutroneutro

polarpolarácidoácidobásicobásico

Page 4: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Unidos por enlaces equivalentesUnidos por enlaces equivalentes

Page 5: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Con restricción conformacionalCon restricción conformacional

Page 6: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Por lo que adoptan estructurasPor lo que adoptan estructurastridimensionales definidas*tridimensionales definidas*

Rodríguez-Sotres (2004) Educación Química 16(1): 56-62.Rodríguez-Sotres (2004) Educación Química 16(1): 56-62.*existen excepciones*existen excepciones

Page 7: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La estructura 3D de una proteínaLa estructura 3D de una proteínaEs esencial para entender cabalmente la función

Es determinante de su ubicación en la célula Es importante para determinar la interacción con otras

componentes de la célula como: otras proteínas ácidos nucleicos lípidos carbohidratos iones otros muchos ligandos, incluyendo diversos fármacos

Si la función es conocida y bien estudiada Y la estructura está determinada

puede establecerse la relación estructura-actividad.

Page 8: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La estructura 3D de una proteínaLa estructura 3D de una proteínaEs esencial para entender cabalmente la funciónConocer la estructura no basta para conocer la

función. No es posible predecir la función con la información de la

estructura sólamente.

La función puede explorarse mediante estrategiasde genómica funcional:

Ubicación intracelular y patrones de expresión Mutantes nulas Transgénicos sobreexpresoras Proteínas de fusión con reporteros.

Page 9: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La estructura 3D de una proteína esLa estructura 3D de una proteína esinformación muy valiosa, pero...información muy valiosa, pero...La determinación experimental es muy laboriosa y

con limitaciones (rayos X, NMR), por tanto: Contamos con 100 veces más secuencias que entradas

en el PDB.

??

??

Los proyectos de Genómica estructural buscan determinarLos proyectos de Genómica estructural buscan determinarestructuras representativas de todas las familias de plegamiento deestructuras representativas de todas las familias de plegamiento delas proteínas, aún si su función es deconocida.las proteínas, aún si su función es deconocida.

Page 10: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La genómica estructuralLa genómica estructural

Se considera que hay un número restringido depatrones de plegamiento

Se busca determinar la estructura de unconjunto representativo de todas los patronesde plegamiento posibles.

En este caso, la determinación de la estructurase realiza, aún si la función no se conoce.

Se asume que conocidos todos los patronesestables, la demás proteínas podríanmodelarse por comparación.

Page 11: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0. . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . |

1 k v 5 A - - - - - - - - - - - - - - - - - - - M S K P Q P I A A A N W K C N G S Q Q S L S E L I D L F N S - - - T S I N H D V Q C V V A S T F V H L A M T K E R L S H - - - - P K F V I A A Q N A I A K S - G A1 n e y A - - - - - - - - - - - - - - - - - - - - - A R T F F V G G N F K L N G S K Q S I K E I V E R L N T - - - A S I P E N V E V V I C P P A T Y L D Y S V S L V K K - - - - P Q V T V G A Q N A Y L K A S G A1 r 2 r A - - - - - - - - - - - - - - - - - - - A P S R K F F V G G N W K M N G R K K N L G E L I T T L N A - - - A K V P A D T E V V C A P P T A Y I D F A R Q K L D - - - - - P K I A V A A Q N C Y K V T N G A1 t p h 1 - - - - - - - - - - - - - - - - - - - A P - R K F F V G G N W K M N G D K K S L G E L I H T L N G - - - A K L S A D T E V V C G A P S I Y L D F A R Q K L D - - - - - A K I G V A A Q N C Y K V P K G A1 m o 0 A M S Y Y H H H H H H L E S T S L Y K A G L T R K F F V G G N W K M N G D Y A S V D G I V T F L N A - - - S A D N S S V D V V V A P P A P Y L A Y A K S K L K - - - - - A G V L V A A Q N C Y K V P K G A1 m 6 j A - - - - - - - - - - - - - - - - - - - M G A G K F V V G G N W K C N G T L A S I E T L T K G V A A S V D A E L A K K V E V I V G V P F I Y I P K V Q Q I L A G E A N G A N I L V S A E N A W T K S - G AC o n s e n s u s N K N G A N G A

1 1 0 1 2 0 1 3 0 1 4 0 1 5 0 1 6 0 1 7 0 1 8 0 1 9 0 2 0 0. . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . |

1 k v 5 A F T G E V S L P I L K D F G V N W I V L G H S E R R A Y Y G E T N E I V A D K V A A A V A S G F M V I A C I G E T L Q E R E S G R T A V V V L T Q I A A I A K K L K K A D W A K V V I A Y E P V W A I G1 n e y A F T G E N S V D Q I K D V G A K Y V I L G H S E R R S Y F H E D D K F I A D K T K F A L G Q G V G V I L C I G E T L E E K K A G K T L D V V E R Q L N A V L E E V K - - D F T N V V V A Y E P V X A I G1 r 2 r A F T G E I S P G M I K D C G A T W V V L G H S E R R H V F G E S D E L I G Q K V A H A L S E G L G V I A C I G E K L D E R E A G I T E K V V F E Q T K V I A D N V K - - D W S K V V L A Y E P V W A I G1 t p h 1 F T G E I S P A M I K D I G A A W V I L G H S E R R H V F G E S D E L I G Q K V A H A L A E G L G V I A C I G E K L D E R E A G I T E K V V F E Q T K A I A D N V K - - D W S K V V L A Y E P V W A I G1 m o 0 A F T G E I S P A M I K D L G L E W V I L G H S E R R H V F G E S D A L I A E K T V H A L E A G I K V V F C I G E K L E E R E A G H T K D V N F R Q L Q A I V D K G V - - S W E N I V I A Y E P V W A I G1 m 6 j A Y T G E V H V G M L V D C Q V P Y V I L G H S E R R Q I F H E S N E Q V A E K V K V A I D A G L K V I A C I G E T E A Q R I A N Q T E E V V A A Q L K A I N N A I S K E A W K N I I L A Y E P V W A I GC o n s e n s u s T G E D L G H S E R R E K A G V C I G E T V Q A Y E P V A I G

2 1 0 2 2 0 2 3 0 2 4 0 2 5 0 2 6 0 2 7 0 2 8 0. . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | .

1 k v 5 A T G K V A T P Q Q A Q E A H A L I S S W V S S K I G A D V A G E L R I L Y G G S V N G K N A R T L Y Q Q R D V N G F L V G G A S L K P - E F V D I I K A T Q - - - - - - - -1 n e y A T G L A A T P E D A Q D I H A S I R K F L A S K L G D K A A S E L R I L Y G G S A N G S N A V T F K D K A D V D G F L V G G A S L K P - E F V D I I N S R N - - - - - - - -1 r 2 r A T G K T A T P Q Q A Q E V H E K L R G W L K S N V S D A V A Q S T R I I Y G G S V T G A T C K E L A S Q P D V D G F L V G G A S L K P - E F V D I I N A K Q - - - - - - - -1 t p h 1 T G K T A T P Q Q A Q E V H E K L R G W L K T H V S D A V A Q S T R I I Y G G S V T G G N C K E L A S Q H D V D G F L V G G A S L K P - E F V D I I N A K H - - - - - - - -1 m o 0 A T G K T A S G E Q A Q E V H E W I R A F L K E K V S P A V A D A T R I I Y G G S V T A D N A A E L G K K P D I D G F L V G G A S L K P - D F V K I I N A R S T A L S C T C W1 m 6 j A T G K T A T P D Q A Q E V H Q Y I R K W M T E N I S K E V A E A T R I Q Y G G S V N P A N C N E L A K K A D I D G F L V G G A S L D A A K F K T I I N S V S E K L - - - - -C o n s e n s u s T G A A Q H A R I Y G G S D G F L V G G A S L F I I

La conservación en las secuencias de aminoácidos La conservación en las secuencias de aminoácidos

Obedece a lanecesidad demantener:

Estructura

Función

rutas deplegamiento

Flexibilidadconformacional

Todas estas presiones evolutivas actúan juntasTodas estas presiones evolutivas actúan juntasen la selección natural.en la selección natural.Saber que cambios obedecen a necesidadesSaber que cambios obedecen a necesidadesestructurales es muy difícil.estructurales es muy difícil.

Page 12: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

¿Cómo se pliega una proteína?¿Cómo se pliega una proteína?

Las proteínas se sintetizan añadiendo aminoácidos uno auno al estremo carboxilo

La mayoría, de alguna manera, durante este proceso ( odespués) adquieren su plegamiento estable.

Ese proceso dura apenas de 1 a 0.01s

Algunas proteínas no adquieren un plegamiento establepor si mismas (plegamiento asistido-> chaperonasmoleculares)

Otras cambian su plegamiento contínuamente(Intrínsecamente desordenadas).

Page 13: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La complejidad...La complejidad...A nivel de secuencia:

Hay 10.2×1012 secuencias de péptidos de 10 aa’s. Sinconsiderar las repeticiones, sólo 1 de cada 9’103secuencias posibles se han observado (NCBI-RefSeq1.1×1010 aa [09/09/13]).

Las secuencias naturales poseen elevada redundancia,así que: ¡no cubren toda la diversidad posible!

A nivel estructural: Restringiendo a 3-conformaciones/aa, una proteína de

100 aa tendría 3×10130 confórmeros Los plegamientos observados (PDB) se agrupan en

menos de 1000 categorías.

La naturaleza no ha tenido oportunidad de explorartodas las secuencias y formas teóricamente posiblespara las proteínas... Nosotros conocemos aún menos!

Page 14: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La paradoja de Cyrus Levinthal*La paradoja de Cyrus Levinthal* Asumimos:

cada aa’ tiene 3 conformaciones (conf.)

la proteína promedio es de 100 aa’s

la molécula visita 1 conformación cada 10-13s, es decir:10 billones de conf./s = 3.154 × 1020 conf./año.

Tendremos

3 conf. (100 aa’s) = 5.15 × 1047 conf.

(5.15 × 1047 conf.)/(3.154 × 1020 conf./año) =1.63 × 1021 Millones de años (Mi.a)

Edad del universo: 12’500 Mi.a = 1.25 × 103 Mi.a ¡Si la proteína que comenzó a explorar conformaciones al inicio del universo, aún estaría

probando!

*vease:*vease: Clark, A. C. (2008) Arch biochem biophys 469, 1-3Clark, A. C. (2008) Arch biochem biophys 469, 1-3

Page 15: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Las proteínas tiene rutas preferenciales deLas proteínas tiene rutas preferenciales deplegameintoplegameinto

De la imposibilidad de explorar todo el espacio conformacional.se sigue:

Nunca se explora toda conformación posible

Algunas conformaciones deben ser accesibles

La ruta de plegamiento ocurre explorando un conjunto limitado deconformaciones accesibles

Encontrar los mecanismos claves que determinan el plegamientorequiere inspeccionar varías vía de plegamiento.

¿Cómo estudiar estas vías de plegameinto de una proteína?

Page 16: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Las proteínas tiene rutas preferenciales deLas proteínas tiene rutas preferenciales deplegameintoplegameinto

Estudiar las conformaciones se necesita la determinación deestructura, pero los métodos conocidos están limitados a:

tiempos largos de toma de datos

conformaciones estables

La ruta de plegamiento toma apenas 0.01 a 1 s.

Es decir, no tenemos buenos métodos para estudiar los detallesestructurales de los intermediarios en la ruta de plegameinto

Page 17: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

¿Cómo predecir el plegamiento? ¿Cómo predecir el plegamiento?

Conocer la vía de plegamiento es muy difícil,pues no tenemos buenas técnicas.

¿Qué alternativa existe para modelar laestructura tridimensional de una proteína?

Page 18: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Las bases del modeladoLas bases del modelado

El modelado de la estructura se basa en dospremisas:

Toda la información para determinar el plegamientofinal está en la secuencia de aminoácidos

La estructura nativa es un mínimo energético

Al desconocer la ruta de plegamiento, encontrar elmínimo requiere un muestreo energético del espacioconformacional

Calcular la energía requiere resolver la ecuación deSchrödinger, que sólo se ha podido en forma exactaresolver para el sistema de:

un átomo de hidrógeno (1p+ + 1e-)

Page 19: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Química ComputacionalQuímica Computacional En la química computacional se busca cal-

cular las propiedades de átomos y molécu-las usando teoría

Page 20: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Química ComputacionalQuímica Computacional Los cálculos requiren lidiar con las propie-

dades cuantizadas de la energía a escalasatómicas...

Sir, this gift arrivedSir, this gift arrivedfrom Wernerfrom WernerHeisenberg. Heisenberg. It’s for youIt’s for you

Thanks James, I’llThanks James, I’llopen it, when I find outopen it, when I find outif its contents are deadif its contents are dead

or alive... This fellow and his or alive... This fellow and his freaky uncertainties!freaky uncertainties!

mmm...mmm...I suspect of aI suspect of a

hidden CAT inside hidden CAT inside

Page 21: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Es decir, se require resolver la ecuación de SchrödingerEs decir, se require resolver la ecuación de Schrödinger

Well, that Well, that makes it formakes it forthe H atom...the H atom...But I still But I still ignore if ignore if

Heisenberg’sHeisenberg’shidden CAT washidden CAT wasalive or dead...alive or dead...probably dead probably dead by now anywayby now anywayEsta ecuación se resuelveEsta ecuación se resuelve

en forma exacta para unen forma exacta para unsistema de... sistema de...

¡2 partículas!¡2 partículas!

Page 22: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

pervertum magister est naturapervertum magister est natura

Bien por tí ¡ya resolviste el hidrógeno! Bien por tí ¡ya resolviste el hidrógeno! Sigue con algo leve... mmm... que talSigue con algo leve... mmm... que tal

La RNAasa: CLa RNAasa: C575575HH907907NN171171OO192192SS1212

y que sean sólo 100 y que sean sólo 100 conformaciones.conformaciones.

What?What?

E. ShrödingerE. Shrödinger

the monkey isthe monkey isout of its mind!out of its mind!

I’d better go back to I’d better go back to the CAT’s the CAT’s problemproblem

En todos los otros casos se require simplificar y aproximar.En todos los otros casos se require simplificar y aproximar.Entre mayor el problema menos confiable la aproximación...Entre mayor el problema menos confiable la aproximación...

Page 23: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

PROBLEMAS ENORMESPROBLEMAS ENORMES:: Energías simplificadasEnergías simplificadas

ÁtomoÁtomo11

ÁtomoÁtomo

2 2 ∂+∂+

longitud de enlace

longitud de enlace

ÁtomoÁtomo

4 4 ∂-∂-

Átomo 3Átomo 3

radioradio

ángulo ángulo de de

enlaceenlaceÁtomo 5Átomo 5

++

atra

cción

atra

cción

E total = E covalente + E no covalenteE total = E covalente + E no covalente

E covalente = E l.e. + E a. e.+ E a.t.E covalente = E l.e. + E a. e.+ E a.t.

E no covalente = E coulomb + E VdWE no covalente = E coulomb + E VdW

repulsión

repulsión

VdWVdW

Campos de fuerza de la Mecánica MolecularCampos de fuerza de la Mecánica Molecular

--Ignora los efectos--Ignora los efectoscuánticos y electrónicoscuánticos y electrónicos

--Tiene un importante--Tiene un importanteerror sistemáticoerror sistemático

++Es rápida de calcular++Es rápida de calcular

++Los parámetros++Los parámetrosse pueden ajustarse pueden ajustarsegún se requierasegún se requiera

Page 24: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Campos de fuerzas popularesCampos de fuerzas populares

AMBER: (variantes amber99, amber99SB,GAFF).

CHARMM (charmm27).

GROMOS (gromos87, 96, 53a6)

OPLS

Page 25: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Programas de MM/MDProgramas de MM/MD

AMBER

GROMACS

NAMD

TINKER

Page 26: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

EjemploEjemplo

Descargue Swiss PDB viewer

Portal http://spdbv.vital-it.ch/

Siga las instrucciones de instalación

abra el programa

Elija una estructura del depósito de Swiss model

Portal: http://swissmodel.expasy.org/repository/ repository query: “Palabra de búsqueda” elija un resultado descargue y descomprima el modelo (casi al final de la

página) Abralo en Swiss PDB viewer

File/open PDB file... elija el archivo PDB

Tools/compute/energy (Forcefield)... palomita a todo...OK

Analice el resultado, busque energías extremas

Page 27: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Ejemplo...Ejemplo...

Analice el resultado: busque energías extremas

encuentre el sitio con peor energética (más alta)

pique sobre la línea y vea en la estructura el residuoseleccionado

Pase al panel de control (si no está abierto:wind/control panel)

elija el residuo en cuestión+ 2 antes y 2 después

tools/fix selected sidechains/simulated anealing

experiments:3 ... OK

calcule de nuevo la energía y compare los reportes

Page 28: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de modeladoMétodos de modelado

A pesar de ser un problema NP-completo (muydifícil), se han logrado aproximaciones al problema:Ab initio. Usamos los principios de la física y de la

química (o aproximaciones a los mismos) parapredecir la conformación estable de la proteína(estado de baja energía).

Comparativo. Usamos datos de estructuras 3Dconocidas (moldes) que “en teoría” tengan unplegamiento “comparable” a de la secuencia deaminoácidos que se desea modelar ( secuenciaobjetivo).

Page 29: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de modelado Métodos de modelado ab initioab initio::

El éxito es limitado y se requiere alguna forma deconfirmación del resultado (de preferenciaexperimental).

Aplicando principios de la mecánica cuánticaSoluciones completas, sólo en péptidos pequeñosMétodos “divide and conquer” y “kernels” se

require un modelo aproximado para empezar. Aproximaciones de mecánica molecular y

simulaciones de dinámica molecular.son más rápidos, pero tienen un error implícito

que hace incierto el resultado.para plegar completamente una proteína pequeña

se requieren miles de horas de CPU.hay diferentes campos de fuerzas - ¿cuál usar?

Page 30: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Modelado comparativo: Modelado comparativo: ¿Cómo saber que nuestra secuencia¿Cómo saber que nuestra secuenciaobjetivo tiene una estructura comparable a un cierto molde 3D?objetivo tiene una estructura comparable a un cierto molde 3D?

A) Datos espectroscópicos

i.e. se require información experimental, no siempre disponible

B) El molde y el objetivo son proteínas homólogas(modelado por homología), por tanto, su plegamiento separece en medida de su similitud en secuencia.

esto no siempre es cierto: proteínas homólogas pueden tener plegamientos distintos proteínas heterólogas pueden tener plegamientos semejantes

entre menos similitud exista la correlación estructural es másdébil... ¿en qué nivel de similitud un molde ya no es útil?

Page 31: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

El problema del enhebrado (threading)El problema del enhebrado (threading)

Modelado por enhebrado es el alinear losátomos de una secuencia de aminoácidos a lasposiciones atómicas de un motivo deplegamiento tridimensional de una proteína. el motivo molde puede ser experimental o teórico.el problema es NP-completo (muy difícil).¿cómo saber a que posición del motivo

corresponde cada aminoácido?¿qué hacer si la longitud de la secuencia objetivo

es más larga o más corta que el molde?

Page 32: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos bioinformáticos para el estudio deMétodos bioinformáticos para el estudio deinteracciones proteína-ligandointeracciones proteína-ligando

modelado estructuralmodelado estructural

Universidad Nacional Autónoma de México

Rogelio Rodríguez-Sotres

Facultad de Química

Page 33: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Alineamiento de secuenciaAlineamiento de secuencia

Una manera de atacar el problema deenhebrado es aprovechar la similitud desecuencia...¿cómo lograr la mejor correspondencia?

de nuevo el problema es NP-completo (muy difícil) ¿hasta que punto la concordancia de propiedades de

dos aminoácidos es suficiente para hacerlosequivalentes en la estructura?

¿cómo garantizar que al realizar dicho alineamiento setendrá la mejor concordancia de contactos vecinos anivel tridimensional?

Page 34: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Evaluación de la CalidadEvaluación de la Calidad

¿Está el modelo realmente en un mínimoenergético?

¿es posible mejorar el modelo (reducir suenergía)?

¿qué tanto se desvía esta conformación es laque encontramos en la naturaleza (la cual esdesconocida)?

¿es posible aproximarnos a la estructura nativasin saber cual es?

Page 35: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Una limitación mayor:Una limitación mayor: ¿Cómo saber si el modelo sirve sin recurrir ¿Cómo saber si el modelo sirve sin recurrira datos experimentales (X-ray, NMR)?a datos experimentales (X-ray, NMR)?

Concursos CASP: critical assesment of the structure ofproteins

La estructura es conocida pero sólo por los jueces

Los concursantes someten sus propuestas pueden ser máquinas (servidores) pueden ser grupos humanos

Los jueces evalúan la calidad de las propuestas

Programas de evaluación de calidad

Consistencia estructural

Relevancia biológica

Page 36: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Hasta la fecha no ha sidoHasta la fecha no ha sidoposible encontrar las clavesposible encontrar las claves

del plegamiento de lasdel plegamiento de lasproteínasproteínas

????

-¡10 -¡10 Å RMSD de objetivo !Å RMSD de objetivo !¡Castigado!¡Castigado!

-pero si seguí sus indicaciones y-pero si seguí sus indicaciones ytrabajé ... 35000 evaluaciones detrabajé ... 35000 evaluaciones deenergía son muchasenergía son muchas

ProfesorProfesor Dr. CaspDr. Casp

Estudiante Estudiante Mr. Concur SanteMr. Concur Sante

Page 37: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de evaluación de la calidad:Métodos de evaluación de la calidad: Consistencia Consistenciaestructuralestructural

Desviación de los valores canónicos encaracterísticas estructurales

Contactos faborables/desfaborables entrevecinos en el espacio alejados en secuencia

Page 38: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de evaluación de la calidad:Métodos de evaluación de la calidad: Consistencia Consistenciaestructuralestructural

Desviación de los valores canónicos en:distancia de enlaceángulos de enlaceángulos de torsión (dihedrales).

Vecinos en el espacio alejados en secuencia

Page 39: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de evaluación de la calidad:Métodos de evaluación de la calidad: Consistencia Consistenciaestructuralestructural

Desviación de los valores canónicos

Vecinos en el espacio alejados en secuenciaimpedimentos estéricosrepulsión/atracción electrostática

fuerzas de dispersión (contactos de Var der Walls) puentes de hidrógeno puentes salinos

efectos entrópicos libertad conformacional efecto hidrofóbico

Page 40: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Métodos de evaluación de la calidadMétodos de evaluación de la calidadRelevancia BiológicaRelevancia Biológica

¿Realmente representa el modelo generado lamanera en que la secuencia objetivo se pliegaen los sistemas biológicos?

¿Cómo contestar a esta pregunta sidesconozco la estructura final?Se puede contestar a esta pregunta si encuentro

alguna característica en las proteínas conestructura conocida, que permita establecer unacorrespondencia clara entre las coordenadasatómicas de la estructura y su secuencia.

Si tal característica existe, puede evaluarse en losmodelos

Page 41: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

La búsqueda de un algoritmo para elLa búsqueda de un algoritmo para elplegamientoplegamiento

esqueleto coordenadas atómicas 3D

Secuenciaalgoritmo inverso

algoritmo directo

La mayoría de los intentos se han enfocado en la búsqueda de unalgoritmo directo, pero es posible encontrar un algoritmo inverso

desde la estructura hacia la secuencia y más importante ...

¿Qué podemos aprender de ello?

Page 42: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Coordenadas 3DCoordenadas 3D

1 secuencia1 secuencia

algunas secuenciasalgunas secuencias

muchas secuenciasmuchas secuencias

Correspondencia biunívoca,Correspondencia biunívoca,información precisainformación precisa

degeneración* bajadegeneración* bajainformación valiosainformación valiosa

degeneración* elevadadegeneración* elevadainformación escazainformación escaza

¿cómo es la correspondencia estructura secuencia?¿cómo es la correspondencia estructura secuencia?

(*) se refiera a la degeneración del código de información(*) se refiera a la degeneración del código de información

Page 43: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Propiedades esperadas para un algoritmo inversoPropiedades esperadas para un algoritmo inverso

Se han observado plegamientos muysemejantes con secuencias diferentes, estoindica que el algoritmo debe ser degenerado.

Pero hay una conservación significativa en lassecuencias de proteínas con el mismoplegamiento, la degeneración debe sermoderada.

Page 44: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Algoritmo Rd.HMM*Algoritmo Rd.HMM*

Rosetta design (Rd)‡ ( David Baker, University of Washington, Department of Biochemistry ).Asigna residuos al esqueleto en gran concordancia con las estructuras delPDB)

((‡‡)) Kuhlman et al. Kuhlman et al. (2003). Design of a novel globular protein fold with atomic-level accuracy (2003). Design of a novel globular protein fold with atomic-level accuracy Science 302, 1364-8.Science 302, 1364-8.((‡‡) ) Misura et al.Misura et al. (2006). Physically realistic homology models built with ROSETTA can be more accurate than their (2006). Physically realistic homology models built with ROSETTA can be more accurate than theirtemplates templates Proc Natl Acad Sci U S A 103, 5361-5366. Proc Natl Acad Sci U S A 103, 5361-5366. ((‡‡) ) Rothlisberger et al.Rothlisberger et al. (2008) Kemp elimination catalysts by computational enzyme design. (2008) Kemp elimination catalysts by computational enzyme design. Nature 28(836):online-Nature 28(836):online-10.1038/nature0687910.1038/nature06879((‡‡) ) Jiang et al.Jiang et al. (2008) De Novo Computational Design of Retro-Aldol Enzymes. (2008) De Novo Computational Design of Retro-Aldol Enzymes. Science 319(5868):1387-1391Science 319(5868):1387-1391

††Martínez-Castilla, L. P. and Rodríguez-Sotres, R. (2010) Plos one 5, e12483Martínez-Castilla, L. P. and Rodríguez-Sotres, R. (2010) Plos one 5, e12483

Page 45: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

y “HMMer” y “HMMer” (Sean R. Eddy, Washington University*)(Sean R. Eddy, Washington University*)

ProcesoProceso Markoviano:Markoviano:es una cadena aleatoria de estados enes una cadena aleatoria de estados enla que los estados futuros dependenla que los estados futuros dependensólo del estado presentesólo del estado presente

Trasiciones de estado en un ModeloTrasiciones de estado en un ModeloMarkovianoMarkoviano Oculto Ocultox —x — estados (ocultos)estados (ocultos)y —y — salida (observable)salida (observable)aaijij — — probabilidades de las transicionesprobabilidades de las transiciones

(ocultas)(ocultas)b — frecuencias de emisión (observables)b — frecuencias de emisión (observables)

HMM=ModeloHMM=Modelo MarkovianoMarkoviano oculto:oculto: Modelo estadístico de un Modelo estadístico de un procesoproceso MarkovianoMarkoviano con parámetros con parámetrosdesconocidosdesconocidos

(*) (*) Eddy SR(2004) Nature Biotech. 22:1315.Eddy SR(2004) Nature Biotech. 22:1315.

Page 46: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

El programa HMMER construye un modelo Markoviano ocultoEl programa HMMER construye un modelo Markoviano ocultode un alineamiento...de un alineamiento...

1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0. . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . |

1 e 9 g 2 0 0 1 0 . p d b N F T V A K V G A P G A E N F A T A V R L N G F P V S A H H D I P L H Y D E N N N K F L T V I E I P K G Q Q A D L R I M L W Y Q L D P I M P A R Q N G Q L R F E K K V A D A E G A E T N F G A L P E T H1 e 9 g 4 0 0 2 2 . p d b N F T V A I V G A E N A E N F A T A V R L N G F P V S A H H D I P L H Y D E N N N L F L V V I E I P K G Q Q A D K R I I L W Q P L D P I R I A R Q N G Q L R F R K K V A D H E G A D S N E G A L P E T H1 e 9 g 3 0 0 0 5 . p d b N F T V D K V G A P G A E N F R T A V R L N G F P V S A H H D I D A H Y D E N N N I F K T V I E R P K G Q Q A D K R I L L W E P G D P I G I A R E N G Q L R F E K K V A D Q E G A N S N E G A L P E T H1 e 9 g 3 0 0 2 9 . p d b N F T V I K V G A P G A E N F R T M V A L N G F P V S A H H A I P A H A D E N N N I F K T V I E I P K G Q Q A D K R I L L W E P G D P I G I A R Q N G Q L R F E K K V A D Q E G S N S N R G A L P R T L1 e 9 g 2 0 0 0 5 . p d b N Y T V E K I G A P G A E N F R T H V R L N G F P V S A H H D I D A H Y D E N N N K F K T V I E I P K G Q Q A D K R I L L W E P G D P I G I A R Q N G Q L R F D K K V A D Q E G A N T N F G A L P E T L1 e 9 g 6 0 0 1 3 . p d b N F T V E K I G A P G A E N F A T H V R L N G F P V S A H H D I D A H Y D E N N N E F K V V I E I P K G Q Q A D L T I A L W Y P G D P I T P S R Q N G Q L R F R K K V A D A E G S T S N T G A L P E T H1 e 9 g 6 0 0 2 5 . p d b N F T V E I I G A P G A E N F A T H V R L N G F P V S A H H D I D A F A D K N N N I F K V V I E R P K G Q Q A D K S I A L W Y V G D P I T I R R Q N G Q L R F D K K V L D A V G D T S N S G S L P R T H1 e 9 g 2 0 0 5 8 . p d b N F T T A E I G A P G A E Q Y A T H V R L N G F P V S A H H D I P A H Y D E N N H K F L T V I T I P K G Q Q A D L Q I I L W Q V G D P I R P A R Q N G Q L R F E K K V A D H E G S D S N R G H L P E T H1 e 9 g 6 0 0 1 5 . p d b N F T V A K I G A E G A E N F L T H V R L N G F P V S A H H D I P A H Y D E N N N L F L T V I E I P K G Q Q A D K A I L L W Y P G D P I G I R R R N G Q L R F E K K V A D H E G S D S N R G A L P E T H1 e 9 g 6 0 0 7 9 . p d b N F T T E E I G A K G A E N Y A T H V R L N G F P V S A H H D I P A H Y D E N N K L F L T V I E I P K G Q Q A D L R I M L W Y P G D P I M P A R E N G Q L R F E K K V A D H E G M D V N W G A L P E T HC o n s e n s u s N T G A A E T V L N G F P V S A H H I D N N F V I P K G Q Q A D I L W D P I R N G Q L R F K K V D G N G L P T

1 1 0 1 2 0 1 3 0 1 4 0 1 5 0 1 6 0 1 7 0 1 8 0 1 9 0 2 0 0. . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . | . . . . |

1 e 9 g 2 0 0 1 0 . p d b L K S N R V H N N T N A P G A G V A I L V S V H S N R V G E T G K V T V V I A L G I T F L I E N G Y A S P V V H A V E V E A P L A N L L T S A S D I Q I F H P G Q L E N D L K F Y W T K E I A E G Q P P1 e 9 g 4 0 0 2 2 . p d b L K S N E V H D E T N S P G S G E A I R V S V H S N D V G Y T G A V I V T E A L G I T H L I R N G Y S D P V V H A V R V E D D L S S L L T S A N D I Q I F H P G Q L E N D L K F H W T E E I A E G Q P P1 e 9 g 3 0 0 0 5 . p d b N K S N E V V N Q T N S P G D G T A S H V E V H S N E V G E T G R V E T V K A T G V T H E E N N G Y D D D N V H A I R T D A P L A D L V T S A N D N Q I F F P G Q E N N D K K F H I T R E I A H G Q P P1 e 9 g 3 0 0 2 9 . p d b L K S N E V W N N T N A P G S G T A I H V S V H S N R V G E T G K V T E V K A T G I T L L E E N G Y A S P V V H A I E V E A P L A D L V T S A N D N Q I F F P G Q E E N D L K F F W T K E I A E G Q P P1 e 9 g 2 0 0 0 5 . p d b N K S N E V D D Q T N S P G N G T A S L V S V H S N R V G E T G A V I V V I A T G T T H L I R N G Y N A D I I H A I E V K A P L A N L V T S A N D V R I F F P G Q E D N D K K F W I T K E I A E G Q P P1 e 9 g 6 0 0 1 3 . p d b L K S N E V H D N T N S P G S G T A I L V S V L S N R V G E T G A V I V T R L T G V M L L I R N G Y S A P V L F A I E V K A P L A D L V T S A D D V K I F F P G A L D N A K K F W I T S E I A E G Q P P1 e 9 g 6 0 0 2 5 . p d b L K S N E V H D E T N S P G S G T A I N V S V H S N R V G Y T G A V I K T K A T G I T H L T R N G Y S N P V V H A I E V K A P L A D L V T S A N D N Q I F F P G Q E N N D K K F Y I T S E I A E G Q P P1 e 9 g 2 0 0 5 8 . p d b L K S N E V H D N T N A P G S G T A I H V S V H S N L V G Y T G A V I V V I A T G I T F E I R N G Y S H P V V H A I S T T A P L S S L V T S A N D V Q I F F P G Q E N N D K K H H I T H E I A E G Q P P1 e 9 g 6 0 0 1 5 . p d b M K S N E V H D Q N N S P G A G Q A A H V S V H S N L V G E T G A V I V V Y A T G V T H E I R N G Y S H D V V H A I S T T A P L A N L V T S S S D N R I F F P G Q E D N D K K H H I T H E I A E G H P P1 e 9 g 6 0 0 7 9 . p d b L K S N E V V D N T N A P G S G T A I N V A V V S N L V G E T G A V I V V Y A T G I I L L I R N G Y A D P V V I A I S T T A P L S S L V T S A N D I Q I F F P G L L E N I L K H H I T E E I A H G H P PC o n s e n s u s K S N V N P G G A V V S N V G T G V G N G Y A L L T S D I F P G N K T E I A G P P

HMMERHMMER HMMHMM

Comparación deComparación denuevas secuenciasnuevas secuenciascontra el modelocontra el modelo

ProbabilidadProbabilidadyy

CalificaciónCalificaciónde pertenenciade pertenencia

Discriminación:Discriminación:¿Pertenece o no¿Pertenece o noal grupo?al grupo?

Y permite buscar secuencias queY permite buscar secuencias queprobablemente pertenecen al modeloprobablemente pertenecen al modelo

Page 47: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

El agoritmo (Rd·Hmm)El agoritmo (Rd·Hmm)

Coordenadas atómicas (esqueleto fijo)Coordenadas atómicas (esqueleto fijo)

Quitar los aa's nativos yQuitar los aa's nativos yponer aa's al azarponer aa's al azar

(intermediario inestable)(intermediario inestable)‏‏

Reconstruir múltiples estructuras,Reconstruir múltiples estructuras,permitiendo libre elección de aa'spermitiendo libre elección de aa's

Extraer las secuencias,Extraer las secuencias,alinearlas y generar un HMMalinearlas y generar un HMM

Buscar la Base de DatosBuscar la Base de Datos

1mo0f_0147.pdb DNPG-KYS-A-KIILDRGSYYVVLGDNEEIYRYGKSRDEAA-KEK-KH-A1mo0f_0147.pdb DNPG-KYS-A-KIILDRGSYYVVLGDNEEIYRYGKSRDEAA-KEK-KH-A1mo06_0121.pdb DFPG-KYS-A-KLILDDGSYYVALGDNEEVYRYGKSRDEAA-KEK-LH-A1mo06_0121.pdb DFPG-KYS-A-KLILDDGSYYVALGDNEEVYRYGKSRDEAA-KEK-LH-A1mo0f_0068.pdb DFPG-QYS-A-KIILDRGMYYVILGHNELVYRYGQSRDDVA-KEV-LH-A1mo0f_0068.pdb DFPG-QYS-A-KIILDRGMYYVILGHNELVYRYGQSRDDVA-KEV-LH-A1mo06_0135.pdb DFPG-QYS-A-KLIIDDGSWYVILGHNELVYRYGVSRDEAA-KET-LH-A1mo06_0135.pdb DFPG-QYS-A-KLIIDDGSWYVILGHNELVYRYGVSRDEAA-KET-LH-A1mo0f_0135.pdb DFPG-QYS-A-KIIIDRGMWYVVLGLNELVYRYGVSRDEAA-KET-KH-A1mo0f_0135.pdb DFPG-QYS-A-KIIIDRGMWYVVLGLNELVYRYGVSRDEAA-KET-KH-A

ROSETTA DESIGNROSETTA DESIGN

HMMerHMMer ??

AlineamientoAlineamiento

nrnr

Dado un plegamiento, Dado un plegamiento, ROSETTA designROSETTA design asigna cadenas laterales de entre una lista asigna cadenas laterales de entre una listade aa's permitidos para cada posiciónde aa's permitidos para cada posición

Page 48: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

EjemplosEjemplos

Page 49: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Apirasa humana (pdbid 1S1D, 1S18)Apirasa humana (pdbid 1S1D, 1S18) Rd·Hmm de 13 intermediarios X 77 reconstrucciones = 1001 secuencias.

hmmsearch - search a sequence database with a profile HMMHMMER 2.3.2 (Oct 2003)Sequence database: NCBI-nr Total sequences searched: 5878462Query HMM: cpx_1S1D_a-O [HMM was calibrated; E-values empirical estimates]Scores for complete sequences (score includes all domains): : 110 hitsSequence Description Score E-value N -------- ----------- ----- ------- ---gi|47168960|pdb|1S18|A Chain A, Structu 334.4 1.3e-94 1gi|112491029|pdb|2H2N|A Chain A, Crystal 334.4 1.3e-94 1gi|20270339|ref|NP_620148.1| calcium activate 334.4 1.3e-94 1gi|22218108|gb|AAM94564.1|AF328554_1 soluble calcium- 334.4 1.3e-94 1gi|114670750|ref|XP_523734.2| PREDICTED: calci 333.8 1.9e-94 1gi|112491033|pdb|2H2U|A Chain A, Crystal 333.8 1.9e-94 1...gi|74764847|sp|O96559|APY_CIMLE Apyrase precurso 135.8 7.5e-35 1gi|119609954|gb|EAW89548.1| calcium activate 130.4 3.3e-33 1gi|77696457|gb|ABB00907.1| 35.3 kDa salivar 120.9 2.4e-30 1...gi|10443907|gb|AAG17637.1|AF261768_1 salivary apyrase 109.6 5.9e-27 1gi|61817259|gb|AAX56357.1| 35.5 kDa salivar 106.2 6.1e-26 1gi|4928274|gb|AAD33513.1|AF131933_1 putative apyrase 103.4 4.5e-25 1...gi|67465798|ref|XP_649057.1| apyrase [Entamoe 33.5 1.3e-05 1gi|67472519|ref|XP_652062.1| apyrase [Entamoe 5.4 0.0025 1gi|165900885|gb|EDR27110.1| Apyrase precurso 0.7 0.0062 1gi|71280063|ref|YP_271339.1| response regulat -55.1 2.3e+02 1...gi|119358104|ref|YP_912748.1| lipase, class 3 -55.7 2.5e+02 1gi|163799550|ref|ZP_02193457.1| AMP-dependent sy -55.8 2.6e+02 1gi|31455467|dbj|BAC77359.1| putative NFkB ac -55.8 2.6e+02 1...

primer hit

primer hit

Page 50: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

NCBI-nr: las 5 secuencias más cercanas >gi|47168960|pdb|1S18| Structure And Protein Design Of Human Apyrase ...>gi|112491029|pdb|2H2N|A Crystal Structure Of Human Soluble Calcium-Activated Nucleotidase >gi|20270339|ref|NP_620148.1| calcium activated nucleotidase 1 [Homo sapiens]...>gi|22218108|gb|AAM94564.1|AF328554_1 soluble calcium-activated nucleotidase 1 [Homo sapiens]>gi|114670750|ref|XP_523734.2| PREDICTED: calcium activated nucleotidase 1 isoform 4

[Pan troglodytes]gi|114670752|ref|XP_001158629.1| ...

Última secuencia recuperada con significancia estadísticagi|165900885|gb|EDR27110.1| Apyrase precurso 0.7 0.0062 1

Page 51: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Probando el algoritmo Rd·hmm con modelos sometidosProbando el algoritmo Rd·hmm con modelos sometidosal concurso CAPSal concurso CAPS

Se tomaron modelos de los concursos CASP (2006 &2007, si la estructura llegó al PDB)

Se eligieron modelos buenos y malos según loscriterios de calidad del CASP. Sus Rd·hmm recupera:

su secuencia con un log(E) << -10, para modelosmuy buenos.

su secuencia con un E significativo, pero no tanpequeño, para modelos intermedios

Nada, o a veces, el molde empleado para hacer elmodelo, en los modelos erróneos.

Page 52: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

Comparar modelosComparar modelos

Veamos el resultadoVeamos el resultado

Page 53: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

ResultsResults

hit# ID Description E-value hit# ID Description E-value 1 pdb|2GZX|A TatD-dnase 7.7e-53 1 pdb|2GZX|A TatD-dnase 7.7e-53 127 pdb|1J6O|A TatD-dnase 5.1e-26 127 pdb|1J6O|A TatD-dnase 5.1e-26

hit# ID Description E-value hit# ID Description E-value 2 pdb|1J6O|A TatD-dnase 4.9e-49 2 pdb|1J6O|A TatD-dnase 4.9e-49 37 pdb|2GZX|A TatD-dnase 7.7e-43 37 pdb|2GZX|A TatD-dnase 7.7e-43

hit# ID Description E-value hit# ID Description E-value 23 pdb|2GZX|A TatD-dnase 1.0e-08 23 pdb|2GZX|A TatD-dnase 1.0e-08 53 pdb|1J6O|A TatD-dnase 6.7e-07 53 pdb|1J6O|A TatD-dnase 6.7e-07

hit# ID Description E-value hit# ID Description E-value 1 ref|ZP_01313406.1| TatD-related dnase 2 1 ref|ZP_01313406.1| TatD-related dnase 2 5 pdb|1J6O|A TatD-dnase 44 5 pdb|1J6O|A TatD-dnase 44

hit# ID Description E-value hit# ID Description E-value 1 ref|ZP_00143920.1| SEC-IND. PROT TATD 0.77 1 ref|ZP_00143920.1| SEC-IND. PROT TATD 0.77 3 ref|YP_591104.1| TatD-related dnase 2.8 3 ref|YP_591104.1| TatD-related dnase 2.8

hit# ID Description E-value hit# ID Description E-value 1 ref|NP_743856.1| 2-pyrone-4,6-dicarb.Hdr 19 1 ref|NP_743856.1| 2-pyrone-4,6-dicarb.Hdr 19 2 2FFI|A 2-pyrone-4,6-dica 37 2 2FFI|A 2-pyrone-4,6-dica 37

PoorPoor WrongWrong

CrystalCrystal CloseClose

WideWide NarrowNarrow

Page 54: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

1J601J602GZX2GZX

T0315_pT0315_p

El modelo cercano es intermedio entreEl modelo cercano es intermedio entrelos cristales 1J60 y 2GZXlos cristales 1J60 y 2GZX

El modelo cercano es intermedio entreEl modelo cercano es intermedio entrelos cristales 1J60 y 2GZXlos cristales 1J60 y 2GZX

Page 55: Métodos bioinformáticos para el estudio de interacciones ...depa.fquim.unam.mx/amyd/archivero/Aplicaciones_RodriguezSotres... · rutas de plegamiento ... Thanks James, I’ll open

El modelo incorrecto y su “pariente” estructuralEl modelo incorrecto y su “pariente” estructuraldistante 2FFIdistante 2FFI

Secuencias no relacionadas, peroSecuencias no relacionadas, peroestructuras 3-D ...estructuras 3-D ...