tesis joseramonlopezblanco 2012 public

230
 Nuevos métodos para el ajuste exible de estructuras macromoleculares a distintas resoluciones empleando modos normales de vibración en coordenadas internas Universidad Complutense de Madrid Facultad de Ciencias Químicas Departamento de Bioquímica y Biología Molecular I Tesis Doctoral  José Ramón López Blanco 2012

Upload: tocamelosguevos

Post on 22-Jul-2015

60 views

Category:

Documents


0 download

TRANSCRIPT

Nuevosmtodosparaelajustefexiblede estructurasmacromolecularesadistintas resolucionesempleandomodosnormalesde vibracin en coordenadas internasUniversidad Complutense de MadridFacultad de Ciencias QumicasDepartamento de Bioqumica y Biologa Molecular ITesis DoctoralJos Ramn Lpez Blanco2012Universidad Complutense de MadridFacultad de Ciencias QumicasDepartamento de Bioqumica y Biologa Molecular IMemoria presentada para optar al grado de Doctor porJos Ramn Lpez BlancoEsta tesis doctoral ha sido llevada a cabo en los Departamentos de Biologa Fsico-Qumica del Centro de Investigaciones Biolgicas y de Qumica Fsica Biolgica del Instituto de Qumica-Fsica Rocasolano (ambas instituciones del CSIC) bajo la direccin del Dr. Pablo Chacn Montes. Firma del Doctorando Conformidad del Director _________________ _________________ Jos Ramn Lpez BlancoDr.Pablo Chacn MontesA toda mi familia... indice general1.Motivacin ....................................... 12.Objetivos .......................................113.Introduccin....................................133.1. Anlisis vibracional...............................133.1.1.El modelo fsico .................................133.1.2.Modelos reduccionistas.............................153.1.3.Anlisis vibracional en coordenadas internas ..................193.2.Validacin del anlisis vibracional ......................193.2.1. Correlacinconlasfuctuacionesatmicas ...................193.2.2.Correspondencia con dinmica esencial .....................213.2.3.Correlacin con conjuntos de conformaciones obtenidos por RMN......223.3.Aplicaciones del anlisis vibracional.....................243.3.1. Prediccindefexibilidad ............................243.3.2. Refnamientoestructural .............................253.3.3.Transiciones conformacionales.........................263.3.4.Prediccin de interacciones protena-protena .................263.3.5.Prediccin de interacciones protena-ligando ..................273.3.6.Respuesta mecnica ...............................283.3.7. Ajustefexibledemapasdemicroscopaelectrnica ..............293.4.Microscopa electrnica y anlisis de partculas individuales......293.4.1.Preparacin de la muestra ............................303.4.2.Toma de micrografas..............................313.4.3.Procesamiento de imagen y reconstruccin tridimensional ...........323.5.Ajuste macromolecular .............................343.5.1.Ajuste rgido ...................................343.5.2. Ajustefexible ..................................353.5.3. Mtodosdeajustefexiblebasadosenelanlisisvibracional ..........35 ii3.5.4. Mtodosdeajustefexiblebasadosendinmicamolecular ...........363.5.5. Mtodosdeajustefexiblebasadosenotrasaproximaciones ..........404.Materiales y mtodos..............................454.1.Anlisis vibracional ...............................454.1.1.Anlisis vibracional en coordenadas generalizadas ...............454.1.2.Anlisis vibracional en coordenadas cartesianas................464.1.3.Anlisis vibracional en coordenadas internas ..................474.1.4.Implementacin del mtodo rpido de Go Clculo del Hessiano .......494.1.5.Implementacin del mtodo rpido de Go Clculo del tensor mtrico ....544.1.6.Mover en coordenadas internas .........................554.2. Representaciones reduccionistas.......................574.2.1.Modelos de coordenadas internas ........................574.2.2.Modelos atmicos ................................594.2.3.Modelos de red elstica.............................604.3. Aplicaciones del anlisis vibracional en coordenadas internas.....614.3.1.Anlisis vibracional iMode..........................614.3.2.Visualizacin - iModview ............................634.3.3.Animacin de modos - iMove ..........................634.3.4.Simulacin de Monte Carlo - iMC.......................644.3.5.Simulacin de transiciones conformacionales - iMorph ............654.3.6. Ajuste fexible de estructuras atmicas en mapas de densidad de microscopaelectrnica-iModft ...............................674.4. Reconstruccin tridimensional de RepB y su complejo con ADN...694.4.1.Preparacin de las muestras ...........................694.4.2.Adquisicin de datos...............................694.4.3.Procesamiento de imagen y reconstruccin tridimensional ...........694.5. Herramientasauxiliares .............................714.5.1.Mtricas de comparacin de modos normales ..................714.5.2.Actualizacin del programa de anlisis vibracional DefProt.........724.5.3.Dinmica esencial y anlisis de componentes principales iPca ........724.6.Datos de validacin ...............................73 iii4.6.1.Conjuntos de pruebas de estructuras atmicas .................734.6.2. Casosdeajustefexibleconmapassimulados .................764.6.3. Casosdeajustefexibleconruidosimulado ...................764.6.4. Casosdeajustefexiblebasadosenmodeladoporhomologa.........774.7. Ajustefexibleconotrasherramientas ....................774.8. Detalles tcnicos .................................795.Resultados y discusin.............................815.1. Diseo e implementacin ...........................815.1.1.Implementacin del anlisis vibracional en coordenadas internas.......815.1.2. Efcienciadelanlisisvibracionalencoordenadasinternasycartesianas ...855.2. Validacin del anlisis vibracional en coordenadas internas .......885.3. Validacin de las representaciones reduccionistas .............925.3.1.Validacin de los modelos atmicos .......................925.3.2.Validacin de la reduccin del nmero de coordenadas internas........935.4. Validacin del anlisis vibracional en ARN .................945.5. Validacin del anlisis vibracional en sistemas muy grandes......955.6. Simulacin de trayectorias de transiciones conformacionales ......965.6.1.Simulacin de trayectorias de transiciones conformacionales en protenas ...965.6.2.Simulacin de trayectorias de transiciones conformacionales con distintos modelos atmicos de protenas ..............................995.6.3.Simulacin de trayectorias de transiciones conformacionales en ARN .....1005.6.4.Simulacin de trayectorias de transiciones conformacionales reduciendo el nmero de coordenadas en protenas y ARN......................1005.7. Validacin de las simulaciones de Monte Carlo..............1015.7.1.Muestreo restringido ...............................1035.8. ValidacindelaherramientadeajustefexibleiModft ........1045.8.1. ValidacindeiModftencasossimuladosdeprotenas .............1045.8.2.Validacin de los modelos atmicos reduccionistas de protenas ........1065.8.3.Validacin de la reduccin del nmero de coordenadas internas en protenas. 111 iv5.8.4.Dependencia de los ajustes con el nmero de modos .............. 1185.8.5.Dependencia de los ajustes con la orientacin inicial ..............1205.8.6. ValidacindeiModftencasossimuladosdeARN ...............1215.8.7.Comparacin con otros mtodos basados en anlisis vibracional ........1265.8.8.Comparacin con mtodos basados en dinmica molecular ..........1305.8.9.Comparacin con mtodos basados en dinmica molecular utilizando estructuras modeladas por homologa ............................1365.8.10. Comparacinconmtodosbasadosenotrasaproximaciones .........1405.8.11. EfectodelruidoenlosmodelosobtenidosconiModft,NMFFyYUPSCX.1435.8.12. ComparacinentrelostiemposdeclculodeiModft,NMFFyYUPSCX ..1485.8.13. ValidacindeiModftencasosexperimentalesdeajustefexible .......1495.8.14. ComparacindeiModftconNMFFyYUPSCXencasosexperimentales ..1715.8.15. ValidacindeiModftconmapasexperimentalesdelribosoma ........1745.9. Reconstrucciones tridimensionales del sistema RepB ...........1775.9.1. Resolviendolaambigedadcristalogrfca ...................1785.9.2.Reconstruccin en presencia de ADN ......................1825.9.3. AjustefexibledelasreconstruccionesdeRepBconiModft .........1825.10.Diseminacin de la metodologa desarrollada ...............1856.Conclusiones....................................1897.Apndice.......................................1938.Bibliografa.....................................195 vndice de tablasTabla 1.Solapamiento entre los espacios vectoriales descritos por NMA y por los componentes principales de conjuntos de estructuras de RMN. . . . . . . . . . . . . . . . . . . . . . . . . . .23Tabla 2.Servidores web basados en NMA.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24Tabla 3.Conjuntos de pruebas de transiciones conformacionales. . . . . . . . . . . . . . . . . . . . . .74Tabla 4.Casosdeajustefexiblebasadosenestructurasdemodeladoporhomologa. . . . . .78Tabla 5.Comparacin entre los tiempos de clculo del NMA en CI y CC empleando estructuras de protenas.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .86Tabla6.Solapamientosdelosvectoresdetransicindeprotenasconlosmodosnormales obtenidos en CI y CC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90Tabla7.SolapamientosdelosvectoresdetransicindeprotenasyARNconlosmodos normales de representaciones reduccionistas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92Tabla 8.Comparacin entre los tiempos de clculo del NMA en CI y CC con ARN. . . . . . .96Tabla 9.Resultados promedio de las simulaciones de transiciones conformacionales. . . . . .97Tabla10.Exploracin conformacional basada en los modos normales en CI y muestreo deMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102Tabla 11.Resultadospromediodelosajustesfexiblesdeprotenasrealizadosconelmodeloatmico HA y el 5% de los modos en funcin de la resolucin.. . . . . . . . . . . . .105Tabla12.Comparacin entre los ajustes fexibles de protenas realizados con los distintosmodelos atmicos y el 5% de los modos en funcin de la resolucin. . . . . . . . . .108Tabla 13.Comparacinentrelosajustesfexiblesdeprotenasobtenidosfjandoaleatoriamentedistintos porcentajes de ngulos diedros con el modelo atmico HA en funcin de la resolucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110Tabla 14.Comparacinentrelosajustesfexiblesdeprotenasobtenidosalfjaraleatoriamentedistintos porcentajes de ngulos diedros con el modelo atmico C5 en funcin de la resolucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116Tabla 15.ComparacinentrelosajustesfexiblesdeprotenasobtenidosalfjaraleatoriamentedistintosporcentajesdengulosdiedrosconelmodeloatmicoCenfuncindelaresolucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 viTabla 16.Comparacinentrelosajustesfexiblesdeprotenasobtenidosempleandodistintosporcentajes de modos con el modelo atmico HA en funcin de la resolucin.. . 119Tabla 17.Comparacindelefectodelaorientacininicialenlosajustesfexiblesdeprotenascon el 5% de los modos y el modelo atmico HA. . . . . . . . . . . . . . . . . . . . . . . . .120Tabla 18.ResultadospromediodelosajustesfexiblesdeARNrealizadosconel5%delosmodos en funcin de la resolucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .121Tabla20.Comparacin entre los ajustes fexibles deARN obtenidos al fjar aleatoriamentedistintos porcentajes de ngulos diedros en funcin de la resolucin. . . . . . . . . .124Tabla 19.ResultadospromediodelosajustesfexiblesdeARNrealizadosconel5%delosmodos y 1 de umbral de re-diagonalizacin en funcin de la resolucin. . . . . .124Tabla 21.ComparacinentrelosajustesfexiblesdeARNobtenidoscondistintosporcentajesde modos en funcin de la resolucin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .125Tabla22.ComparacindeiModft con otros mtodos de ajuste fexible basados en NMA yCC.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126Tabla 23.ComparacinentrelosajustesfexiblesdeprotenasllevadosacaboconNMFF a distintas resoluciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128Tabla 24.ComparacinentrelosajustesfexiblesdeprotenasllevadosacaboconYUPSCX e iModft a distintas resoluciones.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131Tabla 25.Comparacin entre iModft y MDFF utilizando ajustes con mapas simulados. . .133Tabla26.ComparacinentreiModftyelmtodoTama1utilizandoajustesconmapas simulados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134Tabla27.ComparacinentreiModftyelmtodoTama2utilizandoajustesconmapas simulados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135Tabla 28.Comparacin de iModft con otros mtodos basados en MD utilizando el conjunto de pruebas de modelado por homologa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .137Tabla29.ComparacinentreiModftyelmtododeZhengutilizandoajustesconmapas simulados y distintos niveles de ruido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .142Tabla 30.Evaluacin de la calidad de las estructuras obtenidas con iModft utilizando mapas simulados y distintos niveles de ruido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .144 viiTabla31.Desviaciones fnales de los modelos obtenidos con iModft, NMFFyYUPSCX utilizando mapas simulados y distintos niveles de ruido. . . . . . . . . . . . . . . . . . . .145Tabla 32. Evaluacin de la calidad de las estructuras obtenidas con YUPSCX utilizando mapas simulados y distintos niveles de ruido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .146Tabla 33. Evaluacin de la calidad de las estructuras obtenidas con NMFF utilizando mapas simulados y distintos niveles de ruido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .147Tabla 34.ComparacindelostiemposdeajustefexibleconiModft, NMFF y YUPSCX. .148Tabla 35.Casosdejustefexibleconmapasexperimentales. . . . . . . . . . . . . . . . . . . . . . . . .150Tabla 36.ResultadosdelajustefexibleconiModftutilizandomapasexperimentales.. . .151Tabla37.ComparativaentrelosmtodosYUPSCX, NMFFeiModftutilizandomapas experimentales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172Tabla38.Comparativa entre la calidad estructural de los modelos fnales obtenidos conYUPSCX,NMFF,eiModftutilizandomapasexperimentales.. . . . . . . . . . . . . .173Tabla A1.Solapamientos individuales de los vectores de transicin con los modos normales de protenas obtenidos en CI. .............................193Tabla A2.Solapamientos individuales de los vectores de transicin con los modos normales de ARN obtenidos en CI. ...............................193Tabla A3.Resultadosindividualesdelassimulacionesdetransicionesconformacionalesde protenas. .....................................194Tabla A4.Resultadosindividualesdelassimulacionesdetransicionesconformacionalesde ARN. .......................................194 viii ixndice de fgurasFigura 1.Algunas macromolculas biolgicas de gran tamao y su localizacin celular ... 1Figura2.Comparacin de las principales tcnicas experimentales para obtener informacinestructural de complejos macromoleculares de gran tamao ............ 2Figura 3.Ajustemacromolecularrgidoyfexible...................... 4Figura4.Algunas estructuras macromoleculares a media/baja resolucin que experimentancambios conformacionales de gran amplitud.................... 5Figura 5.Modos normales de vibracin ............................ 7Figura 6.Representacin esquemtica del modelo fsico de osciladores armnicos acoplados considerado en el NMA ..............................13Figura 7.Modelo energtico del anlisis vibracional....................14Figura 8.Algunas redes elsticas..............................16Figura 9.Comparacin de los B-factors de MD y NMA..................20Figura 10.Comparacin del solapamiento entre los espacios vectoriales de ED y NMA.22Figura 11.Imgenes en proyeccin de partculas individuales de la protena RepB....30Figura12.Representacinesquemticadelprocesodereconstruccin3Dpormicroscopa electrnica de transmisin y anlisis de partculas individuales.........33Figura 13.Modelo de dos cuerpos de Go ..........................48Figura 14.Modelo de movimiento para calcular el Hessiano por el mtodo rpido de Go .50Figura15.ModelodeunidadesrgidasarticuladasparaobtenerelHessianoporelmtodo rpido de Go ....................................52Figura 16.Clculo de la matriz U para obtener el Hessiano por el mtodo rpido de Go .53Figura17.Representacin esquemtica de la divergencia en la aproximacin lineal de unatrayectoria curva ..................................56Figura18.Representacin esquemtica de tres aproximaciones distintas para actualizar lasposiciones atmicas ................................57Figura 19.Representacin esquemtica de los modelos atmicos y de CI para protenas.58 xFigura20.RepresentacinesquemticadelmodeloatmicoydeCIparacidos nucleicos .....................................59Figura 21.Modelos atmicos de protenas .........................60Figura 22.Representacin de modos normales con iModview...............62Figura 23.DiagramadefujodeiMC ............................65Figura 24.DiagramadefujodeiMorph ..........................66Figura 25.DiagramadefujodeiModft ...........................68Figura 26.Modelo inicial de RepB obtenido por RCT...................70Figura 27.PerflesdeFSCdelasreconstrucciones3DdeRepB ..............71Figura 28.Coste computacional del clculo de las matrices del sistema por los mtodos rpido y directo ......................................82Figura 29.Coste computacional de la fase de diagonalizacin ...............84Figura 30.Porcentajes de tiempo requeridos para efectuar las distintas tareas del NMA ..84Figura 31.Consumo de memoria del anlisis vibracional ..................85Figura 32.Comparacin de los tiempos de clculo del NMA en CI y CC.........87Figura 33.Comparacin del consumo de memoria del NMA en CI y CC.........88Figura 34.Comparacin visual del vector de transicin con el primer modo normal en CI.89Figura35.Comparacinvisualdelosprimerosmodosnormalesdeunaprotenaen CI y CC ......................................91Figura 36.Simulacin de una trayectoria de transicin conformacional..........98Figura 37.Muestreo conformacional de MC........................103Figura38.Desviaciones individuales de los ajustes fexibles con el modelo HA y mapassimulados de protenas..............................106Figura39.Tiempo de clculo necesario para efectuar los ajustes fexibles de protenas enfuncin del modelo atmico y la resolucin...................109Figura40.Desviaciones individuales de los ajustes fexibles de protenas obtenidoseliminando aleatoriamente el 50% de las variables con el modelo HA en funcin de la resolucin .................................... 113 xiFigura41.Desviaciones individuales de los ajustes fexibles de protenas obtenidoseliminando aleatoriamente el 90% de las variables con el modelo HA en funcin de la resolucin .................................... 115Figura42.Tiempo de clculo necesario para efectuar ajustes fexibles de protenas con elmodeloHAenfuncindelaresolucinydelporcentajedengulosfjado... 115Figura 43.Tiempo de clculo necesario para efectuar los ajustes de protenas con el modelo C5enfuncindelaresolucinydelporcentajedengulosfjado ........ 118Figura 44.Tiempo de clculo necesario para efectuar los ajustes de protenas con el modelo Cenfuncindelaresolucinydelporcentajedengulosfjado ........ 118Figura45.Desviaciones individuales de los ajustes fexibles con mapas simulados deARN ........................................122Figura 46.Desviacionesindividualesobtenidasporlasherramientasdeajustefexiblebasadasen NMA en los casos de ajuste con mapas simulados de protenas ........128Figura47.Desviaciones individuales fnales obtenidas por YUPSCXenloscasosdeajuste fexibleconmapassimuladosdeprotenas ....................133Figura 48.Desviacionesindividualesobtenidasconlasherramientasdeajustefexiblebasadasen MD y el conjunto de pruebas de modelado por homologa..........138Figura 49.Mapas simulados a 10 de resolucin de la adenilato quinasa con distintos niveles de ruido......................................141Figura 50.Sistema GroEL/GroES ..............................152Figura51.Ajuste fexible de la estructura atmica de GroEL en un mapa experimental demicroscopa electrnica a 8 ...........................154Figura52.Ajuste fexible de la estructura atmica de GroEL en un mapa experimental demicroscopa electrnica a 10..........................155Figura53.Ajuste fexible de la estructura atmica del EFG en un mapa experimental demicroscopa electrnica a 11..........................156Figura 54.ComparacindelosajustesfexiblesdelaestructuraatmicadelEFGenunmapaexperimental ....................................157Figura 55.Ajustefexibledelaestructuraatmicadeprefoldinaenunmapaexperimentaldemicroscopa electrnica a 20..........................158 xiiFigura 56.Ajustefexibledelaestructuraatmicadelaprotenaclampenunmapaexperimentalde microscopa electrnica a 17 .........................159Figura57.Ajuste fexible de la estructura atmica de la ATPasa de calcio en un mapaexperimentaldemicroscopaelectrnicade8.................161Figura58.Ajuste fexible de la estructura atmica de la bomba de cobre en un mapaexperimentaldemicroscopaelectrnicaa17.................162Figura 59.Mapasexperimentalesdeltermosoma ......................164Figura 60.Ajustefexibledelaestructuraatmicadeltermosomaenunmapaexperimentaldemicroscopa electrnica a 10..........................165Figura61.Ajuste fexible de la estructura atmica de laARN polimerasa II humana en unmapaexperimentalabiertodemicroscopaelectrnicaa22 ..........166Figura62.Ajuste fexible de la estructura atmica de laARN polimerasa II humana en unmapaexperimentalcerradodemicroscopaelectrnicaa22 ..........167Figura 63.Cambios conformacionales de la ARN polimerasa II humana ..........168Figura 64.Estructura de los microtbulos decorados con Ndc80/Nuf2 ilustrada sobre un mapa de microscopa electrnica a 8.........................169Figura 65.AjustergidodelasestructurasdetubulinayNdc80/Nuf2enunmapaexperimentaldel microtbulo decorado con Ndc80/Nuf2 a 8 .................170Figura 66.AjustefexibledelasestructurasdetubulinayNdc80/Nuf2unelmapaexperimentaldel microtbulo decorado con Ndc80/Nuf2 a 8 .................171Figura 67.Ajuste rgido inicial del ribosoma........................175Figura 68.Ajustefexibledelribosoma70S .........................176Figura 69.Funcin de RepB .................................179Figura 70.Pruebas de relajacin de simetra durante la reconstruccin 3D de RepB ....180Figura 71.Reconstruccin 3D por microscopa electrnica y SP de RepB libre......181Figura 72.Ajuste rgido de la estructura atmica de RepB en el mapa de microscopa ..181Figura73.Reconstruccin3DdemicroscopaelectrnicaySPdeRepBenpresenciade ADN ........................................182 xiiiFigura74.ComparacinentrelosmapasdelaprotenaRepBlibreyenpresenciade ADN ........................................183Figura 75.AjustefexibledelhexmerodelaprotenaRepBlibreutilizandoiModft...184Figura 76.AjustefexibledelcomplejodelaprotenaRepBenpresenciadeADNutilizandoiModft .......................................185Figura 77.Diseminacin de iMod ..............................186Figura 78.Diseminacin de iModft .............................187 xiv xvAcrnimos2D: Bidimensional.3D: Tridimensional.ADN: cidodesoxirribonucleico.ADP: Adenosn difosfato.ANM: Modeloderedanisotrpica(delingls,Anisotropic Network Model).ARN: cido ribonucleico.ARNm: ARN mensajero.ARNP: ARN polimerasa.ARNr: ARN ribosmico.ARNt: ARN de transferencia.ATP: Adenosn trifosfato.BPTI: Inhibidordelatripsinapancreticabovina(delingls,Bovine Pancreatic Trypsin Inhibitor).CC: Coordenadas Cartesianas.CCD: Dispositivoacopladodecarga(delingls,Charge Coupled Device).CCMV: Virusdelajudaclorticamoteada(delingls,Cowpea Chlorotic Mottle Virus).CG: Reduccionista(delingls,Coarse-Grained).CI: Coordenadas Internas.CIB: Centro de Investigaciones Biolgicas.CRE: Cristalografa de Electrones.CRX: CristalografadeRayosX.CSIC: ConsejoSuperiordeInvestigacionesCientfcas.Ct: ExtremoC-terminal.CTF: Funcindetransferenciadecontraste(delingls,Contrast Transfer Function).DTT: Ditiotreitol.ED: Dinmicaesencial(delingls,Essential Dynamics).ed-ENM: Modeloderedelsticadedinmicaesencial(delingls,essential dynamics Elastic Network Model).EDTA: cidoetilendiaminotetraactico(delingls,Ethylenediaminetetraacetic acid).EMDB: Bancodedatosdemicroscopaelectrnica(delingls,Electron Microscopy Data Bank).FFT: TransformadarpidadeFourier(delingls,Fast Fourier Transform). xviFSC: CorrelacindecapasdeFourier(delingls,Fourier Shell Correlation).GDP: Guanosn difosfato.GDPNP: Guanosn diiminodifosfato.GNM: Modeloderedgaussiana(delingls,Gaussian Network Model).GTP: Guanosn trifosfato.HA: tomospesados(delingls,Heavy Atoms).IBDV: Virusdelaenfermedaddelabursitisinfecciosa(delingls,Infectious Bursal Disease Virus).IPI: Interpolacin Parablica Inversa.IRB: InstitutodeInvestigacinBiomdica(delcataln,Institut de Recerca Biomdica).MC: Monte Carlo.MD: Dinmicamolecular(delingls,Molecular Dynamics).MET: Microscopa Electrnica de Transmisin.NMA: Anlisisdelosmodosnormalesdevibracin(delingls,Normal Mode Analysis).NO: Solapamientonativo(delingls,Native Overlap).Nt: ExtremoN-terminal.PC: Ordenadorpersonal(delingls,Personal Computer).PCA: Anlisisdecomponentesprincipales(delingls,Principal Component Analysis).PCC: Canalconductordeprotenas(delingls,Protein Conducting Channel).PDB: Bancodedatosdeprotenas(delingls,Protein Data Bank).RAM: Memoriadeaccesoaleatorio(delingls,Random Access Memory).RC: Crculorodador(delingls,Rolling Circle).RCT: Girocnicoaleatorio(delingls,Random Conical Tilt).RMN: Resonancia Magntica Nuclear.RMSD: Desviacincuadrticamedia(delingls,Root Mean Square Deviation).RTB: Rotacintraslacindebloques(delingls,Rotation Translation of Blocks).SCV: Escaladodelavariablecolectiva(SCV,delinglsScaled Collective Variable).SNR: Relacinsealruido(delingls,Signal to Noise Ratio).SP: Anlisisdepartculasindividuales(delingls,Single Particle analysis).TE: Tomografa Electrnica.TIpost: Intermediarioposterioralatranslocacin(delingls,post-Translocational Intermediate).TIpre: Intermediarioprevioalatranslocacin(delingls,pre-Translocational Intermediate).Tris: Tris(hidroximetil)aminometano.MoTIVACIN 11.MotivacinUno de los paradigmas ms importantes en biologa consiste en entender la relacin entre laestructuraylafuncindelasprotenasyloscidosnucleicos.Estasmolculas,interaccionanunasconotrasparaformargrandescomplejosmacromolecularesquesonlosencargadosde llevaracabolosprocesosfundamentalesquetienenlugarenlosorganismosvivos.Como ejemplosnotablesdeestoscomplejos(vaselaFigura1)destacan:la ARNpolimerasaque transcribeel ADNen ARNenelncleodelasclulasparaposteriormentesertraducidoen protenas en el citoplasma por los ribosomas; la ATPasa-F0F1 que sintetiza en las mitocondrias laprincipalmolculaenergticaqueutilizantodaslasclulas(ATP)apartirdeungradiente electroqumicodeprotones;losmicrotbulosymolculasdedinenadeciliosyfagelosolasfbrasdeactinaymiosinadelospseudpodosqueseentrecruzanydeslizanactivamenteentrespara permitir los distintos mecanismos de locomocin con los que se desplazan los seres vivos. Figura 1.Algunas macromolculas biolgicas de gran tamao y su localizacin celular.MoTIVACIN 2La mayora de las macromolculas actan como nano-mquinas que cambian de forma demanerabiendefnidayreguladaparallevaracabosufuncinbiolgica.Estoscambiosseencuentrancodifcadosenladisposicinespacialqueadquierenlostomos.Paradesentraareste cdigo es necesario disponer de informacin experimental directa sobre la estructura,fexibilidad y dinmica de las macromolculas en condiciones fsiolgicas. Existe una granvariedad de tcnicas experimentales que capturan informacin estructural detallada de loscomplejosmacromolecularesdegrantamaoendiversascondiciones,comocristalografaderayosX(CRX)(IlariySavino,2008)ydeelectrones(CRE)(Renault,et al.,2006),microscopaelectrnicayanlisisdepartculasindividuales(SP,delinglsSingle Particle)(ChengyWalz,2009),tomografaelectrnica(TE)(Jonic,et al.,2008;Lucic,et al.,2008),odispersinderayosXdebajongulo(SAXS,delinglsSmall Angle X-ray Scattering)(Neylon,2008),entreotras.Aunque cada una de ellas permite conocer la estructura macromolecular a distintos niveles de resolucin(vaselaFigura2),lainformacinqueproporcionansobresufexibilidadydinmicasueleserinsufcienteparaobservarcmoseproducenloscambiosconformacionales.Figura 2.Comparacindelasprincipalestcnicasexperimentalesparaobtenerinformacinestructuraldecomplejosmacromolecularesdegrantamao.Estasson:cristalogrfa(CR),microscopaelectrnicadetransmisinyanlisisdepartculasindividuales(SP),dispersinderayosXdebajongulo(SAXS)ytomografaelectrnica(TE).MoTIVACIN 3Para estudiar la estructura de las macromolculas ms grandes se emplean principalmente lastcnicascristalogrfcasydemicroscopaelectrnicadetransmisin(MET).Lasprimeraspermitenresolverlaestructuraatmicaapartirdesusformascristalinas.Paraelloutilizan lainformacinestructuraldealtaresolucincontenidaenlospatronesdedifraccinquese producen cuando la radiacin electromagntica de rayos X (CRX) o un haz de electrones(CRE) interacciona con los cristales. La CRX es la tcnica de referencia para obtener aresolucinatmicaestructurasdeprotenasycidosnucleicos.Parahacerseunaideadesu importancia relativa, de las ~76000 estructuras atmicas depositadas actualmente en el PDB(ProteinDataBank) (Berman, etal., 2000), la amplia mayora proceden de CRX (~67000),mientrasquetansolounaspocas(~30)sondeCRE.Laprincipallimitacindeestastcnicasconsisteenladifcultadparaobtenercristalesquedifractenadecuadamente.Adems,unavezconseguidos estos cristales, todava existe la posibilidad de que las restricciones impuestasporelempaquetamientocristalinoalterenlasestructurasalejndolasdelaconformacin fsiolgicamenteactiva.Otralimitacineslaelevadacantidaddemuestranecesaria.Conseguirunacantidadsufcientedemuestraesespecialmentedifcilcuandolasmolculassongrandesycomplejas.Encambio,contcnicasdeMETesposibleestudiarlaestructuraqueadquierenlosgrandescomplejosmacromolecularesencondicionescercanasalasfsiolgicasutilizandocantidades muy pequeas de muestra. Las tcnicas de MET se basan en la atenuacin que sufre un haz coherente de electrones cuando atraviesa la muestra en el interior del microscopio. El hazdeelectronesatenuadoesrecogidoenundetectorparaformarimgenesenproyeccin con informacin estructural de la muestra. Para reconstruir un modelo tridimensional (3D) es necesario combinar adecuadamente sufcientes imgenes en orientaciones diferentes. En TEsegiralamuestraparaobtenerdistintasproyeccionesdelamismareginconorientaciones conocidas.Desafortunadamente,soloesposibletomarunpequeonmerodeellasdebidoaqueelhazdeelectronesdealtaenerga(~100kV)daarpidamentelamuestra.Enconsecuencia,esta tcnica est limitada a bajas resoluciones (40-60). Para minimizar el dao, en otrastcnicas de MET (SP, reconstruccin helicoidal, y anlisis de fbras, flamentos y cristalestubulares) las partculas se adsorben en un soporte de forma que cada una de ellas adquiere una orientacin aleatoria. Al tomar cada micrografa de una regin distinta de la muestra se obtienen proyeccionesdiferentesquetansolohansidoexpuestasunavezalhazdeelectrones.Deestemodoeldaoporradiacinesmuchomenor,loquepermitealcanzarresolucionesmsaltas(10-30)einclusoresolucinatmica(Zhou,2011).Como se acaba de mencionar, las limitaciones de las tcnicas cristalogrfcas reducenenormemente la variedad de condiciones experimentales diferentes (salinidad, pH, presenciaMoTIVACIN 4deligandos,etc)enlasqueesposibleconseguirestructurasaresolucinatmicadegrandescomplejos macromoleculares; sin embargo, es relativamente fcil obtener estas estructuras amedia/bajaresolucinutilizandotcnicasdeMET(generalmenteSP).Porestosmotivos,paradesentraar los mecanismos que rigen el funcionamiento de las macromolculas resulta esencial integrarlainformacinestructuraladistintasresolucionesqueproporcionanestastcnicas (Russel,et al.,2009).Conestefnserealizaloqueseconocecomoajustemacromolecular,queconsisteenlocalizarunaestructuraatmicacristalogrfcaenelinteriordeunmapadeMETamedia/baja resolucin para obtener as un modelo atmico en condiciones ms cercanas a las fsiolgicas.Aunquelosajustespuedenrealizarsemanualmente,esnecesarioutilizarmtodoscomputacionalesparaevitarsesgosyobtenermejoresresultados.Cuandoambasestructuras poseen una conformacin similar se pueden alinear directamente utilizando algn mtodo de ajuste rgido (Wriggers, 2010; Wriggers y Chacon, 2001) (vase la Figura 3). Sin embargo,esmuyfrecuentequelaconformacindelaestructuraatmicaseadiferentealadelmapa. En este caso hay que considerar la fexibilidad del modelo atmico para realizar el ajuste.Aunque ya existen herramientas efcaces para llevar a cabo el ajuste fexible, su desarrolloesrelativamenterecienteytodavaesposiblemejorar,especialmenteenloquerespectaasuefcienciacomputacionalyalacalidaddelasestructurasobtenidas.Engeneral,lamayorpartedelosmtodosdisponiblesenlaactualidad son computacionalmente costosos; otros, encambio, aunque consumen menos recursos,deterioranlacalidaddelasestructuraso se basan en aproximaciones reduccionistasque difcultan la obtencin de modelos msdetallados.Eldeteriorodelasestructurasse debe principalmente al fenmeno de sobreajuste (delingls,overftting) que tiende a producirse por distintos motivos: i) cuando la cantidad de informacin presente en los mapas a media/baja resolucin es mucho menor que la necesaria para determinar inequvocamente la localizacin de todos sus tomos, ii)cuandoladensidaddel mapanosecorresponde,tantoporexcesocomopordefecto,conlaestructuraatmica,yiii) por lapresenciaderuidoenlosmapas.Portodo RGIDoFLEXIBLEFigura 3.Ajustemacromolecularrgidoy fexible.Cuandoelmapadedensidad(izquierda)ylaestructuraatmica(arriba)presentan aproximadamente la misma conformacin queel mapa objetivo (derecha), el ajuste debe serrgido. Si la estructura atmica disponible posee una conformacin diferente (abajo) a la del mapa objetivoelajustehadeserfexible.MoTIVACIN 5ello,elajustefexibledelasestructurasmacromolecularesrepresentaunretometodolgicoycomputacionaldegranimportanciaenbiologa,especialmentecuandosetrataconcomplejosdegrantamao.Adems,estasestructurassuelenexperimentarcambiosconformacionalesdegranamplituddurantesufuncionamiento,porloqueresultaimprescindibletenerencuentasufexibilidaddeformaefciente.EnlaFigura4semuestranalgunoscambiosconformacionalesdeestetipo:elmovimientodepinzadelaARNpolimerasa,elgiro(ratcheting) del ribosoma ylamaduracindelacpsidedelvirusNudaureliacapensisomega (NV). En la presentetesissepretendeabordaresteproblemadesarrollandomtodosdeajustefexibleefcientesquemantenganlaintegridaddelasestructuras,inclusoduranteloscambiosconformacionalesdegranamplitudquesufrenestasenormesestructurasdemsde500kDademasamolecular.Cpside ViralRibosomaARN Polimerasa IIFigura 4.Algunasestructurasmacromolecularesamedia/bajaresolucinqueexperimentancambiosconformacionalesdegranamplitud.Dearribaaabajo:laARNpolimerasaII,elribosomabacterianoylacpsidedelvirusNudaureliacapensisomega(NV).MoTIVACIN 6Hastalafecha,sehandesarrolladovariasaproximacionescomputacionalesparapredecirycaracterizarlafexibilidaddelasprotenasapartirdesuestructura.La tcnica ms utilizada parasimularelcomportamientodinmicodelasmacromolculases,condiferencia,ladinmicamolecular(MD,delinglsMolecular Dynamics) (AdcockyMcCammon,2006). Esta tcnica consiste en la integracin numrica de las ecuaciones clsicas de movimiento del sistema para obtener una trayectoria. Del anlisis de estas trayectorias se puede obtener informacin estructural muy valiosa sobre los cambios conformacionales que ocurren durante el funcionamiento de las biomolculas.Adems, el empleo de potenciales interatmicos detallados y la consideracinexplcitadeldisolventehacenquelainformacinobtenidaseamuyrealista.Sinembargo, eltiempo de integracin necesario es tan pequeo (unos pocos femto-segundos) que la simulacin detrayectoriasconladuracinsufcienteparaobservargranpartedeloscambiosestructuralesasociadosaloseventosfuncionalmenteinteresantes(micro-omili-segundos)sueleresultar unatareamuycostosacomputacionalmente.Apesardeesteinconveniente,desdequeselleva cabo la primera simulacin con la protena BPTI (del ingls, BovinePancreaticTrypsin Inhibitor), de tan solo 58 aminocidos (McCammon, etal., 1977), las tcnicas de MD sellevan utilizando satisfactoriamente desde hace ms de 30 aos en el estudio de la dinmica de protenas y cidos nucleicos (AdcockyMcCammon,2006;KarplusyMcCammon,2002).Noobstante, lasimulacinconMDdemquinasmolecularesdemilesdeaminocidosdurante perodoslosufcientementelargoscomoparaobservarcambiosestructuralesfuncionalessiguerepresentandoungranreto.Porejemplo,actualmentesonnecesariasvariosdasdeclculoenun super-ordenador diseado especfcamente para alcanzar tiempos de simulacin del ordende~1mili-segundoconlaprotenaBPTI(Shaw,et al.,2009;Shaw,et al.,2010).Porello,apesardelgranrealismoydetallealcanzadosenlassimulaciones,modelarconMDlosgrandescambios conformacionales que tienen lugar en las macromolculas en el contexto del ajustefexiblenopareceserlaopcinmsefciente,siempreycuandonoseempleensimplifcacionesadicionales.Una de las alternativas ms interesantes a MD para estudiar la fexibilidad de lasmacromolculaseselanlisisvibracionaloNMA(delingls,Normal Mode Analysis). El NMA puedemodelarconrelativafacilidadlosmovimientoscolectivosydegranamplituddelos grandescomplejosmacromoleculares.Estatcnicaesunaaproximacindemecnicaclsicaquehasidoextensivamenteaplicadaenlasingenierascivil,mecnicayaeroespacial,ascomotambin en otras disciplinas (Goldstein,et al.,2002). Las primeras aplicaciones del NMA en biologacomputacionalseutilizaronenlosaos70paracaracterizarlafexibilidadde-hlicesdeunospocosaminocidos(Fanconi,et al.,1971;ItohyShimanouchi,1970;LevyyKarplus,MoTIVACIN 71979). Acomienzosdelosaos80seempleenelanlisisdelasvibracionesatmicasdel pptidoglucagn(Tasumi, etal., 1982)ydelaprotenaBPTI(Noguti y Go, 1982).Conel tiemposehaconvertidoenunatcnicamuyutilizadaparamodelarlafexibilidaddetodotipodemacromolculasbiolgicas(Bahar, etal.,2010a;BaharyRader,2005;CuiyBahar,2006;DykemanySankey,2010;Eyal,et al.,2011;Ma,2004;Ma,2005;Skjaerven,et al.,2009;Tama,2003;YangyChng,2008). La principal aproximacindeestametodologaconsisteenquelasenergaspotencialycinticavaran cuadrticamente alrededor de la conformacin de mnima de energa del sistema. A partir de estasuposicinesposibledescomponerel movimientomacromolecularenunaseriede modosdedeformacin.Estosmodosforman una base ortonormal de vectores que describe todoslosdesplazamientosodeformaciones posiblesalrededordelaconformacinde equilibrio, i.e.cualquiermovimientopuede serexpresadocomounacombinacinlinealdedichos modos. En la Figura 5 pueden verse los tresprimerosmodosdelaprotenaadenilato quinasa.Cadaunodeellosllevaasociado unaenerga(ofrecuencia)deformaquees posible determinar aquellos movimientos ms favorablesenergticamente.Ntesequea mayorfrecuencia,mayorenerga,yviceversa. Existenmuchasevidenciasquesoportanla aproximacin armnica del movimientomolecular.Lamayoradelosmovimientos deprotenasdocumentadosenelPDB corresopondenacambiosconformacionales colectivosquenoalteransingifcativamentelaestructura terciaria (Gerstein y Krebs, 1998).123Figura 5.Modosnormalesdevibracin.Sehan representadoconfechaslostresmodosdemenorenergadelaestructuraatmicadelaprotena adenilato quinasa (4ake).MoTIVACIN 8Asimismo,variosestudioshancomprobadoquetansolounospocosmodosdebajafrecuencia,losmscolectivos,soncapacesdejustifcarlamayoradeloscambiosconformacionalesqueexperimentan las protenas (Hinsen, etal., 1999; Marques y Sanejouand, 1995).Midiendo elsolapamientoentreelvectordediferenciaylosmodosnormalesde20protenasen conformacionesabiertasocerradas,TamaySanejouanddemostraronqueunospocosmodosde baja frecuencia son capaces de describir ms del 80% de sus diferencias conformacionales (TamaySanejouand,2001).EnKrebset al. (Krebs,et al.,2002) se comprob que ms de la mitad de un conjunto de 3800 movimientos de protenas puede aproximarse perturbando lasestructuras iniciales a lo largo de los dos modos de menor frecuencia.Adems, se requieremuy poca informacin sobre la estructura objetivo para conducir una estructura hacia la otra mediante una combinacin lineal de unos pocos modos de estos modos (ZhengyBrooks,2005). En Rueda et al. (Rueda,et al.,2007a) se ha determinado la buena correspondencia entre los movimientosdescritosporNMAyMDutilizandosimulacionesatomsticasdeunconjunto representativode32estructurasdeprotenas. ApesardelgrannmerodeestudiosdeNMA llevados a cabo, no es fcil identifcar qu modos son funcionalmente relevantes sin datosexperimentalesadicionales.Sinembargo,deformageneral,casisiempresernunoounospocosdelosdemenorfrecuenciaporquerepresentanlastrayectoriasdetransicinconformacional con menor coste energtico. En principio, es posible estudiar la funcin de las biomolculasfltrandolosmovimientosmenosimportantes,losdealtafrecuencia,yconcentrarseenaquellosdominantes,i.e. los de baja frecuencia y menor energa (Ma,2005).Noobstante,aunquelosmovimientos cooperativos de las transiciones conformacionales de las biomolculas siguen a menudolastrayectoriasdealguno(oalgunos)deestosmodos,susmovimientoscooperativosno siempre son descritos adecuadamente por ellos. Por ejemplo, Petrone y Pande (Petroney Pande,2006)utilizaronparesdeestructurasenconformacionesabiertasycerradasdecuatro protenas(miosina,calmodulina,NtrCyhemoglobina)para evaluar si nicamente los modos de menor frecuencia eran capaces de justifcar los cambios conformacionales. Estos autoresobservaronquealutilizarunacombinacinlinealdelos20primerosmodosparadeformar las estructuras abiertas solo es posible reducir el reducir el RMSD con las estructuras cerradas hasta el ~50% de su valor inicial.Sin embargo, a pesar de sus limitaciones, el NMA es unmtodo computacional efectivo para el estudio de los movimientos colectivos de gran amplitud queexperimentanlasmacromolculas(Bahar,et al.,2010b).En esta tesis, nos proponemos estudiar la fexibilidad de los grandes complejosmacromoleculares a travs de la aproximacin del NMA. En primer lugar, pretendemosdesarrollarunametodologaparallevaracaboefcientementeelNMAencoordenadasinternasMoTIVACIN 9(CI)delasprincipalesmacromolculasbiolgicas.LautilizacindeCInosolopermitir unincrementoadicionaldevelocidadrespectodelosmtodosbasadosencoordenadas cartesianas(CC),sinoquetambinmejorarlacalidadestructuraldelosmodelosgenerados.Ensegundolugar,seaplicarlametodologadesarrolladaparamodelarlafexibilidaddelasmacromolculas en distintos problemas de bioinformtica estructural. En esta lnea, se handesarrolladoeimplementadounaseriedeherramientasbioinformticasparaelajustefexiblede estructuras atmicas macromoleculares en el interior de mapas de densidad de media/baja resolucinprocedentesdeSP,yparalasimulacindetrayectoriasdeMonteCarlo(MC)ydetransiciones conformacionales.10OBJETIVOS 112.ObjetivosLosobjetivosprincipalesdeestatesissoneldesarrolloeimplementacindeunanueva metodologabioinformticaparaelanlisisdelosmodosnormalesdevibracin(NMA) en coordenadas internas (CI) y su aplicacin en el ajuste fexible de estructuras atmicasmacromolecularesenmapasdedensidadamedia/bajaresolucin.Conestefnseproponenlossiguientes objetivos:1.Desarrollo metodolgico del NMA en CIA.Desarrollo de una metodologa verstil para el anlisis vibracional en CI de estructuras atmicas de macromolculas con las siguientes caractersticas:i)Aplicable a las principales biomolculas: protenas y cidos nucleicos. ii)Multi-escala.Seutilizarndistintasaproximacionesreduccionistas.iii)Confgurable.Lascaractersticasdelmodeloatmico,laredelsticaylosgradosdelibertadpodrnsermodifcadosfcilmenteporelusuario.iv)Efciente.Paraextenderlaaplicabilidaddelosmtodosasistemasdegrantamaosedisearneimplementarnalgoritmosefcientes.B.Validacin sistemtica y optimizacin de la metodologa NMA desarrollada. Para ello ser necesario: i)Diseareimplementarherramientasespecfcasparaelclculo,anlisis,comparaciny visualizacin de modos normales.ii)Desarrollar herramientas de simulacin basadas en NMA para:- Animacindemodosnormalesyexploracinconformacional.- Simulacin de transiciones conformacionales.- Simulacin de Monte Carlo. iii)Obtenerdistintosconjuntosdepruebasdeestructuras atmicasexperimentalesdeprotenas y cidos nucleicos.OBJETIVOS 122.Desarrollodelametodologaparaelajustefexibledeestructurasatmicasen reconstrucciones tridimensionales de microscopa electrnica empleando NMA en CI.A.Diseo e implementacin de la herramienta bioinformtica.B.Obtencindebancosdepruebasdeajustefexibleconmapassimuladosyexperimentales.C.optimizacin y validacin de dicha herramienta con los distintos bancos de pruebas.D.Comparacinconotrosmtodosdeajustefexible.3.Aplicacin de la herramienta de ajuste fexible.A.Familiarizacin con las tcnicas de microscopa electrnica y el anlisis de partculas individuales. Reconstruccin tridimensional de la protena RepB libre y de su complejo con ADN en tincin negativa. B.Aplicacin de la metodologa de ajuste desarrollada sobre mapas experimentalesprocedentesdelabasededatosdemicroscopaelectrnica,incluyendolosmapasdelsistema RepB.INTRoDUCCIN:Anlisis vibracional133.Introduccin3.1. Anlisis vibracionalLateoradelanlisisdelosmodos normalesaplicadaalasvibraciones molecularesproporcionaunasolucin analticacompletadelasecuacionesdel movimientodelsistema(Wilson,et al.,1955).Lassolucionesdeestasecuacionessonun conjuntodevectoresdenominadosmodos normalesquerepresentan,enprincipio,todaslas formas posibles de deformar una estructura alrededor de su conformacin de equilibrio. 3.1.1.El modelo fsicoLa principal suposicin del NMA es que la molcula est representada por un conjunto deosciladoresarmnicosacoplados(Figura6)cuyasenergaspotencial(V)ycintica(K) varan cuadrticamente con sus N coordenadas (q) y sus velocidades (q),respectivamente.LaaproximacindeambasformasdeenergaseobtieneporexpansindeTayloralrededordelaconformacin de equilibrio: 201 1 1001 ...2N N NV VV V q q qq q q = = =| || | = + + + | | | \ .\ . (3.1.1) 201 1 1001 ...2N N NK KK K q q qq q q = = =| || | = + + + | | | \ .\ . (3.1.2)Cuando el sistema se encuentra en reposo puede considerarse que las energas potencial (V0) y cintica (K0)soncero,aligualquelafuerza(V/q)0 y el momento conjugado 0( ) K q . Aspues,esposibleeliminarlostrminosdeprimerordenenlasecuaciones3.1.1y3.1.2paraconsiderarque,entalescondiciones,lasenergaspotencialycinticadependennicamentedelas segundas derivadas parciales: 2 2(Hessiano) (Tensor mtrico) V KH Kq q q q = = = = H K (3.1.3) Figura 6.Representacinesquemticadel modelo fsico de osciladores armnicos acoplados considerado en el NMA.INTRoDUCCIN:Anlisis vibracional14Lascoordenadasgeneralizadas(q) pueden ser CC, rotaciones/traslaciones delslidorgido,ngulostorsionalesocualquiertipodevariableelegidaparadescribirlosN grados de libertad del sistema. Como se muestra en la Figura 7, en un sistema armnico lasenergas potencial y cintica oscilan entre sus valoresmximosymnimosalternativamente,i.e.cuandolaenergapotencialesmxima,lacinticaesmnima,yviceversa. Lasecuacionesdelmovimiento deLagrangeparacualquierconjuntode coordenadas se obtienen resolviendo:,donde L K Vd L Ldt q q =| | | | = || \ . \ .(3.1.4)Como el potencial no depende de las velocidades ni la energa cintica de las posiciones se cumple que: NLK qq =(3.1.5) NLH qq = (3.1.6)Al introducir estas expresiones en la ecuacin 3.1.4 se obtienen las Necuacionesdel movimiento para cada una de las N coordenadas del sistema: N NK q H q = (3.1.7)Cuyas soluciones armnicas son de la forma:cos( )Nk k kkq A t = +(3.1.8) 2 2 2cos( )Nk k k kkq d q dt A t = = +(3.1.9)Emaxqmax-qmaxq0E0Figura 7.Modeloenergticodelanlisis vibracional. Se ha representado esquemticamente cmovaranlasenergas(E)cintica(azul)y potencial(rojo)alrededordelaconformacinde equilibrio (q0).INTRoDUCCIN:Anlisis vibracional15Donde k es la frecuencia angular asociada a cada una de las N soluciones. Despus de introducirlasfrmulasanterioresenlaecuacin3.1.7seobtienelaexpresin: 2cos( ) cos( )N N N Nk k k k k k kk kK A t H A t | | | |+ = + ||\ . \ . (3.1.10)La nica manera de respetar la igualdad para todo instante t es: 2N Nk k kK A H A = (3.1.11)Este conjunto de ecuaciones constituye un problema generalizado de valores propios que puedeexpresarsedemaneracompactautilizandonotacinmatricial:KA = HA(3.1.12)Finalmente, la diagonalizacin simultnea de las matrices de energa cintica (K)y potencial(H), permite obtener los modos normales de vibracin de la macromolcula, i.e. los valores () y vectores (A) propiosdelsistema.Ntesequeloselementoskk de la matriz diagonal se relacionan con la frecuencia de oscilacin (k) de cada modo ksegnlaexpresin: 2 2(2 )kk k k = = (3.1.13)En la Figura 5 (vase Motivacin) se ha utilizado una representacin de fechas parailustrartantoladireccincomolamagnitudrelativadelasfuctuacionesatmicascodifcadasen los tres modos de menor frecuencia de una protena pequea.3.1.2.Modelos reduccionistasElNMAhasidoampliamenteutilizadoenqumicaparaestudiarlasvibraciones moleculares. La teora de los modos normales de vibracin aplicada a molculas pequeas ha permitido estudiar a partir de sus espectros vibracionales las fuerzas que mantienen unidos sus tomos,suestructuramolecularysuspropiedadestermodinmicas(Wilson,et al.,1955). Las primeras aplicaciones del NMA en biologa computacional datan de los aos 70 y se utilizaron paracaracterizarlafexibilidadde-hlicesdeunospocosaminocidos(Fanconi,et al.,1971;ItohyShimanouchi,1970;LevyyKarplus,1979).Acomienzosdelosaos80seestudiaronlasfuctuacionesenlasproximidadesdelequilibriodelpptidoglucagn(Tasumi,et al.,1982) y de una protena globular (BPTI) (Go,et al.,1983;Levitt,et al.,1983;NogutiyGo,1982). Todosestostrabajossellevaronacaboconsiderandolaslongitudesyngulosdeenlacefjos,INTRoDUCCIN:Anlisis vibracional16es decir, empleando nicamente los ngulostorsionalescomoCIdelsistema.En1983 Brooks y Karplus (Brooks y Karplus, 1983)tambininvestigaronlaBPTI,peroutilizandoCC e incluyendo todos los grados de libertad con el campo de fuerzas CHARMM. Para que los trminos de primer orden en las ecuaciones 3.1.1 y 3.1.2 sean cero todos estos mtodos de NMA estndar requieren que la conformacin inicial corresponda a un mnimo de potencial del campo de fuerzas empleado en el clculo delHessiano.Porestemotivo,laestructuradepartidaseminimizapreviamenteutilizando dicho campo.LautilizacindelNMAparadescribir la dinmica de las protenas gan popularidad amediadosdelosaos90graciasaquela aparicindemodelosreduccionistas(CG,delingls coarse-grained) redujo enormemente el costecomputacionalasociadoalaobtencin delosmodos.Tirion(Tirion,1996)introdujoelconceptoderedelstica(Figura8)empleandounpotencialuniversaldeltipoleydeHookeyeliminandolacostosanecesidaddeminimizarinicialmentelaestructuraatmica.As,laenergapotencialsedefnedelasiguientemaneraenCC: 212ij iji jV f r