6. vorlesung ss 2011computational chemistry1 v6 abrundung des ersten vorlesungsteils programm heute:...
TRANSCRIPT
6. Vorlesung SS 2011 Computational Chemistry 1
V6 Abrundung des ersten Vorlesungsteils
Programm heute:
• Berechnung von Eigenschaften des Systems aus MD-Simulationen
• Wassermodelle
• Zustandssumme (Wdh.)
• Ensembles (Wdh.)
• Umbrella Potential-Simulationen
6. Vorlesung SS 2011 Computational Chemistry 2
Aufgabe: identifiziere Wassermoleküle in Proteinen (I)
Kristallstrukturen von Proteinen zeigen
oft nicht die Position interner Wasser-
moleküle, da diese zu mobil sind.
Verwende Computersimulationen um
die „wahre“ Hydratation zu berechnen.
Welches ist das beste Ensemble um
Wassermoleküle in ein Protein zu
positionieren?
Das semi-groß-kanonische
Ensemble, da hier das chemische
Potential für das Wasser konstant ist.
Ref. Tashiro, Stuchebrukhov, J. Phys. Chem. B 109 (2005) 1015.
6. Vorlesung SS 2011 Computational Chemistry 3
Eigenschaften des Solvens
Im Gegensatz zu der Mehrzahl aller anderen Verbindungen kommt Wasser in
allen drei Aggregatszuständen natürlich vor.
Schmelzpunkt 0° C = 273 K
Siedepunkt 100° C = 373 K (bei Normaldruck)
Wärmekapazität 75.366 J mol-1 K-1
Verdampfungsenthalpie 40.7 kJ mol-1
Schmelzenthalpie 6.01 kJ mol-1
Bildquelle: Wikipedia
sehr hohe Werte !
Anomalie:
größte Dichte bei 4° C
6. Vorlesung SS 2011 Computational Chemistry 4
Eigenschaften des Wassers (I)
Eine ganze Reihe der erwähnten Besonderheiten des Wassers lassen
sich durch das dichte Wasserstoffbrückennetzwerk erklären:
Stärke einer H-Brücke
O–H ... O ca. 21 kJ/mol
→ hoher Siedepunkt
Im festen Zustand gibt es weniger und
längere H-Brücken als im flüssigen.
→ Dichte von Eis geringer als Lösung
Bildquelle: Wikipedia
6. Vorlesung SS 2011 Computational Chemistry 5
Wassermodelle (I)Wieviele H-Brücken bildet ein Wassermolekül im Durchschnitt aus ?
→ MD-Simulation
Wie modelliert man Wasser adäquat ?
Die Modelle müssen viele experimentelle Größen richtig wiedergeben, z.B.
Siedepunkt, Schmelzpunkt, Verdampfungsenthalpie, Dipolmoment, Struktur, ...
Einfache Modelle können nicht allen diesen Anforderungen perfekt gerecht werden.
Im einfachsten Fall stellen wir die Wassermoleküle wie alle anderen Atome in einem
Kraftfeld durch Bindungen, Punktladungen und van der Waals Radien dar.
Die Wechselwirkungen ergeben sich dann aus elektrostatischen und van der Waals-
Kräften.
Estat
ij ij
jivdW
ij r
r
B
r
AE
612
6. Vorlesung SS 2011 Computational Chemistry 6
Wassermodelle (II)
Gebräuchliche Wassermodelle
Bildquelle: Wikipedia
SPC TIP3P BF TIP4P exptl.
r(OH) [Å] 1.0 0.9572 0.96 0.9572
HOH [°] 109.47 104.52 105.7 104.52
q(O) [e] –0.82 –0.834 0.0 0.0
q(H) [e] 0.41 0.417 0.49 0.52
q(M) [e] – – –0.98 –1.04
[Debye] 2.27 2.18 1.8 (Vakuum)
2.3 - 2.6 (Lösung)
6. Vorlesung SS 2011 Computational Chemistry 7
Eigenschaften des Wassers (II)
Wieviele H-Brücken bildet ein Wassermolekül im Durchschnitt aus ?
TIP4P: 3.59 bei 25°C, 3.24 bei 100°C (höhere Mobilität und geringere Dichte)
Abhängig von der Definition von Wasserstoffbrücken (max. Reichweite,
Winkelabhängigkeit) erhält man auch kleinere oder größere Werte.
Übliche Kriterien für H-Bindungen sind eine
maximale Distanz ≤ 0.35 nm zwischen Donor-
und Akzeptoratom und ein D-H-A Winkel ≤ 120°.
Lit: W. L. Jorgensen and J. D. Madura (1985). "Temperature and size dependence for Monte Carlo simulations
of TIP4P water". Mol. Phys. 56 (6): 1381.
Jan Zielkiewicz (2005). "Structural properties of water: Comparison of the SPC, SPCE, TIP4P, and TIP5P
models of water". J. Chem. Phys. 123: 104501.
6. Vorlesung SS 2011 Computational Chemistry 8
Radiale Verteilungsfunktion (I)
Wie berechnet man bequem, wieviele H-Bindungen ein Wassermolekül im Wasser
ausbildet ?
Dazu betrachten wir, wieviele Wassermoleküle sich in der Entfernung r um ein
Molekül befinden und berechnen die radiale Verteilungsfunktion:
rr
rrN
N
Vrrg M
22 2
,,
Aus der Simulation mit M Stützpunkten suchen wir die Anzahl an Teilchen N
aus dem Gesamtvolumen V, die sich in der Kugelschale der Dicke r befinden.
In der Praxis weisen wir die Teilchen in jeder Kugelschale einem bin für den
jeweiligen Abstand r zu.
r
r
6. Vorlesung SS 2011 Computational Chemistry 9
Radiale Verteilungsfunktion von Wasser
O-H Bindung
Bildquelle: http://ptcl.chem.ox.ac.uk
Aufgrund der geordneten Struktur
im Eiskristall sieht hier die
Verteilung anders aus als im
flüssigen Wasser. z.B. sind die H-
Brücken schärfer definiert.
O-H H-Brücke
g(r) für flüssiges Wasser.
6. Vorlesung SS 2011 Computational Chemistry 10
Radiale Verteilungsfunktion (II)
Die graphische Auftragung einer solchen radialen Verteilungsfunktion bietet sich
natürlich für den Vergleich von Simulationsdaten mit experimentellen Daten
(soweit diese verfügbar sind) an.
z.B. Kalibrierung der Wassermodelle am Experiment
Wassermoleküle über hydrophoben Proteinbereichen sind weniger mobil und
bilden vorwiegend gegenseitige H-Brücken aus.
→ „mikroskopische Eiskristalle“
Weitere Anwendungen:
Solvatationshülle von Ionen, Aminosäuren in Bindungstaschen
6. Vorlesung SS 2011 Computational Chemistry 11
Radiale Verteilungsfunktion (II)
Beobachtung:
Da Na+ einen kleineren Ionenradius als K+ aufweist, befinden sich weniger
Wassermoleküle in der 1. Solvatationshülle, jedoch ist die Fernordnung
größer. → Selektivitätsfilter in Ionenkanälen bilden diese Hydrationshülle nach.
B. Roux, Ann. Rev. Biophys. Biomol. Struct. 34, 153 (2005)
6. Vorlesung SS 2011 Computational Chemistry 12
Radiale Verteilungsfunktion in der Thermodynamik
Die radiale Verteilungsfunktion spielt in der Thermodynamik eine fundamentale
Rolle, da sie in einer Reihe von fundamentalen Gleichungen auftaucht.
Die Virial-Gleichung für den Druck lautet:
Die Energie-Gleichung lautet
Die Kompressibilitätsgleichung lautet:
u(r) ist die Wechselwirkungsenergie zwischen den Teilchen, u´(r) ist die Ableitung
nach dem Abstand (also die Kraft). www.wikipedia.org
6. Vorlesung SS 2011 Computational Chemistry 13
Umbrella sampling
ro und k in der Gewichtungsfunktion W(r) werden so gewählt, daß die
Energie an der gewünschten Position günstiger wird.
Da nun aber keine echte Boltzmannverteilung mehr vorliegt, muß man
den Erwartungswert anschließend korrigieren:
Problem: Wie kann ich energetisch ungünstige Zustände adäquat samplen,
zumal diese selten vorkommen ?
Dazu kann man die Energiefunktion so modifizieren, daß diese Zustände in
der Simulation öfter besucht werden, d.h. „wahrscheinlicher“ werden.
rWrErE '
2orrkrW
kTrW
kTrW
e
erAA
4. Vorlesung SS 2011 Computational Chemistry 14
Die Energie eines Moleküls ergibt sich als Summe seiner (temperatur-
abhängigen) Energieterme aufgrund seiner Freiheitsgrade für die Translation,
Rotation und Vibration. Folglich muss diese Summe Q der Nenner in der
Gleichung für die Boltzmannverteilung sein
Zustandssumme
Die Summe Q der inneren Energie wird auch als Zustandssumme
(partition function) bezeichnet.
Je nachdem, welche Größen beim betrachtetem Ensemble (an
Molekülen) konstant sind (z.B. Druck, Volumen, Temperatur,
Teilchenzahl) verändert sich auch die Zustandssumme Q.
Q
kTE
kTE
kTE
N
Ni
i
i
i
exp
exp
exp
6. Vorlesung SS 2011 Computational Chemistry 15
Sampling (I)
Simulationen beinhalten eine statistische Komponente.
Deshalb können Fehler auch von der zeitlich begrenzten Simulationsdauer
stammen, da wir über diesen Zeitabschnitt das Sampling durchführen.
Jede makroskopische Größe/Observable X (z.B. Enthalpie, Entropie,
Wärmekapazität) läßt sich aus der Zustandssumme Q ableiten.
TV V
QVTk
T
QTkH
lnln2
TV
QVTkQTkG
ln
ln
Enthalpie H
Freie Enthalpie G
Entropie S QkT
QkS
V
lnln
6. Vorlesung SS 2011 Computational Chemistry 16
Sampling (II)
Für ein einzelnes Molekül können wir die Zustandssumme Q für die einzelnen
translatorischen, rotatorischen und vibronischen Terme explizit formulieren.
In einem Ensemble mit vielen Teilchen werden die einzelnen Energieniveaus
jedoch so dicht beieinander sein, daß wir von einer kontinuierlichen Verteilung
ausgehen können.
Deshalb ersetzen wir die Summation diskreter Energieterme durch die
Integration über alle Koordinaten r und Impulse p, den sog. Phasenraum.
dpdreeQ kTprEZustände
i
kTEi ,
Weiterhin nehmen wir an, daß die N Teilchen unseres Ensembles
miteinander wechselwirken.
6. Vorlesung SS 2011 Computational Chemistry 17
Sampling (III)
...
1cos22
612
20
20
Estat
ij ij
jivdW
ij
Torsionen
n
WinkelBindungen
potentiell
r
r
B
r
A
nCk
rrk
E
TQ
Q
T
Q
ln
Im Falle eines idealen Gases brauchen wir nur die kinetische Energie
betrachten, für alle anderen Systeme auch die potentielle Energie, die wir z.B.
mit einem Kraftfeld berechnen können.
Zusammengenommen ergeben diese Energie die innere Energie U
VT
QTkU
ln2
Da erhält man
kTEZustände
i
i ieQ
E
TQ
QTkU
2
6. Vorlesung SS 2011 Computational Chemistry 18
Sampling (IV)
dpdrprPprEU ,,
kTEi
ieQEP 1
kTprEeQprP ,1,
Da alle Energiezustände Ei der Boltzmannverteilung unterliegen,
erhalten wir dafür eine sog. Boltzmannsche Verteilungsfunktion P
Setzen wir P in die Gleichungen für die innere Energie U ein, so
erhalten wir
im diskreten bzw.
kontinuierlichen Fall
Zustände
iii EPEU
Damit ist die innere Energie U also die Summe aller Energien
gewichtet mit der Wahrscheinlichkeit in diesem Zustand vorzu-
kommen, d.h. U ist die durchschnittliche Energie des Systems.
6. Vorlesung SS 2011 Computational Chemistry 19
Sampling (V)
M
iiiMprX
MX ,
1
Generell kann jede makroskopische Observable X als Erwartungswert
(Durchschnitt) <X> der entsprechenden mikroskopischen Größe X(r,p)
gewichtet mit der Boltzmannverteilung berechnet werden.
Dazu brauchen wir eine ausreichende (repräsentative) Menge an
samples (Stützpunkten) M.
Eine Ansammlung entsprechender Konfigurationen wird in der Regel
aus MD-Simulationen erhalten.
Bsp. Innere Energie U
M
M
iiM
EEM
U 1
6. Vorlesung SS 2011 Computational Chemistry 20
Sampling (VI)
M
X1
Der so berechnete Erwartungswert einer Größe X weist einen statistischen
Fehler (X) auf, der umgekehrt proportional zur Anzahl M der Stützpunkte ist
Neben einer ausreichenden Anzahl von Stützpunkten (= lange
Simulationszeiten) muß darüberhinaus auch noch das betrachtete Ensemble
repräsentativ sein, ansonsten wird der systematische Fehler groß.
Da Größen wie die Freie Energie G und die Entropie S direkt von der
Zustandssumme Q abhängen (und deshalb von der Boltzmann-gewichteten
Energie), werden sie v.a. durch energiereiche Zustände bestimmt, die
entsprechend selten vorkommen.
D.h. die genaue Bestimmung von G oder S ist sehr zeitaufwendig.
6. Vorlesung SS 2011 Computational Chemistry 21
Monte Carlo (MC)
Wie generiert man repräsentative Ensembles ?
Im sog. Monte Carlo Verfahren fügt man dem System eine zufällige
Änderung zu, und akzeptiert diese, falls die neue Energie günstiger
oder eine höhere Energie entsprechend der Boltzmann-Verteilung der
Energie zufällig angenommen werden kann.
→ Metropolis Algorithmus
In der Praxis braucht man hier einige Millionen Schritte um die
Energiehyperfläche um die Startkonfiguration herum angemessen zu
samplen.
6. Vorlesung SS 2011 Computational Chemistry 22
Wdh: mikroskopische Reversibilität (“detailed balance”)Lege Übergangsmatrix fest durch Definition einer Übergangswahrscheinlichkeit kij für jeden
Übergang von Xi nach Xj, so dass die mikroskopische Umkehrbarkeit erfüllt ist:
jijiji kk
i und j sind die Besetzungswahrscheinlichkeiten der beiden Zustände i und j.
Im kanonischen Ensemble sind dies die Wahrscheinlichkeiten aus der Boltzmann-
Verteilung. Damit hängt das Verhältnis der Übergangswahrscheinlichkeiten nur vom
Energieunterschied zwischen den Zuständen i und j ab:
jiij
ijij
ji
j
i
XEXEE
Ek
k
exp
Durch die Erfüllung dieser Bedingung ist das Gleichgewicht stationär.
Es gilt die detailed balance.
6. Vorlesung SS 2011 Computational Chemistry 23
Wdh: Metropolis AlgorithmusDie am häufigsten verwendete Technik zur Auswahl von Konformeren („importance
sampling“) mittels Monte-Carlo-Methoden ist der Metropolis Algorithmus:
(1) konstruiere Anfangskonfiguration des Moleküls
(2) führe zufällige Änderung eines Freiheitsgrades (z.B. eines Torsionswinkel)
durch.
(3) berechne Änderung der Energie E aufgrund dieser Änderung der
Konformation.
(4) falls E < 0 akzeptiere die neue Konfiguration
falls E > 0 berechne die Wahrscheinlichkeit
erzeuge Zufallszahl r im Intervall [0,1]
akzeptiere die neue Konfiguration, falls w r, sonst verwerfe sie.
Da die Boltzmann-gewichtete Energiedifferenz mit einer Zufallszahl verglichen
wird, werden auch vereinzelt Konformere hoher Energie akzeptiert. Daher erhält
man ein Ensemble von Konformationen mit einer Energieverteilung entsprechend
einer Boltzmann-Verteilung.
Tk
Ew
B
exp
6. Vorlesung SS 2011 Computational Chemistry 24
Wdh: Moleküldynamik-Simulation
Basiert auf Newtonscher Bewegungsgleichung für ein Atom i eines Moleküls:
wobei Fi die Kraft, mi seine Masse und
die Beschleunigung ist, die auf Atom i wirkt.
Die Kräfte lassen sich aus den Ableitungen der Energie nach den kartesischen
Koordinaten ausrechnen.
• Die Trajektorie eines Systems ist die Aneinanderreihung der einzelnen
Koordinaten und Geschwindigkeiten, also ein Film, der die Dynamik des Systems
zeigt.
2
2i imt
r
F
2
2i
it
r
a
6. Vorlesung SS 2011 Computational Chemistry 25
Ensembles
Bei MD-Simulationen sorgt man zunächst dafür, dass sich das System in einem
Gleichgewichtszustand befindet, bevor man mit dem sampling beginnt.
104 – 105 Schritte Equilibrierung gefolgt vom Produktionslauf mit
103 – 105 Stützpunkten.
Ensembles werden charakterisiert durch die Systemvariablen, die konstant sind
und diejenigen, die durch die Simulation berechnet werden sollen.
In MC verwendet man üblicherweise eine konstante Anzahl Teilchen N, Volumen
V und Temperatur T. → Kanonisches Ensemble
Energie fluktuiert aufgrund des Metropolis-Algorithmus.
Die einfachste MD, die nur die Newtonschen Bewegungsgleichungen löst, nimmt
eine konstante Anzahl Teilchen N, Volumen V und Energie E an. →
Mikrokanonisches Ensemble, wobei die Entropie S ein Maximum annimmt und
die Energie aufgrund der Newtonschen Bewegungsgleichungen konstant bleibt.
Bei Bedarf lassen sich auch andere Ensembles generieren (Thermostat und
Barostat).
6. Vorlesung SS 2011 Computational Chemistry 26
Beziehung zwischen den Ensembles
Die Zustandssumme kann als Summe über die Zustände fester Energie
dargestellt werden: E
EVNETVNQ ,,exp,,
Die Anzahl der Zustände (N,V,E) nimmt sehr rasch mit E zu, wogegen die
Boltzmann-Verteilung sehr rasch mit E abnimmt.
Das Produkt der beiden Funktionen hat daher ein scharfes Maximum bei einem
Wert und das System wird meist eine Energie sehr eng bei diesem Wert haben.
Daher besteht in der Praxis meist kein großer Unterschied zwischen dem
kanonischen und dem mikrokanonischen System.
Aufgrund des Gesetzes der großen Zahlen haben messbare physikalische
Größen sehr kleine Fluktuationen.
Die Abweichungen zwischen den Ensembles werden jedoch größer, je kleiner die
Systeme werden Vorsicht also bei Simulationssystemen!
E
6. Vorlesung SS 2011 Computational Chemistry 27
gebräuchliche statistische Ensembles
Das mikrokanonische Ensemble NVE = konstant
Das kanonische Ensemble NVT = konstant
Das isotherme-isobare Ensemble NPT = konstant
Das großkanonische Ensemble VT = konstant
Das chemische Potenital geht in die Freie Enthalpie ein.
Dies führt dazu, daß ein spontaner Übergang von einer Phase in die
andere nur dann erfolgt, wenn die chemischen Potentiale dieser beiden
Phasen unterschiedlich sind. Im Gleichgewichtsfall sind dann auch die
chemischen Potentiale der beiden Phasen gleich.
6. Vorlesung SS 2011 Computational Chemistry 28
Anwendungen
Das mikrokanonische Ensemble NVE = konstant
überprüfe Stabilität von Integrationsalgorithmen,
Erzeugung von „wahrer“ Dynamik (nur in MD-Simulationen möglich)
Das kanonische Ensemble NVT = konstant simuliere Vorgänge unter Druckschwankungen (Monte Carlo Simulationen)
Bei MD-Simulationen im NVT-Ensemble werden Geschwindigkeiten skaliert um
die richtige Temperatur zu erhalten.
Das isotherme-isobare Ensemble NPT = konstant
übliches Ensemble für Simulationen von Biomolekülen (MD-Simuationen)
Das großkanonische Ensemble VT = konstant
Stuchebrukhov-Paper über Zahl der Wassermoleküle in Cytochrome c Oxidase
6. Vorlesung SS 2011 Computational Chemistry 29
Anwendung: identifiziere Wassermoleküle in Proteinen (I)
Kristallstrukturen von Proteinen zeigen
oft nicht die Position interner Wasser-
moleküle, da diese zu mobil sind.
Verwende Computersimulationen um
die „wahre“ Hydratation zu berechnen.
Welches ist das beste Ensemble um
Wassermoleküle in ein Protein zu
positionieren?
Das groß-kanonische Ensemble, da
hier das chemische Potential
konstant ist.
Ref. Tashiro, Stuchebrukhov, J. Phys. Chem. B 109 (2005) 1015.
6. Vorlesung SS 2011 Computational Chemistry 30
Anwendung: identifiziere Wassermoleküle in Proteinen (II)
Betrachte Transfer aus dem Lösungsmittel
Wasser ins Proteininnere.
In Lösung besitzt ein Wassermolekül eine
freie Lösungsenthalpie von -12.3 kcal/mol.
Wenn es im Proteininneren eine günstigere
Position findet, dann wird diese im zeitlichen
Mittel mit einem Wasser besetzt sein.
Führe Simulation im semi-großkanonischen
Ensemble durch, wobei während der
Simulation Wassermoleüle in das Protein
hinzugefügt bzw. daraus entfernt werden.
In diesem Fall ist es günstig, die Kavität mit 2
Wassermolekülen zu füllen.
6. Vorlesung SS 2011 Computational Chemistry 31
Zusammenfassung
Molekülmechanik-Kraftfelder liefern eine sehr effiziente (aber grobe) Darstellung
für die relativen Energien von Molekülen im Konformationsraum.
Das Absuchen des Konformationsraums kann systematisch oder stochastisch
(MC) geschehen.
Die Erfüllung der Detailed balance-Bedingung ist hinreichend und notwendig für
MC- und MD-Simulationen im Gleichgewicht.
In Simulationen können Zwangsbedingungen angewendet werden um das
Sampling zu verbessern bzw. in die gewünschte Richtung zu lenken (umbrella
potential).