inhalt - monami - publication server of hochschule … · abbildung 15: stabilität der ......

70
I Inhalt Inhalt .............................................................................................................................................. I Abbildungsverzeichnis.................................................................................................................. III 1 Motivation .................................................................................................................................. 1 1.1 Aufgabenstellung................................................................................................................. 2 1.2 Verwendete Software.......................................................................................................... 2 2 Grundlagen................................................................................................................................. 3 2.1 Mechanisch relevante Eigenschaften des Fadens ............................................................... 3 2.2 Verschiedene Drüsen und produzierende Fadentypen einer Webspinne .......................... 8 2.3 Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals............................ 12 2.4 Spinnenseidenproteine ..................................................................................................... 14 3 Material .................................................................................................................................... 17 3. 1 Datendanken .................................................................................................................... 17 3.1.1 National Center for Biotechnology Information ......................................................... 17 3.1.2 Universal Protein Resource......................................................................................... 17 3.1.3 Swiss Institute of Bioinformatics ................................................................................ 18 3.1.4 Protein Data Bank ....................................................................................................... 18 3.1.5 Conserved Domain Database...................................................................................... 18 3.2 Tools für Sequenzanalyse .................................................................................................. 18 3.2.1 Hydrophobizitätsplot .................................................................................................. 18 3.2.2 Sequenzalignment ...................................................................................................... 19 3.2.3 Dotplot ........................................................................................................................ 20 3.2.4 BLAST .......................................................................................................................... 21 3.2.5 ClustalW ...................................................................................................................... 21 3.2.6 LALIGN......................................................................................................................... 22 3.3 Strukturvorhersage-Tools .................................................................................................. 23 3.3.1 Chou-Fasman .............................................................................................................. 23 3.3.2 GOR ............................................................................................................................. 23 3.3.3 Simple Modular Architecture Research Tool .............................................................. 23 3.3.4 PROPKA ....................................................................................................................... 24 3.3.5 SWISS-MODEL ............................................................................................................. 24 3.3.6 3D-Position-Specific Score Matrices ........................................................................... 24 3.3.7 Prediction of TransMembrane Beta-Barrel Proteins .................................................. 25

Upload: lyquynh

Post on 17-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

I

Inhalt

Inhalt .............................................................................................................................................. I

Abbildungsverzeichnis.................................................................................................................. III

1 Motivation .................................................................................................................................. 1

1.1 Aufgabenstellung ................................................................................................................. 2

1.2 Verwendete Software.......................................................................................................... 2

2 Grundlagen ................................................................................................................................. 3

2.1 Mechanisch relevante Eigenschaften des Fadens ............................................................... 3

2.2 Verschiedene Drüsen und produzierende Fadentypen einer Webspinne .......................... 8

2.3 Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals ............................ 12

2.4 Spinnenseidenproteine ..................................................................................................... 14

3 Material .................................................................................................................................... 17

3. 1 Datendanken .................................................................................................................... 17

3.1.1 National Center for Biotechnology Information ......................................................... 17

3.1.2 Universal Protein Resource ......................................................................................... 17

3.1.3 Swiss Institute of Bioinformatics ................................................................................ 18

3.1.4 Protein Data Bank ....................................................................................................... 18

3.1.5 Conserved Domain Database ...................................................................................... 18

3.2 Tools für Sequenzanalyse .................................................................................................. 18

3.2.1 Hydrophobizitätsplot .................................................................................................. 18

3.2.2 Sequenzalignment ...................................................................................................... 19

3.2.3 Dotplot ........................................................................................................................ 20

3.2.4 BLAST .......................................................................................................................... 21

3.2.5 ClustalW ...................................................................................................................... 21

3.2.6 LALIGN ......................................................................................................................... 22

3.3 Strukturvorhersage-Tools .................................................................................................. 23

3.3.1 Chou-Fasman .............................................................................................................. 23

3.3.2 GOR ............................................................................................................................. 23

3.3.3 Simple Modular Architecture Research Tool .............................................................. 23

3.3.4 PROPKA ....................................................................................................................... 24

3.3.5 SWISS-MODEL ............................................................................................................. 24

3.3.6 3D-Position-Specific Score Matrices ........................................................................... 24

3.3.7 Prediction of TransMembrane Beta-Barrel Proteins .................................................. 25

II

4 Methoden und Ergebnisse ....................................................................................................... 27

4.1 Methodenkomplex 1 ......................................................................................................... 27

4.2 Methodenkomplex 2 ......................................................................................................... 31

4.3 Methodenkomplex 3 ......................................................................................................... 41

5 Zusammenfassung und Auswertung ........................................................................................ 51

5.1 Methoden .......................................................................................................................... 51

5.2 Strukturbildung der Spinnenseidenproteine ..................................................................... 54

8 Quellen ..................................................................................................................................... 60

9 Erklärung zur selbständigen Anfertigung der Arbeit ................................................................ 65

10 Anhang ................................................................................................................................... 66

III

Abbildungsverzeichnis

Abbildung 1: Gartenkreuzspinne Araneus diadematus ................................................................ 2

Abbildung 2: Spannungs-Dehnungs-Diagramm des Abseilfadens der Spinne Nephila edulis. ..... 4

Abbildung 3: Bruchspannungs-Bruchdehnungs-Diagramm verschiedenener gesponnener Fäden

des Seidenspinners Bombyx mori sowie eines Nephila edulis Spinnenfaden. ........ 6

Abbildung 4: Abhängigkeit der Bruchspannung von der Spinngeschwindigkeit und der

Körpertemperatur der Spinne Nephila edulis. ........................................................ 7

Abbildung 5: Die Gartenspinne Araneus diadematus mit ihren Drüsen und zugehörigen

Fadentypen sowie Funktionen einiger Fäden. ........................................................ 9

Abbildung 6: Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen

netzbauenden Spinnen. ......................................................................................... 11

Abbildung 7: Der natürliche Spinnprozess des „major ampullate spidroins“. ............................ 12

Abbildung 8: Querschnitt durch einen "major ampullate" Spinnenfaden. ................................. 14

Abbildung 9: Primärstruktur von "major ampullate spidroin". .................................................. 15

Abbildung 10: Hydrophobizitätsplot nach Kyte und Doolittle der N-terminalen Region der

Sequenz von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus. . 19

Abbildung 11: Ein Dotplot, eine einfache Art des paarweisen Alignments. ............................... 21

Abbildung 12: Ein einfaches Beispiel eines multiplen Alignments. ............................................ 22

Abbildung 13: Struktur von Bacteriorhodopsin innerhalb einer Doppellipidschicht,

vorhergesagt mittels PRED TMBB. ...................................................................... 26

Abbildung 14: Workflow des Arbeitsplans. ................................................................................. 27

Abbildung 15: Stabilität der terminalen Domänen des Spinnenseidenproteins in Abhängigkeit

vom pH-Wert. ..................................................................................................... 29

Abbildung 16: Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne

Latrodectus hesperus mittels GOR und Chou-Fasman. ...................................... 31

Abbildung 17: Hydrophobizitätsplot nach Kyte und Doolittle von MaSp1 sowie MaSp2 der

Spinne Latrodectus hesperus. ............................................................................. 34

Abbildung 18: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von

MaSp1. ................................................................................................................ 37

Abbildung 19: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von

MaSp2. ................................................................................................................ 38

Abbildung 20: Identifikation der terminalen Domänen von MaSp1 sowie MaSp2 der Spinne

Latrodectus hesperus mittels SMART. ................................................................ 39

Abbildung 21: CDD-Suche an MaSp1 sowie MaSp2 von L. hesperus. ......................................... 40

IV

Abbildung 22: Sequenz (N-terminal) des MaSp1 von L. hesperus im Programm Dotlet. .......... 43

Abbildung 23: Sequenz (N-terminal) des MaSp2 von L. hesperus im Programm Dotlet. .......... 44

Abbildung 24: Sequenz (Mittelteil) des MaSp1 von L. hesperus im Programm Dotlet. ............. 45

Abbildung 25: Sequenz (Mittelteil) des MaSp2 von L. hesperus im Programm Dotlet. ............. 45

Abbildung 26: Betrachtung von Proteinstrukturen mittels Rasmol 2.6. ..................................... 47

Abbildung 27: Vorhersage der Topologie von MaSp1 mittels Viterbi-Algorithmus des

PRED TMBB. ......................................................................................................... 49

Abbildung 28: Vorhersage der Topologie von MaSp2 mittels Viterbi-Algorithmus des

PRED TMBB. ......................................................................................................... 50

Abbildung 29: Workflow der durchgeführten Methoden. .......................................................... 51

Abbildung 30: Ergebnis der Identifizierung der Proteinfaltung von MaSp1 mittels 3D-PSSM. .. 66

1

1 Motivation

Spinnen existieren seit 400 Mio. Jahren, lange Zeit bevor die ersten Menschen die Erde

bevölkerten. [7, S. 7] Im Laufe der Evolution entwickelten sie verschiedene Techniken im

Kampf um das Überleben. Eine besondere Eigenschaft ist die Fähigkeit, Netze aus

Spinnenseide zu konstruieren, um Beutetiere zu fangen. Die Netze sind wahre Meisterwerke

der Natur. In kürzester Zeit geschaffen, stellen sie häufig eine erfolgreiche Beutefangmethode

dar.

Wie ist es möglich, dass ein Material trotz seines geringen Durchmessers und seiner geringen

Masse so stabil ist, um Beutetiere wie Insekten in voller Fluggeschwindigkeit abzufangen? Es

wird behauptet, dass ein Spinnenfaden, welcher den Durchmesser eines Bleistiftes besitzt,

eine Boeing 747 im Flug abfangen könnte. [25] Welche Eigenschaften sind überhaupt relevant,

wenn von einem stabilen Spinnennetz gesprochen wird?

Bereits im Mittelalter faszinierte Spinnenseide den Menschen. In dieser Zeit wurden kleine

Textilien aus Seide von Spinnen gewoben, welche jedoch sehr teuer waren. Neben der

Anwendung in Fadenkreuzen von U-Booten und Flugzeugen bis zum 2. Weltkrieg, werden

Spinnenfäden bis heute in Polynesien für den Fischfang benutzt. [31, S. 308]

In der heutigen Zeit der Rohstoffknappheit ist es nötig, andere Ressourcen zu erschließen oder

die Gewinnung bereits bestehender Ressourcen zu optimieren. Eine Hauptanwendung der

Spinnenseide könnte in der Medizin liegen, beispielsweise zum Vernähen von Wunden und

Zusammennähen von Nervenfasern oder als Arzneikapseln. Außerdem könnte Spinnenseide in

der Oberflächenveredelung sowie in der Kosmetik- und Lebensmittelindustrie Anwendung

finden. [31, S. 313]

Als Vorarbeit für die Bachelorarbeit galt die im 5. Semester geschriebene Projektarbeit, sowie

anschließendes Praxismodul. In der Projektarbeit wurde die Thematik zunächst aus dem

biologischen Blickwinkel betrachtet. Inhalte waren zum Beispiel der Netzbau, die Soziologie

der Gemeinschaft der Spinnen und einzelner Individuen, sowie die Anatomie der Spinne.

Anschließend wurde der strukturelle Aufbau und die Eigenschaften der Spinnenseide

untersucht und ein Blick in die Proteinzusammensetzung geworfen. Im Praxismodul wurde die

Arbeit weiter fortgesetzt. Die Aufgabe des Praxismoduls bestand darin, ein Modell zu

entwickeln, welches den Spinnenfaden auf molekularer Ebene beschreibt. Um dieses Ziel zu

erreichen, wurden möglichst viele vorhandene Daten gesammelt. Der Fokus lag auf der

2

Proteinzusammensetzung und dem strukturellen Aufbau des Spinnenfadens, genauer: eines

bestimmten Fadens. Der Faden, welcher in Bezug auf Festigkeit und Elastizität die besten

Eigenschaften aufweist, wurde detailliert untersucht. Betrachtete Organismen waren zum

Beispiel die Gartenkreuzspinne Araneus diadematus (siehe Abbildung 1) sowie die Goldene

Seidenspinne Nephila clavipes, an deren Fäden bereits verschiedene Experimente wie X-Ray,

Raman-Spektroskopie und Gelelektrophorese durchgeführt worden waren.

Abbildung 1: Gartenkreuzspinne Araneus diadematus

Die Gartenkreuzspinne Araneus diadematus ist eine typische, in Deutschland beheimatete Spinnenart.

1.1 Aufgabenstellung

Das Ziel der Bachelorarbeit ist das Abbilden von physiologischen Bedingungen auf die Sequenz

und das Verständnis der biologischen Prozesse. Es gilt, die β-Faltblatt-Bildung zu verstehen und

vor allem direkt nachzuweisen, in Abhängigkeit vom pH-Wert. Mit dem Wissen sollten dann,

insofern möglich, diese Strukturbildungen simuliert werden. (Was passiert, wenn der pH-Wert

verändert wird?)

1.2 Verwendete Software

Neben den Daten aus den Experimenten wurde verschiedene bioinformatische Software

verwendet, um jene Daten zu untermauern oder gar zu widerlegen. Hierzu mehr im Kapitel 3

Material.

3

2 Grundlagen

2.1 Mechanisch relevante Eigenschaften des Fadens

Spinnenseide variiert je nach Typ des Fadens stark in Aufbau und mechanischen Eigenschaften.

Der sogenannte „major ampullate“ Faden, benannt nach der sekretierenden Drüse, weist die

größte Festigkeit aller Spinnenseidenarten vor. [8, S. 3639] Dieser Faden bildet die

Grundstruktur eines Spinnennetzes. Die Spinne zieht stets einen Faden dieser Art hinter sich

her. Daher wird der „major ampullate“ Faden auch als Abseilfaden bezeichnet. [48, S. 2339]

Mehr zu den verschiedenen Fadentypen sowie den zugehörigen Drüsen siehe Kapitel 2.2. Zwei

mechanische Eigenschaften sind bei Betrachtung des Spinnenfadens von Belangen. Diese sind

die Festigkeit sowie die Bruchdehnung. Als Festigkeit bezeichnet man die Eigenschaft von

Materialien, mechanische Spannungen zu ertragen bzw. gegen Bruch und größere

Verformungen zu widerstehen. [50, S. 519] Die Bruchdehnung gibt den Grad der Verlängerung

eines Materials beim Bruch an, bezogen auf die Ausgangslänge. [50, S. 519] Mechanische

Eigenschaften eines Fadens bzw. einer Faser lassen sich am besten beschreiben durch eine

Reaktionskurve, wenn das Material gedehnt wird. Das dabei entstehende Diagramm

bezeichnet man als sogenanntes Bruchspannungs-Bruchdehnungs-Diagramm. [47, S. 542] In

jenem Diagramm ist an der Abszisse die Bruchdehnung in Prozent (0,1 = 10 %) abgetragen,

während an der Ordinate die Bruchspannung in GPa (Gigapascal) abgetragen wird, siehe

Abbildung 2. Der Begriff Bruchspannung wird verwendet, da die Deformation eines Materials

(Festigkeit) nicht nur von der einwirkenden Kraft abhängt, sondern auch von der Größe der

Fläche, in diesem Falle der Querschnitt des Fadens. [12, S. 160] Laut Diagramm in Abbildung 2

verhalten sich die Spannung und die resultierenden Dehnung bei einer Spannung von 0 bis ca.

0,02 GPa direkt proportional zueinander. Wenn die Spannung ab – bzw. zunimmt, nimmt die

Dehnung des Materials in gleichem Maße ab bzw. zu. [12, S. 161; 16, S. 121] Dieses Verhalten

gilt bis zur Proportionalitätsgrenze. Ab diesem Punkt wächst die Dehnung stärker bei

zunehmender Belastung als bisher. [12, S. 161] Viele Materialien nehmen selbst nach der

Proportionalitätsgrenze ihre Ausgangslänge bei nachlassender Spannung langsam wieder ein.

[12, S. 161; 16, S. 121] Erst ab der Elastizitätsgrenze geht die Eigenschaft der Elastizität

verloren. Dies bedeutet, dass das Material eine dauernde Formänderung beibehält, auch wenn

keine Spannung mehr einwirkt. [12, S. 162; 16, S. 121] Nimmt die Spannung weiter zu, reißt

das Material. Es kommt zum Bruch. Diesen Punkt kennzeichnet die Belastungsgrenze. [16, S.

121] Die unter der Kurve entstandene Fläche gibt die Belastbarkeit an; die Energie, die auf das

gesamte Volumen des Fadens wirkt bis dieser bricht bzw. zerreißt. [35, S. 741]

4

Abbildung 2: Spannungs-Dehnungs-Diagramm des Abseilfadens der Spinne Nephila edulis.

An der Abszisse ist die Bruchdehnung in Prozent (0,1 = 10 %) abgetragen, während an der Ordinate die

Bruchspannung in GPa (Gigapascal) abgetragen wird. Die Bruchdehnung gibt den Grad der Verlängerung eines

Materials beim Bruch an, bezogen auf die Ausgangslänge. [50, S. 519] Die Bruchspannung ist ein Begriff für die

Festigkeit eines Materials. Als Festigkeit bezeichnet man die Eigenschaft von Materialien, mechanische Spannungen

zu ertragen bzw. gegen Bruch und größere Verformungen zu widerstehen. [50, S. 519] Der Begriff Bruchspannung

wird verwendet, da die Deformation eines Materials nicht nur von der einwirkenden Kraft abhängt, sondern auch

von der Größe der Fläche, in diesem Falle der Querschnitt des Fadens. [12, S. 160] Im Diagramm erkennbar ist, dass

sich ein Seidenfaden der Spinne Nephila edulis bis zu knapp 40 % seiner Länge dehnen lässt und einer

Bruchspannung von 1,3 Gigapascal standhält, ehe es zum Bruch kommt. Aus: 2001; Vollrath, Fritz; Knight, David. P.:

Liquid crystalline spinning of spider silk

Wie bereits erwähnt, unterscheiden sich die verschiedenen Typen von Spinnenfäden stark in

ihren mechanischen Eigenschaften. Außerdem sind die Eigenschaften eines Fadens abhängig

von den Prozessbedingungen sowie von den Umweltbedingungen. Verschiedene Versuche an

der Seide des Seidenspinners Bombyx mori ergaben, dass die mechanischen Eigenschaften des

Fadens abhängig von der Spinngeschwindigkeit sind. Höhere Spinngeschwindigkeiten bewirken

festere, brüchigere Fasern, während geringere Spinngeschwindigkeiten für schwächere,

dehnbarere Fasern sorgen. [35, S. 741] Handelsübliche Seide des Seidenspinners besitzt eine

Festigkeit von 0,5 GPa, eine Bruchdehnung von 15 %, sowie eine Belastbarkeit von 6 x 104 J/kg.

[35, S. 741] Zum Vergleich: Nephila edulis Spinnenseide besitzt eine Festigkeit von 1,3 GPa,

eine Bruchdehnung von 40 % und eine Belastbarkeit von 16 x 104 J/kg. [48, S. 2342] Im

Diagramm in Abbildung 3 sind die Bruchspannungs-Bruchdehnungs-Kurven von Seidenfasern,

welche bei unterschiedlichen Spinngeschwindigkeiten produziert worden, dargestellt. Die

aufgeführten Werte wurden von gewaschenen, entschleimten Einzelfasern der Bombyx mori

Seide, von Nephila edulis Abseilfaden sowie von handelsüblicher entschleimter Bombyx mori

5

Kokonseide unter verschiedenen Bedingungen ermittelt. Handelsübliche Kokonseide wird bei

Geschwindigkeiten zwischen 4 und 15 mm/s und einer Temperatur von 20 °C gesponnen,

während die „major ampullate“ Spinnenseide von Nephila edulis bei einer Geschwindigkeit

von 20 mm/s und einer Temperatur von 25 °C gesponnen wird. Die entschleimten Einzelfasern

der Bombyx mori Seide wurden bei einer Temperatur von 25 °C und bei verschiedenen

Spinngeschwindigkeiten von 4 - 27 mm/s (siehe Diagramm) produziert. Erkennbar ist, dass ein

Bombyx mori Seidenfaden, welcher bei 4 mm/s gesponnen wurde, eine vergleichbare

Bruchdehnung wie der Nephila edulis Spinnenfaden besitzt (37 % zu 34 %, siehe Diagramm).

Wird die Spinngeschwindigkeit auf 13 mm/s erhöht, besitzt die Seide des Seidenspinners eine

ähnlich große Belastbarkeit wie die Nephila edulis Spinnenseide: Die Spinnenseide besitzt eine

Belastbarkeit von 16 x 104 J/kg, während der Bombyx mori Faden, gesponnen bei einer

Geschwindigkeit von 13 mm/s, eine Belastbarkeit von 12 x 104 J/kg besitzt, obwohl die

Festigkeit des Bombyx mori Seidenfaden nicht merklich zunimmt. Eine Festigkeit von 0,7 GPa

eines bei 13 mm/s gesponnenen Seidenfaden (die Festigkeit von Kokonseide beträgt 0,5 GPa)

ist im Vergleich zur Festigkeit von Nephila edulis Spinnenseide , welche 1,3 GPa beträgt, ein

geringer Anstieg. Wird die Spinngeschwindigkeit weiter erhöht, sinkt jedoch die Belastbarkeit

des Bombyx mori Seidenfaden. Dies resultiert aus der abnehmenden Dehnbarkeit: Ein

Seidenfaden, gesponnen bei einer Geschwindigkeit von 13 mm/s, besitzt eine Bruchdehnung

von 34 %, während ein Seidenfaden, welcher bei einer Geschwindigkeit von 27 mm/s

gesponnen wurde, eine Bruchdehnung von 17 % besitzt. Abhängig von der

Spinngeschwindigkeit ist Bombyx mori Seide entweder fest oder dehnbar; Spinnenseide

hingegen kombiniert beide Eigenschaften, bei Spinngeschwindigkeiten, die für die

Konstruktion des Spinnennetzes charakteristisch sind (10-20 mm/s). [35, S. 741]

6

Abbildung 3: Bruchspannungs-Bruchdehnungs-Diagramm verschiedenener gesponnener Fäden des

Seidenspinners Bombyx mori sowie eines Nephila edulis Spinnenfaden (pink).

Die unterschiedlichen Graphen der Bombyx mori Seidenfaden resultieren aus den jeweils verschiedenen

Spinngeschwindigkeiten (in mm/s) der produzierten Fäden. Erkennbar ist, dass ein Bombyx mori Seidenfaden,

welcher bei 4 mm/s gesponnenen wurde, eine vergleichbare Bruchdehnung wie der Nephila edulis Spinnenfaden

besitzt (37 % zu 34 %). Aus: 2002; Zhengzhong, Shao; Vollrath, Fritz: Surprising strength of silkworm silk.

Spinnenseide ist sehr robust und gleichzeitig sehr leicht. Die Festigkeit eines Spinnenfadens ist

bemerkenswert und mit der von Nylon vergleichbar. Der Lauffaden von Araneus diadematus

besitzt eine Festigkeit von 7,8 g/denier. Dies bedeutet, dass der Spinnenfaden von 9

Kilometern Länge 7,8 g wiegt. Zum Vergleich: Ein Nylonfaden hat den Wert 8,7 g/denier. Somit

ist der Spinnenfaden dehnbarer als ein Nylonfaden (31 % vs. 16 %). Ein Lauffaden von Araneus

diadematus kann demnach 80 Kilometer lang sein, ehe er aufgrund seines Eigengewichtes

reißt. [26] Die Festigkeit von industriellem Stahl beträgt 1,5 GPa. [17, S. 3296] Da die

Spinnenseide eine geringere Dichte als Stahl besitzt, ist Spinnenseide in Bezug auf das Gewicht

das stärkere Material. [47, S. 542] Kevlar, ein künstlich hergestelltes Fasermaterial, ist 3x fester

als Spinnenseide. Doch aufgrund der Tatsache, dass Spinnenseide 8x dehnbarer ist, ist

Spinnenseide 5x belastbarer als Kevlar. [47, S. 542]

7

Abbildung 4: Abhängigkeit der Bruchspannung von der Spinngeschwindigkeit und der

Körpertemperatur der Spinne Nephila edulis.

Die schwarzen Kreise zeigen die Abhängigkeit der Bruchspannung (GPa) von der Spinngeschwindigkeit (mm/s), die

weißen Kreise die Abhängigkeit von der Körpertemperatur (° C). Erkennbar ist, dass mit zunehmender

Körpertemperatur die Bruchspannung zunimmt, während bei steigender Spinngeschwindigkeit ab ca. 13-19 mm/s

die Bruchspannung abnimmt. Aus: 2001; Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk

Allein die Tatsache, dass natürlich gesponnene Seide ihre Eigenschaften in Abhängigkeit von

der Spinngeschwindigkeit ändert, erschwert die Analyse und Untersuchungen der Seide. Wie

kommt es, dass sich die mechanischen Eigenschaften so stark verändern, wenn die

Spinngeschwindigkeit variiert? Das Geheimnis muss im Inneren des Seidenfadens liegen, in der

Struktur der Proteine. Die Abhängigkeit der mechanischen Eigenschaften von den

Spinnbedingungen wird in Abbildung 4 verdeutlicht. Dargestellt ist die Abhängigkeit der

Bruchspannung (in GPa) von der Spinngeschwindigkeit (in mm/s) sowie von der

Körpertemperatur (in ° C) der produzierenden Spinne Nephila edulis. Erkennbar ist, dass mit

zunehmender Körpertemperatur die Bruchspannung zunimmt, während bei steigender

Spinngeschwindigkeit ab ca. 13-19 mm/s die Bruchspannung abnimmt.

8

2.2 Verschiedene Drüsen und produzierende Fadentypen einer

Webspinne

Die Webspinnen (Araneae) gehören der Klasse der Spinnentiere (Arachnida) an, welche zum

Stamm der Gliederfüßer (Arthropoda) gehört. Zu den Spinnentieren gehören die „klassischen“

Spinnen, aber auch Weberknechte, Skorpione, Pseudoskorpione und Milben. Dabei umfasst

die Familie der Araneae die, nach den Milben, artenreichste Ordnung der Arachnida. [7, S. 22]

Die Webspinnen gelten oft als Vorzeigebeispiel für eine Spinne, da Spinnen üblicherweise wie

folgt vorgestellt werden: Eine Spinne besitzt 8 Beine, Kieferklauen am Kopf, Warzen am

Hinterleib und baut Netze. Doch neben den netzbauenden Spinnen umfasst die Ordnung der

Araneae auch einige Arten, die ihre Beute im Lauf oder Sprung überfallen. [5, S. 18, S. 20] Die

meisten Vertreter der Familie der Wolfsspinnen (Lycosidae) bauen keine Fangnetze und sind

daher in dieser Bachelorarbeit von geringem Interesse. [5, S. 144] Da die Eigenschaften von

Spinnenseide stark von den Prozessbedingungen wie Spinngeschwindigkeit, Körpertemperatur

und anderen Faktoren abhängig sind, ist eine einheitliche Analyse der Seide nur schwer

möglich. Erschwerend kommt hinzu, dass eine Spinne viele verschiedene Arten von Seide

produzieren kann. [49, S. 68] In Abbildung 5 ist die Gartenspinne Araneus diadematus samt

ihren Seidendrüsen sowie produzierende Fadentypen dargestellt. Anhand dieser Abbildung

wird deutlich, wie komplex eine Spinne in Bezug auf die Fadenproduktion ist. Je nach Zweck

werden unterschiedliche Fäden gebildet. Jede Drüse stellt einen anderen Fadentyp oder

anderen Bestandteil des Fadens her. Eine männliche Spinne der Art Araneus diadematus kann

bis zu 5 verschiedene Fadentypen produzieren, eine weibliche Spinne sogar bis zu 7

verschiedene. Die weibliche Spinne kann mit Hilfe der zylinderförmigen Drüse (Cylindrical) und

der traubenförmigen Drüse (Aciniforme) die Seidenfäden herstellen, welche die Hülle für die

Eier bilden. Der Faden aus der traubenförmigen Drüse kann außerdem noch als Faden zur

Umwicklung der Beute dienen. [13, S. 80] Die nachfolgend genannten Drüsen existieren in

weiblichen sowie in männlichen Spinnen. Die „Minor Ampullate“ bzw. kleine ampullenförmige

Drüse sekretiert den Faden für die Hilfsspirale. Die Hilfsspirale wird nur bei der

Netzkonstruktion benötigt und später durch die Fangspirale ersetzt, da die Herstellung der

Hilfsspirale enorm viele körpereigene Proteine benötigt. Die flagellenförmige Drüse

(Flagelliforme) sekretiert den Seidenfaden für die Fangspirale, welche als Beutefangmethode

dient. Die Fäden der Fangspirale sind mit kleinen klebrigen Tröpfchen besetzt und hindern so

die Beute zu fliehen. Diese Tröpfchen werden von der haufenförmigen Drüse (Aggregate)

hergestellt. Der Befestigungsklebstoff, welcher die einzelnen Fäden während der

Netzkonstruktion miteinander verknüpft, wird in der birnenförmigen Drüse (Piriforme)

9

sekretiert. Die „Major Ampullate“ oder große ampullenförmige Drüse produziert den Faden,

der für die Grundstruktur des Netzes benötigt wird, sowie der Spinne als Abseilfaden dient.

[49, S. 68-71] Der Faden aus der großen ampullenförmigen Drüse ist für die Forschung von

besonderem Interesse, da er eine enorme Stabilität aufweist. Außerdem kombiniert er die

Eigenschaft der Festigkeit mit der Eigenschaft der Elastizität in beachtlichem Maße. [13, S. 80]

Aus diesem Grund wurden die meisten Experimente und Untersuchungen am „major

ampullate“ Faden durchgeführt.

Abbildung 5: Die Gartenspinne Araneus diadematus mit ihren Drüsen und zugehörigen Fadentypen sowie

Funktionen einiger Fäden.

Die Drüsen sind nach ihren Lateinischen Namen benannt. Die Fadentypen sind entsprechend nach ihrem

Entstehungsort, der sekretierenden Drüse, benannt. Jede Drüse stellt einen anderen Fadentyp oder anderen

Bestandteil des Fadens her. Eine männliche Spinne der Art Araneus diadematus kann bis zu 5 verschiedene

Fadentypen produzieren, eine weibliche Spinne sogar bis zu 7 verschiedene. Die weibliche Spinne kann mit Hilfe der

zylinderförmigen Drüse (Cylindrical) und der traubenförmigen Drüse (Aciniforme) die Seidenfäden herstellen,

welche die Hülle für die Eier bilden. Der Faden aus der traubenförmigen Drüse kann außerdem noch als Faden zur

Umwicklung der Beute dienen. [13, S. 80] Die nachfolgend genannten Drüsen existieren in weiblichen sowie in

männlichen Spinnen. Die „Minor Ampullate“ bzw. kleine ampullenförmige Drüse sekretiert den Faden für die

Hilfsspirale. Die Hilfsspirale wird nur bei der Netzkonstruktion benötigt und später durch die Fangspirale ersetzt, da

die Herstellung der Hilfsspirale viele körpereigene Proteine benötigt. Die flagellenförmige Drüse (Flagelliforme)

sekretiert den Seidenfaden für die Fangspirale, welche als Beutefangmethode dient. Die Fäden der Fangspirale sind

mit kleinen klebrigen Tröpfchen besetzt und hindern so die Beute zu fliehen. Diese Tröpfchen werden von der

haufenförmigen Drüse (Aggregate) hergestellt. Der Befestigungsklebstoff, welcher die einzelnen Fäden während der

Netzkonstruktion miteinander verknüpft, wird in der birnenförmigen Drüse (Piriforme) sekretiert. Die „Major

Ampullate“ oder große ampullenförmige Drüse produziert den Faden, der für die Grundstruktur des Netzes

benötigt wird sowie der Spinne als Abseilfaden dient. [49, S. 68-71] Aus: 2000; Vollrath, Fritz: Strength and structure

of spiders' silks.

10

Wie bereits erwähnt variieren die Eigenschaften ein und desselben Fadentyps innerhalb

verschiedener Spinnenarten stark. Aus diesem Grund wurden verschiedene netzbauende

Spinnen bezüglich ihrer produzierenden Abseilfäden untersucht. Abbildung 6 zeigt ein

Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen netzbauenden Spinnen.

Darin sind die Abseilfäden der Spinnen Euprosthenops sp. (1), Cyrtophora citricola (2),

Latrodectus mactans (3), Araneus diadematus (4), Nephila edulis (5) dargestellt. Anhand des

Diagramms ist erkennbar, dass die Seide von Euprosthenops sp. fester (benötigt mehr Kraft um

zu brechen) aber weniger elastisch als die Seide von Nephila edulis ist. (Außerdem existieren

Unterschiede in den Elastizitätsbereichen bis zur Elastizitätsgrenze. Das heißt bei gleicher

Belastung weisen die Fäden ein unterschiedliches Verhalten im Elastizitätsbereich auf. Ein

ähnliches Verhalten zeigt sich beim Vergleich eines Plastikstabes gegenüber einem Streifen

Klebeband. Der Plastikstab bricht bei einer hohen Belastung ohne sichtbare

Dehnungserscheinung durch, wobei das Klebeband bei einer hohen Belastung eine sichtbare

Dehnung aufweist, welche jedoch irreversibel ist. Der Faden von Euprosthenops sp. verhält sich

ungefähr wie der Plastikstab, während der Faden von Nephila edulis das Verhalten eines

Klebebands zeigt. Der Faden von Euprosthenops sp. bricht bei einer Bruchspannung von 1,5

GPa, kann aber nur bis zu ca. 15 % seiner Ausgangslänge gedehnt werden. Der Faden von

Nephila edulis reißt bei einer Bruchspannung von ca. 0,9 GPa, kann jedoch bis zu knapp 40 %

seiner Ausgangslänge gedehnt werden.

Der optimale Spinnenfaden in Bezug auf beide Eigenschaften ist ein Spinnenfaden, welcher

einen guten Kompromiss beider Eigenschaften herstellt. Laut dem Diagramm in Abbildung 6 ist

dies der Spinnenfaden von Latrodectus mactans. [47, S. 542]

Es liegen daher nicht nur große Unterschiede zwischen den jeweiligen Fadentypen ein und

derselben Spinne vor, sondern auch zwischen den gleichen Fadentypen von verschiedenen

Spinnenarten. Jede Spinnenart sekretiert andere Proteine in den jeweiligen Drüsen. Dadurch

entstehen die artspezifischen Eiweißfäden. Doch die Primärstruktur allein beeinflusst nicht die

Eigenschaften eines Spinnfadens. [13, S. 83] Die Unterschiede zwischen den Arten entstehen

unter anderem durch Unterschiede in der chemischen Zusammensetzung der Spinnlösung und

durch verschiedene Umweltbedingungen. Die Eigenschaften des Fadens sind durch die Spinne

in vielerlei Hinsicht kontrollierbar. Die Spinnbedingungen können von der Spinne selbst

beeinflusst werden, indem die Geschwindigkeit, mit der der Faden mit den Beinen heraus

gezogen wird, geändert wird. Indem die Spinne das Netz zu verschiedenen Tageszeiten

11

konstruiert, liegen unterschiedliche Temperaturen vor, welche die Eigenschaften des Fadens

ebenfalls beeinflussen können. [47, S. 542]

Abbildung 6: Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen netzbauenden Spinnen.

Euprosthenops sp. (1), Cyrtophora citricola (2), Latrodectus mactans (3), Araneus diadematus (4), Nephila edulis (5)

Anhand des Diagrammes ist erkennbar, dass die Seide von Euprosthenops sp. fester (benötigt mehr Kraft um zu

brechen) aber weniger elastisch als die Seide von Nephila edulis ist. Außerdem existieren Unterschiede in den

Elastizitätsbereichen bis zur Elastizitätsgrenze. Das heißt bei gleicher Belastung weisen die Fäden ein

unterschiedliches Verhalten im Elastizitätsbereich auf. Der Faden von Euprosthenops sp. bricht bei einer

Bruchspannung von 1,5 GPa, kann aber nur bis zu ca. 15 % seiner Ausgangslänge gedehnt werden. Der Faden von

Nephila edulis reißt bei einer Bruchspannung von ca. 0,9 GPa, kann jedoch bis zu knapp 40 % seiner Ausgangslänge

gedehnt werden. Der optimale Spinnenfaden in Bezug auf beide Eigenschaften ist ein Spinnenfaden, welcher einen

guten Kompromiss beider Eigenschaften herstellt. In diesem Diagramm ist dies der Spinnenfaden von Latrodectus

mactans. Aus: 2001; Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk

12

2.3 Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals

Die Seidenproteine werden in den Epithelzellen der jeweiligen Spinnendrüse synthetisiert. Als

Epithel bezeichnet man die oberste Zellschicht des Haut- und Schleimhautgewebes von

Eukaryonten (dazu zählen: Tiere, Pilze, Pflanzen, Mensch). [23, S. „2-10“] Das genaue

Geheimnis der Struktur der Seidenproteine ist bis heute gänzlich ungeklärt, es existieren

lediglich verschiedene Theorien. Es wird davon ausgegangen, dass die Proteine keine definierte

Sekundärstruktur, sondern eine Art Vorstruktur einnehmen. [8, S. 3645; 14, S. 999] Nach der

Synthese werden die Proteine innerhalb der Drüse im sogenannten Lumen gespeichert. [10, S.

239] Das Lumen ist eine cytologische Bezeichnung für den Innenraum von Zellen. [23, S. „8-

74“, S. „10-17“] Dort liegen die Proteine in einer wässrigen Natriumchlorid-Lösung in sehr

hoher Konzentration vor, bis zu 50 % w/v (weight/volume = 50 Gramm Protein in 100 ml

Lösung). [36, S. 999] Trotz der enorm hohen Konzentration kristallisieren oder verklumpen die

Proteine nicht, sondern liegen innerhalb der Lösung flüssig vor. [13, S. 83] Während der

Speicherung der Proteine in der Drüse, auch Sack oder Ampulle genannt, sorgt Natriumchlorid

für die nötige Konservierung der Stabilität der Proteine. Aufgrund der „einsalzenden“ Wirkung

von Natriumchlorid können die Seidenproteine trotz der hohen Konzentration den flüssigen

Zustand beibehalten. [8, S. 3645; 13, S. 83; 54] Die Proteine müssen daher zur Lösung hin eine

enorm stabile Struktur aufweisen. Außerdem werden durch Natriumchlorid die

Wechselwirkungen zwischen den Seidenproteinen unterbunden. [13, S. 83; 54]

Abbildung 7: Der natürliche Spinnprozess des „major ampullate spidroins“.

Der Prozess lässt sich in 5 Teilbereiche unterteilen: i) die Proteinsekretion im Epithel ii) die Speicherung der Protein

innerhalb des Lumen (Innenraum) der Drüse in sehr hoher Konzentration (50 % w/v) iii) die Umstrukturierung der

Proteine innerhalb des Spinnkanals durch Ionenaustausch, Ansäuerung, Wasserentzug, Scherkräfte und

Dehnungskräfte in eine Proteinfaser iv) die Streckung der Proteinfaser durch eine Art Ventil v) endgültige

Formgebung durch Ziehen und Strecken der Seidenfaser mit Hilfe der Gliedmaßen der Spinne. Aus: 2011; Eisoldt,

Lukas; Smith, Andrew; Scheibel, Thomas: Decoding the secrets of spider silk.

13

Abbildung 7 zeigt den typischen Weg der Spinnenseidenproteine von der Synthese bis zum

fertigen Faden. Das Schema beschreibt den Assemblierungsprozess des Proteins, welches in

der großen ampullenförmigen Drüse produziert wird, dem sogenannten „major ampullate

spidroin“ (MaSp oder MAS). Im Spinnkanal sorgen Veränderungen der chemischen und

physikalischen Bedingungen für eine Umstrukturierung der Seidenproteine. [8, S. 3644-3645;

13, S. 83] Natriumchlorid wird gegen Kaliumphosphat ausgetauscht, der pH-Wert nimmt von

7,0 auf ca. 6,2 ab, Wasser wird entzogen, Scher – und Dehnkräfte treten auf. [31, S. 312; 14, S.

999] Solange Natriumchlorid in der Lösung vorkommt, wird ein Zusammenbau und

Aggregation der spidroins verhindert. Erst wenn Kaliumphosphat das Natriumchlorid ersetzt,

beginnen die Seidenproteine eine komplexe Struktur anzunehmen. [8, S. 3645] Die pH-

Abnahme sowie der Wasserentzug verstärken diese Strukturbildung. [36, S. 999] Die

endgültige Struktur wird aufgrund von auftretenden Scher – und Dehnkräften gebildet. All die

genannten Faktoren bewirken, dass das hoch konzentrierte Seidenproteingemisch eine

Faserform annimmt. [8, S. 3645] Letztendlich tritt die flüssige Faser durch die Spinnenwarze

aus. Mit den Gliedmaßen zieht die Spinne die Faser heraus, welche sich durch diesen

Zugmechanismus endgültig verfestigt. [31, S. 312; 8, S. 3647]

14

2.4 Spinnenseidenproteine

Spinnenseide besteht im Wesentlichen aus zwei Proteinen. Im Falle eines „major ampullate“

Spinnenfadens werden die Proteine entsprechend als „major ampullate spidroin“ 1 und 2

(MaSp1, MaSp2) bezeichnet. [14, S. 159; 16, S. 8] Im fertigen Faden befindet sich im Inneren

des Seidenkerns überwiegend das Protein MaSp2. Dies sorgt aufgrund seines vorwiegend

amorphen, unstrukturierten Charakters für die Elastizität des Spinnfadens. MaSp2 ist in MaSp1

eingebaut. Anders als MaSp2 besteht MaSp1 hauptsächlich aus β-Faltblatt-Kristallen, welche

für die hohe Festigkeit des Fadens sorgen. Der Seidenkern ist umgeben von einer

Glycoproteinschicht und einer Lipidschicht. Die Glycoproteinschicht sorgt für die Klebrigkeit

des Fadens, wobei die Lipidschicht den Faden vor Mikroorganismen schützt und außerdem als

sexuelles Pheromon fungiert. [14, S. 163] Zusätzlich, wenn es sich um den Faden der

Hilfsspirale handelt, befindet sich zwischen dem MaSp1 und der Glycoproteinschicht eine

Außenhaut, die der Hilfsspirale eine besondere Stabilität verleiht. [14, S. 160; 15, S. 23; 16, S.

8] In Abbildung 8 ist der Querschnitt durch einen „major ampullate“ Spinnenfaden dargestellt.

Darin ist der eben beschriebene Aufbau eines Abseilfadens gut zu erkennen.

Abbildung 8: Querschnitt durch einen "major ampullate" Spinnenfaden.

Im Innersten des Seidenkerns befindet sich überwiegend „major ampullate spidroin“ 2 (MaSp2), welches in „major

ampullate spidroin“ 1 (MaSp1) eingebaut ist. MaSp2 sorgt aufgrund seines amorphen, unstrukturierten Charakters

für die Elastizität des Spinnfadens, während MaSp1 hauptsächlich aus β-sheet-Kristallen besteht, welche dem Faden

die hohe Festigkeit verleihen. Zusätzlich, wenn es sich um den Faden der Hilfsspirale handelt, befindet sich zwischen

dem MaSp1 und der Glycoproteinschicht eine Außenhaut, die der Hilfsspirale eine besondere Stabilität verleiht. Im

Innersten des Seidenkerns entsteht ein sogenanntes 3-Phasen-Modell. Dies besteht aus überwiegend amorphen

Regionen des MaSp2 und aus wenigen amorphen Regionen des MaSp1 sowie aus überwiegend β-Faltblatt-Kristallen

des MaSp1 und aus wenigen β-Faltblatt-Kristallen des MaSp2. Aus: 2009; Heim, Markus; Römer, Lin; Scheibel,

Thomas: Hierarchical structures made of proteins. The complex architecture of spider webs and their constituent

silk proteins

MaSp1 besitzt neben den in hoher Anzahl vorhandenen β-Faltblatt-Kristallen einige amorphe

Regionen, welche keine β-Faltblätter enthalten. MaSp2 dagegen besitzt neben den in hoher

15

Anzahl vorhandenen amorphen, unstrukturierten Regionen einige kristalline Regionen, welche

β-Faltblätter enthalten. Im Innersten des Seidenkerns sind einige β-Faltblatt-Kristalle in den

amorphen Regionen eingebaut. Dabei stammt der größte Anteil amorpher Regionen aus dem

MaSp2, während ein kleiner Anteil dem MaSp1 entstammt. Durch diese Anordnung der

Strukturen im Innersten des Seidenkerns, entsteht ein sogenanntes 3-Phasen-Modell. Dies

besteht aus überwiegend amorphen Regionen des MaSp2 und aus wenigen amorphen

Regionen des MaSp1, sowie aus überwiegend β-Faltblatt-Kristallen des MaSp1 und aus

wenigen β-Faltblatt-Kristallen des MaSp2. [13, S. 82, 84; 18, S. 161]

Wie kommt der große Unterschied in der Struktur der beiden Seidenproteine zu Stande?

Aufschluss darüber gibt die Betrachtung der Primärstruktur. Die Sequenz beider Proteine lässt

sich in 3 Teilbereiche untergliedern: Der hoch konservierten N-terminalen Region, der

repetitiven Kernsequenz und der hoch konservierten C-terminalen Region. [14, S. 160; 15, S.

23; 16, S. 8] Die hoch repetitive Kerndomäne besteht aus iterativen Wiederholungen (bis zu

100-mal) von Aminosäuremotiven. [31, S. 309] Die Motive bestehen überwiegend aus Alanin

und Glycin, MaSp2 besitzt zusätzlich noch Pentapeptidabschnitte, welche Prolin enthalten. Die

Kernsequenz ist umgeben von evolutionär hoch konservierten kleinen terminalen Regionen,

welche nicht repetitiv sind. [14, S. 160; 15, S. 23] Abbildung 9 zeigt die Primärstruktur von

„major ampullate spidroin“. Grün hervorgehoben sind die beiden terminalen Regionen, welche

nicht repetitiv sind (NR). Zwischen den terminalen Regionen befindet sich die große

Kernsequenz mit ihren iterativen Wiederholungen von Aminosäuremotiven (X, Y).

Abbildung 9: Primärstruktur von "major ampullate spidroin".

Die Sequenz besteht aus einer repetitiven Kernsequenz sowie aus einer hoch konservierten N-terminalen Region

und einer hoch konservierten C-terminalen Region. Beide terminale Regionen sind nicht repetitiv (NR). Die

Kernsequenz besteht aus iterativen Wiederholungen (bis zu 100-mal) von Aminosäuremotiven (X, Y). Aus: 2007;

Römer, Lin; Scheibel, Thomas: Spinnenseidenproteine. Grundlage für neue Materialien.

Beide spidroins, MaSp1 und MaSp2, enthalten Poly-Alanin-Muster. Außerdem enthalten beide

Sequenzen glycinreiche Bereiche. MaSp2 besitzt deutlich mehr sowie deutlich größere

glycinreiche Regionen und weniger Poly-Alanin-Bereiche als MaSp1. [27, S. 8] Ein weiterer

16

Unterschied ist, dass die Kernsequenz von MaSp2 überwiegend aus GPGXX-Motiven aufgebaut

ist, anders als die Kernsequenz von MaSp1, welche aus GGX-Motiven in zwei – bis vierfacher

Wiederholung besteht. Das X steht hierbei für eine beliebige Aminosäure. Die Besonderheit an

MaSp2 ist das enthaltene Motiv QQ (Q=Glutamin), jedoch ist die Funktion dieses Motivs noch

unklar. Beide Proteinsequenzen enthalten außerdem die Aminosäure Cystein, welche vor

allem in den C-terminalen Regionen vorkommt. [27, S. 8, 9] Die Daten über die Sequenzmotive

wurden während der Arbeit im Praxismodul ermittelt und zusammen getragen, mit Hilfe des

National Center for Biotechnology Information. Cystein ermöglicht die Bildung von

Disulfidbrücken. Disulfidbrücken sind kovalente Bindungen zwischen jeweils zwei Cysteinen.

Diese Bindungen entstehen aber nicht bei allen Cysteinen, sondern sind sehr spezifisch. [23, S.

„5-19“]

Mittels verschiedener durchgeführter Experimente war es möglich, auf die Sekundärstruktur

(und Tertiärstruktur) der spidroins zu schließen. Anhand von Röntgenbeugungsanalyse (X-ray)

und Kernmagnetresonanz (NMR-nuclear magnetic resonance) wurden Nanokristalle (2 x 5 x 7

nm), welche aus β-Faltblättern bestehen, identifiziert. [47, S. 545; 13, S. 82; 18, S. 162; 20, S.

6517] Mittels Rasterelektronenmikroskopie (SEM-scanning electron microscopy) und

Atomkraftmikroskopie (AFM-atomic force microscopy) wurden kleine mizellenartige

Unterstrukturen der sich in einer wässrigen Lösung befindenden spidroins entdeckt. [18, S.

1058] Transmissionselektronmikroskopie-Versuche belegen ebenfalls eine Bildung von

mizellenartigen Strukturen. [20, S. 8908] Die Poly-Alanin-Motive der „major ampullate

spidroins“ bilden β-Faltblätter aus. [47, S. 545; 13, S. 82; 20, S. 6515] Diese Faltblätter können

miteinander wechselwirken, indem je ein Faltblatt über Wasserstoffbrücken mit dem Faltblatt

eines benachbarten Proteins verbunden wird. [23, S. „5-17“] Die GGX-Motive (in zwei – bis

vierfacher Wiederholung) des MaSp1 bilden eine 310-Helix-Struktur aus. [3, S. 1; 16, S. 9; 20, S.

6516] Durch diese Struktur können keine Querverbindungen zu benachbarten Proteinen

hergestellt werden, wodurch eine gewisse Beweglichkeit entsteht, die dem Faden die

Elastizität verleiht. [3, S. 1-2; 16, S. 9] Anstelle der GGX-Motive des MaSp1 bilden die GPGXX-

Motive des MaSp2 eine β-turn-Struktur (β-turn = β-Schleife) aus. Diese sorgt ebenso wie die

310-Helix für die Elastizität des Spinnfadens. [3, S. 1-2; 16, S. 9; 20, S. 6516] All die

beschriebenen Strukturmerkmale der jeweiligen Motive der Kernsequenz charakterisieren den

fertigen Spinnfaden, existieren jedoch nicht zu Beginn, während der Speicherung der

Seidenproteine in der Drüse. Erst im Spinnkanal entstehen die beschriebenen Strukturen der

Kernsequenz beider spidroins. [13, S. 83] Die terminalen Regionen der Sequenz beider

Spinnenseidenproteine verhalten sich anders. Sie falten sich direkt nach der Synthese des

17

Seidenproteins in eine stabile Form. Daher werden die terminalen Regionen auch als terminale

Domänen bezeichnet. Eine Proteindomäne ist eine Untereinheit eines Proteins, welche eine

eigene Struktur und/oder eine eigene Funktion besitzt. [23, S. „5-18“] Außerdem wird davon

ausgegangen, dass die terminalen Domänen einen großen Einfluss auf den

Strukturbildungsprozess der repetitiven Bereiche während der Umstrukturierung im

Spinnkanal haben. [20, S. 8908; 22, S. 236, 237; 23, S. 239-240]

3 Material

Nachfolgend werden thematisch die einzelnen Programme und Tools sowie diverse

bioinformatische Datenbanken bzw. Suchmaschinen, welche in dieser Bachelorarbeit

angewandt worden sind, aufgelistet.

3. 1 Datenbanken

3.1.1 National Center for Biotechnology Information

Das National Center for Biotechnology Information (NCBI) wurde 1988 an der National Library

of Medicine der USA gegründet. Ziel und Aufgabe des NCBI ist es, mittels mathematischer

Werkzeuge bzw. Computertools die molekularen Grundlagen von Krankheiten zu untersuchen.

Im Groben umfasst dieses Ziel drei Hauptaufgaben: Die Analyse der Sequenz eines Gens oder

Genproduktes; analysierte Gene verstehen; Strukturvorhersagen von analysierten Molekülen

treffen. [29, S. 34, 35] Das NCBI beinhaltet verschiedene Software bzw. Suchmaschinen, die

über die NCBI-Website frei zugänglich sind. In der Bachelorarbeit angewandte Tools des NCBI

waren BLAST sowie Entrez. BLAST (Basic Local Alignment Search Tool) besteht aus einer Reihe

bioinformatischer Programme, welche zum Auffinden ähnlicher und homologer Sequenzen

einer Eingabesequenz dienen. [29, S. 38] Entrez ist eine Suchmaschine, die nach Eingabe eines

Suchbegriffes die verschiedenen Datenbanken des NCBI auf Literaturzitate und biologische

Daten hin durchsucht und entsprechende Treffer ausgibt. [29, S. 38]

3.1.2 Universal Protein Resource

Die Universal Protein Resource (UniProt) ist ein Konsortium aus drei verschiedenen

Datenbanken. Es trägt Proteindaten des European Bioinformatics Institute (EBI), des Swiss

Institute of Bioinformatics (SIB) und der Protein Information Resource (PIR) zusammen. [37, S.

D142]

18

3.1.3 Swiss Institute of Bioinformatics

Das Swiss Institute of Bioinformatics (SIB) ist eine freie akademische Stiftung, welche 1998

gegründet wurde. [38] Es enthält eine ausführliche Sammlung von Tools, welche der

Untersuchung von Proteinen, Genomen, Phylogenetischen Ansätzen und anderen biologischen

Daten dient. [38] Diese Sammlung wird als ExPASy bezeichnet und ist per Internetportal frei

zugänglich. ExPASy enthält Verweise zu verschiedenen bioinformatischen Werkzeugen. In der

Bachelorarbeit angewandte Tools waren zum Beispiel: SWISS-MODEL, SMART (Simple Modular

Architecture Research Tool), ProtScale, GOR, CFSSP (Chou-Fasman Secondary Structure

Prediction Server), Dotlet, sowie der Protein-3D-Viewer Rasmol.

3.1.4 Protein Data Bank

Die Protein Data Bank (PDB) ist eine Sammlung über experimentell bestimmter Strukturen von

Proteinen, Nukleinsäuren und Proteinkomplexen. [29, S. 48] Diese Strukturen wurden mittels

Kernmagnetresonanz und/oder mittels Röntgenstrukturanalysen ermittelt. Ein PDB-Datensatz

enthält Koordinaten der enthaltenen Atome, Literaturzitate, Daten über die durchgeführten

Experimente sowie Informationen zur Primär- und Sekundärstruktur des Proteins bzw. der

Nukleinsäure. [29, S. 48-49]

3.1.5 Conserved Domain Database

Die Conserved Domain Database (CDD) wird vom NCBI unterhalten und ist über selbige frei

zugänglich. Die CDD beinhaltet eine Sammlung von Sequenzalignments und Steckbriefen,

welche für verschiedene, durch molekulare Evolution konservierte Proteindomänen

repräsentativ sind. Außerdem sind Alignments von Domänen bekannter dreidimensionaler

Proteinstrukturen aus anderen Datenbanken enthalten. Dadurch kommt es zur teilweisen

Redundanz der enthaltenen Daten. [21, S. 225] Die CDD wurde während der Bachelorarbeit

genutzt, um eine ähnliche Proteindomäne des eingegeben Spinnenseidenprotein zu finden und

daraufhin eine Struktur der Domäne des Spinnenseidenproteins abzuleiten.

3.2 Tools für Sequenzanalyse

3.2.1 Hydrophobizitätsplot

Mit Hilfe eines Hydrophobizitätsplots ist es möglich, eine Proteinsequenz bezüglich der

hydrophoben bzw. hydrophilen Eigenschaften ihrer enthaltenen Aminosäuren zu untersuchen.

Dabei existiert für jede einzelne Aminosäure ein bestimmter Zahlenwert, der die

Hydrophobizität angibt. Je höher dieser Wert ist, desto hydrophober ist eine Aminosäure. [29,

19

S. 19] Entsprechend werden diese Daten in einem Plot dargestellt. Ein Beispiel für einen

Hydrophobizitätsplot ist der Hydrophobizitätsplot nach Kyte und Doolittle, siehe Abbildung 10.

Der Hydrophobizitätsplot nach Kyte und Doolittle ist beispielsweise über das Tool ProtScale

des SIB (ExPASy) verfügbar. In Abbildung 10 ist der Hydrophobizitätsplot der N-terminalen

Region der Sequenz von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus

dargestellt. An der Abszisse sind die Positionen der enthaltenen Aminosäuren abgetragen,

während an der Ordinate die jeweiligen Zahlenwerte der Hydrophobizität angegeben sind.

Eine Aminosäure ist hydrophob, wenn der Zahlenwert größer Null ist. [29, S. 19] Ist der

Zahlenwert kleiner Null, ist die Aminosäure bzw. der Proteinabschnitt hydrophil. Der größte

Wert der Hydrophobizität beträgt 2,889, der kleinste Wert beträgt -1,700. Gut zu erkennen ist,

dass der Großteil der Aminosäuren hydrophobe Werte aufweist. Somit ist die N-terminale

Domäne von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus hydrophob.

Abbildung 10: Hydrophobizitätsplot nach Kyte und Doolittle der N-terminalen Region der Sequenz von „major

ampullate spidroin 1“ der Spinne Latrodectus hesperus.

An der Abszisse sind die Positionen der enthaltenen Aminosäuren abgetragen, während an der Ordinate die

jeweiligen Zahlenwerte der Hydrophobizität angegeben sind. Eine Aminosäure ist hydrophob, wenn der Zahlenwert

größer Null ist. Ist der Zahlenwert kleiner Null, ist die Aminosäure bzw. der Proteinabschnitt hydrophil. Der größte

Wert der Hydrophobizität beträgt 2,889, der kleinste Wert beträgt -1,700. Gut zu erkennen ist, dass der Großteil der

Aminosäuren hydrophobe Werte aufweist.

3.2.2 Sequenzalignment

Ein (paarweises) Sequenzalignment dient der quantitativen Erfassung von zwei ähnlichen

Sequenzen. Dabei werden Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen

festgestellt. Je ähnlicher sich zwei Sequenzen sind, desto höher ist die Wahrscheinlichkeit, dass

sie eine ähnliche Raumstruktur ausbilden bzw. eine ähnliche Funktion besitzen. Zwei zu 30%

identische Sequenzen bilden mit hoher Wahrscheinlichkeit eine ähnliche Raumstruktur aus

und besitzen ähnliche Funktionen. [22, S. 153-154] Es existieren verschiedene Möglichkeiten

20

ein Alignment durchzuführen. Alignment-Tools sind beispielsweise der Dotplot

(Punktdiagramm), BLAST (Basic Local Alignment Search Tool) und ClustalW.

3.2.3 Dotplot

Ein Dotplot (Punktdiagramm) ist eine sehr einfache Methode, ein paarweises

Sequenzalignment durchzuführen. In einer Matrix werden beide Sequenzen graphisch

dargestellt. Eine Sequenz wird an der Abszisse abgetragen, während die andere Sequenz an

der Ordinate abgetragen wird. Das Programm setzt überall dort, wo identische Positionen

beider Sequenzen gefunden werden, einen Punkt. Liegen viele identische Positionen eng

beieinander, summieren sich die Punkte zu Linien. Wenn sich beide Sequenzen sehr ähnlich

sind, entsteht eine Diagonale quer durch die Matrix bzw. den Dotplot. Dies ist der Idealfall. [22,

S. 155-156] Ein Dotplot kann auch genutzt werden, um repetitive Bereiche innerhalb ein und

derselben Sequenz zu finden. Dabei wird an beiden Achsen der Matrix dieselbe Sequenz

abgetragen. Quer durch den Dotplot ist eine durchgängige Diagonale zu erkennen, da an den

gleichen Positionen die gleichen Aminosäuren vorkommen. Um sich das Ganze besser

vorstellen zu können, ist die Zuhilfenahme der Abbildung 11 hilfreich. In Abbildung 11 wurde

die Kernsequenz von „major ampullate spidroin“ 2 der Spinne Latrodectus hesperus in das

Programm Dotlet eingefügt. Dotlet wurde von Marco Pagni und Thomas Junier, zwei

Mitarbeiter des SIB, entwickelt und 2000 veröffentlicht. Es ist frei zugänglich und über den

Webbrowser ausführbar. Per Optionsfeld können verschiedene Einstellungen getroffen

werden, welche die Suche nach identischen und/oder ähnlichen Positionen präzisieren bzw.

anpassen. [24, S. 178] In Abbildung 11 ist die Diagonale durch die Matrix gut zu erkennen, ein

Nachweis für die Identität der Eingabesequenzen. Weiterhin sind rechts und links neben der

Diagonale mehrere Striche erkennbar. Überall dort sind ebenfalls identische Positionen zu

finden. Je mehr Striche vorkommen, desto mehr identische bzw. ähnliche Regionen existieren

innerhalb ein und derselben Sequenz. Die Striche kennzeichnen so die repetitiven Bereiche in

der Sequenz. Dadurch ist klar erkennbar, dass die Sequenz von „major ampullate spidroin“ 2

sehr viele repetitive Bereiche enthält.

21

Abbildung 11: Ein Dotplot, eine einfache Art des paarweisen Alignments.

In das Programm Dotlet wurde die Kernsequenz von „major ampullate spidroin“ 2 der Spinne Latrodectus hesperus

eingefügt. Die Diagonale durch die Matrix ist gut zu erkennen, ein Nachweis für die Identität der Eingabesequenzen.

Weiterhin sind rechts und links neben der Diagonale mehrere Striche erkennbar. Überall dort sind ebenfalls

identische Positionen zu finden. Je mehr Striche vorkommen, desto mehr identische bzw. ähnliche Regionen

existieren innerhalb ein und derselben Sequenz. Die Striche kennzeichnen so die repetitiven Bereiche in der

Sequenz. Dadurch ist klar erkennbar, dass die Sequenz von „major ampullate spidroin“ 2 sehr viele repetitive

Bereiche enthält.

3.2.4 BLAST

BLAST (Basic Local Alignment Search Tool) umfasst eine Reihe ähnlicher Programme. Das

gemeinsame Ziel jedes BLAST-Programms ist das Finden von ähnlichen und/oder homologen

Sequenzen zu einer eingegebenen Suchsequenz. [29, S. 38] Die ausgegebenen Treffer können

der Vorhersage möglicher Funktionen dienen oder bei der Erstellung einer 3D-Struktur zu Hilfe

genommen werden. Bei einem BLAST-Lauf werden die Datenbanken des NCBI nach ähnlichen

Sequenzen durchsucht. [29, S. 64] Die Einteilung der BLAST-Programme erfolgt nach

verschiedenen Kriterien, je nachdem ob es sich bei der Eingabesequenz um eine Aminosäure-

oder eine DNA-Sequenz handelt. Da während der Bachelorarbeit in den Proteindatenbanken

des NCBI nach der jeweiligen eingegebenen Aminosäuresequenz gesucht wurde, handelte es

sich hierbei um das Programm BLASTp (protein blast). [29, S. 64; 32]

3.2.5 ClustalW

ClustalW ist ein über den Webbrowser ausführbares Programm, welches multiple Alignments

erstellt. Multiple Sequenzalignments sind die konsequente Ausweitung paarweiser Alignments

auf n-viele Sequenzen. Über ein Eingabefenster werden die zu alignierenden Sequenzen

eingefügt. Der Vorteil gegenüber BLAST ist, dass mehrere Sequenzen miteinander verglichen

22

werden. [29, S. 53-54; 30, S. 243] Oftmals werden bei einer BLAST-Suche sehr viele Treffer zur

Eingabesequenz ausgegeben. Um diese Treffer miteinander vergleichen zu können, eignet sich

ClustalW. Außerdem gibt ClustalW zu den alignierten Sequenzen eine Konsensus-Sequenz aus.

In Abbildung 12 ist ein einfaches Beispiel eines multiplen Alignments dargestellt. Es wurden

drei Sequenzen auf Ähnlichkeit mit einer Zielsequenz überprüft. Ein Maß für die Ähnlichkeit ist

die Anzahl molekularer Austausche (Aminosäurereste). Unterhalb wurde als Ergebnis die

„Konsensus-Sequenz“ ausgegeben. Eine Konsensus-Sequenz ist eine Sequenz, welche die

höchste Übereinstimmung der verglichenen Sequenzen darstellt.

Abbildung 12: Ein einfaches Beispiel eines multiplen Alignments.

Die oberste Sequenz (NK1-kringle) ist die Zielsequenz. Die 3 Sequenzen darunter sind die Sequenzen (1PKR, 1PK4,

2PF1), welche auf Übereinstimmung mit der Zielsequenz überprüft wurden. Die Farbe der markierten

Aminosäurereste entspricht dem Grad der Konservierung. (weiß-keine, grün-gering, blau-mittel, rosa-hoch). Pfeile

kennzeichnen die Cystein-Reste. Unterhalb ist die Konsensus-Sequenz angegeben. [51]

ClustalW eignet sich gut, um schnell mehrere Sequenzen auf Ähnlichkeit sowie Homologie zu

überprüfen. Analog zu den in Abbildung 12 verglichenen Sequenzen wurden die

Seidenproteine in ClustalW eingefügt und auf Ähnlichkeit, sowie Homologie überprüft.

3.2.6 LALIGN

LALIGN ist ein Programm, welches multiple Ähnlichkeiten von Teilbereichen innerhalb zweier

Sequenzen findet. Folglich müssen stets zwei Sequenzen in das Inputfenster eingegeben

werden. [39] Mittels LALIGN sollten einzelne Repeats innerhalb der Sequenzen von MASp1

sowie MaSp2 gefunden werden.

23

3.3 Strukturvorhersage-Tools

3.3.1 Chou-Fasman

Dieses Tool ermöglicht eine schnelle Vorhersage der Sekundärstruktur eines Proteins auf Basis

der Sequenz. Der Algorithmus, welcher in dem Tool angewandt wird, wurde von Chou und

Fasman 1974 entwickelt. [22, S. 392] Er basiert auf der Annahme der Proteinfaltung entlang

der Sekundärstrukturelemente, beruhend auf Präferenzen. Eine Präferenz gibt die

Wahrscheinlichkeit an, mit der sich eine Aminosäure in einer bestimmten Sekundärstruktur

(Helix, β-Faltblatt, β-Schleife) aufhält. [22, S. 392] Je höher der Wert der Präferenz ist, desto

wahrscheinlicher bildet eine bestimmte Aminosäure eine bestimmte Sekundärstruktur aus.

Der große Nachteil dieses Algorithmus‘ liegt in der geringen Vorhersagegenauigkeit, welche ca.

50-55 % beträgt. Ursache hierfür ist, dass bei der Berechnung der Präferenzen die Information

der Umgebung einer Aminosäure nicht berücksichtigt wird. [22, S. 392-394]

3.3.2 GOR

Der GOR-Algorithmus wurde 1978 von Garnier, Osguthorpe und Robson entwickelt. [15a, 15b,

15c] Im Laufe der Zeit wurde der Algorithmus verbessert und so existieren heute verschiedene

Varianten (GOR I-IV) dieser Vorhersage-Methode. GOR beruht auf einem statistischen Modell,

welches die Information der Umgebung einer Aminosäure miteinberechnet. Für die

Berechnung werden drei Matrizen (für jedes Sekundärstrukturelement eine Matrix: Helix,

Faltblatt, Schleife) aufgestellt, welche die Häufigkeit des Auftretens einer bestimmten

Aminosäure an einer definierten Position für ein Sekundärstrukturelement angeben. Er stellt

sozusagen eine Verbesserung des Chou-Fasman-Algorithmus‘ dar, da er genauer ist. Jedoch

hat der GOR-Algorithmus den Nachteil, dass für eine statistische Analyse sehr viele Daten

benötigt werden. Außerdem entstehen Mehrdeutigkeiten vor allem an den Enden der

Sekundärstrukturelemente. [15a, 15b, 15c]

3.3.3 Simple Modular Architecture Research Tool

Das Simple Modular Architecture Research Tool (SMART) ist ein über den zugehörigen

Internetserver freizugängliches Tool. Es ermöglicht die Identifikation von sich genetisch

verändernden Domänen sowie die Analyse derselben. [33, S. 231] SMART vergleicht die

Eingabesequenz mit den Domänensequenzen und multiplen Alignments der Datenbanken. Die

Sammlung der SMART-Alignments umfasst mehr als 250 Signal- und Extrazelluläre Domänen.

In der Sammlung enthaltene Domänen werden mit verschiedenen Daten annotiert. Die Daten

24

beinhalten Informationen der Domänen über den zellulären Standort, der Verteilung in Arten,

der Funktionsklasse, der Tertiärstruktur und über funktionelle Reste. [28, S. 226]

3.3.4 PROPKA

PROPKA ist ein bioinformatisches Tool, welches die pH-Wert-abhängigen Eigenschaften eines

Proteins wie Ladung und Stabilisationsenergie untersucht. [32, S. 1] Als Eingabeformat wird ein

PDB-File benötigt (siehe Kapitel Protein Data Bank). Das Programm gibt anschließend für jede

enthaltene Aminosäure verschiedene Daten aus, wie zum Beispiel den pKa-Wert. Der pKa-

Wert (oder pKs-Wert) eines Proteins bzw. einer Aminosäure beschreibt das Bestreben eines

Protons, durch Reaktion mit einer Base entfernt zu werden. [6, S. 17] Je niedriger der pKs-Wert

eines Moleküls ist, desto leichter gibt das Molekül ein Proton ab. [6, S. 2] Das Tool PROPKA gibt

außerdem den pI-Wert des Proteins aus. Der pI-Wert gibt den pH-Wert am Isoelektrischen

Punkt an. Bei diesem pH-Wert liegt das Protein in der Zwitterionform vor. Das Zwitterion ist

eine Struktur, bei der ein Molekül zwei entgegengesetzt geladene Gruppen besitzt. Im Falle

des Proteins handelt es sich um eine positiv geladene Carboxylgruppe (protoniert) sowie um

eine negativ geladene Aminogruppe (dissoziiert). [23, S „3-13“; 41, S. 29] Des Weiteren

zeichnet das Programm PROPKA für das jeweilige Protein ein Diagramm, in welchem die

Stabilität des Proteins in Abhängigkeit vom pH-Wert dargestellt ist.

3.3.5 SWISS-MODEL

SWISS-MODEL wurde unter anderem von Mitarbeitern des SIB entwickelt und bietet einen

Server zur Modellierung von Proteinstrukturen an. Frei über den Webbrowser zugänglich

erstellt SWISS-MODEL die Homologiemodelle von Proteinstrukturen. [1, S. 195] Außerdem

beinhaltet der SWISS-MODEL-Server noch weitere Tools, sowie einen integrierten Workspace.

Nach einer Registrierung ist der Workspace jederzeit zugänglich und ermöglicht eine

Speicherung der bisherigen Modellierungsprojekte, jedoch ist SWISS-MODEL auch ohne

Registrierung zu benutzen. Während der Bachelorarbeit wurde das Tool „ Secondary

Structure Prediction and Domain Assignment” des SWISS-MODEL-Servers an den

Spinnenseidenproteinen angewandt.

3.3.6 3D-Position-Specific Score Matrices

3D-Position-Specific Score Matrices (3D-PSSM) stellt eine internetbasierte Methode zur

Erkennung der Proteinfaltung dar. Dabei werden Primär- und Tertiärstrukturinformationen mit

Sekundärstruktur- und Löslichkeitsdaten verknüpft. So können die 3D-Strukturen von

Proteinen mittels homologer Sequenzen vorhergesagt werden. Nach den neuesten Angaben

25

auf der Homepage von 3D-PSSM wird empfohlen, anstelle des 3D-PSSM-Servers die neue

verbesserte „Protein Homology/analogY Recognition Engine“ (Phyre) zu benutzen. [19]

Während der Bachelorarbeit wurde jedoch durchgängig mit dem Server von 3D-PSSM

gearbeitet.

3.3.7 Prediction of TransMembrane Beta-Barrel Proteins

Prediction of TransMembrane Beta-Barrel Proteins (PRED TMBB) ist ein Tool, welches in der

Lage ist, die Topologie von Transmembransträngen und β-Barrel in äußeren

Membranproteinen vorherzusagen. [40, S. W400] Ein β-Barrel (β-Fass) ist eine bestimmte

Anordnung der Polypeptidkette innerhalb einer Membran. Es besteht aus

Transmembransträngen, welche eine β-Faltblattstruktur besitzen und eine fassförmige

Struktur annehmen. Das Besondere ist, dass die Primärstruktur solcher Membranproteine der

Struktur von löslichen Proteinen stark ähnelt. Nichts innerhalb der Sequenz deutet zunächst

auf die endgültige Struktur hin. β-Barrels können daher nicht anhand der Primärstruktur

vorhergesagt werden. [23, S. „9-21“] Hier besteht eine große Ähnlichkeit zu den

Spinnenseidenproteinen, welche zunächst löslich sind und deren Struktur ebenfalls nicht

anhand der Sequenz vorhersagbar ist. Das Tool PRED TMBB beruht auf einem Hidden Markov

Modell, welches mittlerweile 16 nicht-homologe äußere Membranproteine enthält, von denen

die Strukturen in atomarer Auflösung bekannt sind. [40, S. W400] Detaillierte Informationen

zu Hidden Markov Modellen im Buch: Gernot A. Fink: Mustererkennung mit Markov-

Modellen: Theorie, Praxis, Anwendungsgebiete. Teubner, 2003, ISBN 3-519-00453-4.

Der Benutzer kann über den Webserver des PRED TMBB zur Strukturvorhersage eine von drei

verschiedenen Erkennungsmethoden (Algorithmen) auswählen. Entsprechend gibt der Server

die vorhergesagte Topologie, einen Score für die Wahrscheinlichkeit, dass das eingegebene

Protein ein äußeres Membranprotein ist, sowie die Wahrscheinlichkeit für die Vorhersage von

Transmembransträngen, aus. Außerdem werden die errechneten Daten der

Transmembranstränge graphisch dargestellt. [40, S. W400] In Abbildung 13 ist ein Beispiel für

ein Ergebnis der Strukturvorhersage mittels PRED TMBB aufgeführt. Es wurde die Struktur von

Bacteriorhodopsin (PBD-Identifikationsnummer „3NS0“) innerhalb einer Doppellipidschicht

vorhergesagt. Entsprechend der Abbildung befindet sich die Aminogruppe sowie die

Carboxylgruppe im Inneren, während sich ein kleiner Teil des Proteins außerhalb der

Membran, im umgebenden Medium, befindet.

26

Abbildung 13: Struktur von Bacteriorhodopsin (PDD-ID „3NS0“) innerhalb einer Doppellipidschicht, vorhergesagt

mittels PRED TMBB.

Farblich hervorgehoben sind die Aminosäuren nach ihrer Hydrophobizität. Eine blaue bis grüne Farbe kennzeichnet

eine hydrophile Aminosäure, eine gelbe Farbe eine hydrophobe Aminosäure. Erkennbar ist, dass sich die

Aminogruppe im Inneren befindet, während sich ein kleiner Teil des Proteins außerhalb der Membran, im

umgebenden Medium befindet. Auf der Abbildung nicht eingezeichnet ist die Carboxylgruppe, welche sich analog

zur Aminogruppe im Inneren befindet. Die Skala der Hydrophobizität stammt aus dem Handbuch zum Tool, aus:

Spyropoulos, Ioannis C.; Liakopoulos, Theodore D.; Bagos, Pantelis G.; Hamodrakas, Stavros J.: TMRPres2D – High

quality visual representation of transmembrane protein models.

27

4 Methoden und Ergebnisse

Zu Beginn der Bachelorarbeit galt es, bisherigen Arbeiten, darunter die Belegarbeit im 4.

Semester sowie das Praxismodul im 5. Semester, zusammenzufassen. Es wurde ein Überblick

geschaffen, wie der Wissenstand zum Thema „Der Spinnenfaden auf molekularer Ebene –

untersucht mit bioinformatischen Tools“ war und was bisher erreicht wurde. Ferner wurde ein

erster grober Plan erstellt, was in der Zeit der Bachelorarbeit stofflich bearbeitet werden

sollte. Der grobe Plan wurde in einzelne kleinere Aufgaben geteilt, die es pro Woche zu

erledigen galt. Daher erweist es sich als sinnvoll, den Inhalt sowie die Ergebnisse der einzelnen

Wochenaufgaben chronologisch zu berichten. In Abbildung 14 ist ein Schema des groben

Arbeitsplans dargestellt.

Abbildung 14: Workflow des Arbeitsplans.

Hier ist der Ablaufplan der Bachelorarbeit grob dargestellt. Der grobe Plan wurde in 3 einzelne Methodenkomplexe

unterteilt. Im Plan aufgeführt sind lediglich die Inhalte, welche bearbeitet werden sollten. Nicht enthalten sind die

Ergebnisse sowie die tatsächlich durchgeführten Arbeiten. Der eigentliche Plan wurde im Laufe der Arbeit verändert

und angepasst, da einige Inhalte nicht bearbeitet werden konnten. (z. B. LALIGN).

4.1 Methodenkomplex 1

Das Hauptziel des ersten Methodenkomplexes war die Suche nach Programmen, welche in der

Lage sind, pH-Wert-abhängige Strukturen vorherzusagen. Die Literatur sollte nach

28

Informationen über Proteine durchsucht werden, von denen bekannt ist, dass sie bei zwei

unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden. Anschließend

sollten Abbildungen generiert werden, welche die Sekundär- bzw. Tertiärstrukturen der fertig

gefalteten Proteine in Abhängigkeit vom pH-Wert darstellen. Außerdem sollten mit Hilfe der

Protein Data Bank die 3D-Strukturen der Spinnenseidenproteine verglichen werden und so

viele Daten wie möglich zu den terminalen Domänen herausgefunden werden.

Es wurde mittels verschiedener Suchanfragen im Internet (Suchmaschinen) ein

bioinformatisches Tool gefunden, welches in der Lage ist, pH-Wert-abhängige Eigenschaften

von Proteinen wie Ladung und Stabilisationsenergie zu untersuchen. Das Tool trägt den Namen

PROPKA. Der Nachteil dieses Tools ist, dass als Eingabeformat eine alleinige Sequenz eines

Proteins nicht ausreicht. Es wird ein PDB-File benötigt, in welchem die Informationen über die

Topologie der Atome innerhalb eines Proteins enthalten sind (siehe Kapitel 3.1.4). Daher

wurde das „major ampullate spidroin“ 1 der Spinne Euprosthenops australis (E. australis),

welches die PDB-Identifikationsnummer „3LR2“ besitzt, mittels PROPKA auf pH-Wert-

abhängige Eigenschaften von Proteinen, wie Ladung und Stabilisationsenergie untersucht. Es

handelt sich hierbei jedoch nicht um die Sequenz des kompletten Proteins, sondern lediglich

um die Sequenz der N-terminale Domäne des MaSp1 von E. australis. Mittels PROPKA 2.0

wurde herausgefunden, dass die Stabilität der N-terminalen Domäne bei einem neutralen pH-

Wert geringer ist als bei einem sauren pH-Wert. Im Diagramm in Abbildung 15 ist die Stabilität

der N-terminalen Domäne des MaSp1 von E. australis in Abhängigkeit vom pH-Wert

dargestellt. Erkennbar ist, dass bei einem neutralen pH-Wert von 7, welcher während der

Speicherung des Seidenproteins innerhalb der Drüse vorliegt, die Stabilität der N-terminalen

Domäne geringer ist als bei einem sauren pH-Wert. Ein saurer pH-Wert (ca. 6) liegt während

der Umstrukturierung der Seidenproteine innerhalb des Spinnkanals vor. (siehe Kapitel 2.3).

Nach der Untersuchung der Eigenschaften der N-terminalen Domäne, folgte die Untersuchung

der C-terminalen Domäne. Da keine genaueren atomaren Daten der C-terminalen Domäne von

MaSp1 der Spinne E. australis existieren, wurden die Daten der C-terminalen Domäne eines

anderen Proteins untersucht. Als „Ersatz“ wurde die C-terminale Domäne des Fibroins 3 der

Spinne Araneus diadematus (ADF-3) untersucht, welches sich hinter der PDB-

Identifikationsnummer „2KHM“ verbirgt. Mit Hilfe des bioinformatischen Tools PROPKA 2.0

stellte sich heraus, dass die Stabilität der C-terminalen Domäne von ADF-3 bei einem neutralen

pH-Wert größer ist als die Stabilität bei einem sauren pH-Wert. Die Stabilität der C-terminalen

Domäne von ADF-3 verhält sich genau umgekehrt wie die Stabilität der N-terminalen Domäne

29

von MaSp1 von E. australis in Abhängigkeit vom pH-Wert. Die Art der Stabilität beider

terminaler Domänen variiert ebenfalls. Die N-terminale Domäne des MaSp1 von E. australis

weist überwiegend negative Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4

positive Werte auf. Dagegen besitzt die C-terminale Domäne von ADF-3 durchgängig positive

Werte der Stabilität. Die Stabilität der C-terminale Domäne von ADF-3 in Abhängigkeit vom pH-

Wert ist in Abbildung 15 graphisch dargestellt.

Abbildung 15: Stabilität der terminalen Domänen des Spinnenseidenproteins in Abhängigkeit vom pH-Wert.

Im linken Diagramm ist die Stabilität der N-terminalen Domäne von MaSp1 der Spinne Euprosthenops australis

dargestellt, im rechten Diagramm die Stabilität der C-terminalen Domäne von Fibroin 3 der Spinne Araneus

diadematus (ADF-3). Erkennbar ist, dass bei einem neutralen pH-Wert von 7 die Stabilität der N-terminalen Domäne

(links) geringer ist als bei einem sauren pH-Wert. Die Stabilität der C-terminalen Domäne (rechts) von ADF-3 verhält

sich genau umgekehrt. Die N-terminale Domäne (links) des MaSp1 von E. australis weist überwiegend negative

Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4 positive Werte auf. Dagegen besitzt die C-terminale

Domäne (rechts) von ADF-3 durchgängig positive Werte der Stabilität.

Die Suche nach Informationen über Proteine, von denen bekannt ist, dass sie bei zwei

unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden, blieb erfolglos.

Demnach konnten auch keine Abbildungen generiert werden, welche die Sekundär- bzw.

Tertiärstrukturen der jeweiligen fertig gefalteten Proteine in Abhängigkeit vom pH-Wert

darstellen. Die 3D-Strukturen der Spinnenseidenproteine konnten nur teilweise verglichen

werden. Die praktischen Experimente und Untersuchungen wurden nur an den terminalen

Domänen der Spinnenseidenproteine durchgeführt, somit konnten nur deren Strukturen

verglichen werden. Das eigentliche Ziel war es, die β-Faltblatt-Bildung zu verstehen. Da sich an

den terminalen Domänen ohnehin keine β-Faltblätter bilden, konnte das Ziel nicht allein durch

die Analyse terminaler Domänen erreicht werden. Während der Recherchen über

Informationen von 3D-Strukturen der Spinnenseidenproteine konnte eine komplette Sequenz

der Proteine MaSp1 sowie MaSp2 von Latrodectus hesperus in der Universal Protein Resource

(UniProt) gefunden werden. [42; 43] Bisherige Arbeiten wurden nur anhand von Segmenten

der Seidenproteinsequenzen von Araneus diadematus und Euprosthenops australis

durchgeführt. Daher galt der Fund der kompletten Sequenz von L. hesperus als erfreulicher

30

Fortschritt und erleichterte nachfolgende Arbeiten. Außerdem konnten alle weiteren Aufgaben

anhand einer Sequenz durchgeführt werden, ohne eine komplette Sequenz mittels

verschiedener Datenbanken „zusammensetzen“ zu müssen. Hierbei wird ein Nachteil der

großen Datenbanken wie zum Beispiel der NCBI deutlich: Viele Daten liegen mehrmals vor, so

dass es Dopplungen und Überschneidungen der enthaltenen Informationen gibt. Die

Sekundärstruktur der Proteine MaSp1 und MaSp2 von L. hesperus wurde mit Hilfe der Tools

GOR und Chou-Fasman vorhergesagt. Beide Tools sagten eine Helix-Struktur-Bildung der Poly-

Alanin-Muster vorher. Diese Daten sind als „falsch“ bzw. als nicht aussagekräftig zu werten.

Kernmagnetresonanzexperimente, sowie Röntgenbeugungsanalyse, welche am Abseilfaden

von Nephila clavipes durchgeführt worden waren, belegen die Bildung von β-Faltblättern der

Poly-Alanin-Muster. [47, S. 545; 13, S. 82] In Abbildung 16 sind die Ergebnisse der

Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne Latrodectus hesperus

dargestellt. Beide Sequenzen bestehen aus über 3000 Aminosäuren. Daher ist nur ein

Ausschnitt der Sekundärstrukturelemente der jeweiligen Sequenzen aufgeführt. Die

Farbgebung der Sekundärstrukturelemente beider Tools variieren. Bei GOR (linker Teil der

Abbildung) sind die Helices blau, die Faltblätter rot und die Schleifen grün hervorgehoben. Bei

Chou-Fasman hingegen sind die Helices rot, die Faltblätter grün und die Schleifen blau

markiert. Die Zufallsknäul (coil) sind bei beiden Tools gelb dargestellt. Deutlich erkennbar ist,

dass beide Tools Helix-Strukturen der Poly-Alanin-Muster vorhersagen. Die vollständigen

Ergebnisse von GOR und Chou-Fasman sind in einer gleichnamigen Datei gespeichert und mit

Hilfe eines Computers abrufbar. [40; 41]

31

Abbildung 16: Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne Latrodectus hesperus mittels GOR

und Chou-Fasman.

Beide Sequenzen bestehen aus über 3000 Aminosäuren. Daher ist nur ein Ausschnitt der Sekundärstrukturelemente

der jeweiligen Sequenzen aufgeführt. Die Farbgebung der Sekundärstrukturelemente beider Tools variieren. Bei

GOR (linker Teil der Abbildung) sind die Helices blau, die Faltblätter rot und die Schleifen grün hervorgehoben. Bei

Chou-Fasman (rechts) hingegen sind die Helices rot, die Faltblätter grün und die Schleifen blau markiert. Die

Zufallsknäul (coil) sind bei beiden Tools gelb dargestellt. Deutlich erkennbar ist, dass beide Tools Helix-Strukturen

der Poly-Alanin-Muster hervorsagen. Die vollständigen Ergebnisse von GOR und Chou-Fasman sind in einer

gleichnamigen Datei gespeichert und mit Hilfe eines Computers abrufbar. [40; 41]

4.2 Methodenkomplex 2

Nachdem die bioinformatischen Vorhersagetools GOR und Chou-Fasman keine

aussagekräftigen Ergebnisse über die Sequenzen beider „major ampullate spidroins“ von

Latrodectus hesperus lieferten, sollten andere Vorhersagetools angewandt werden. Das

Hauptziel des zweiten Methodenkomplexes war die Erstellung von Homologiemodellen aus

der kompletten Spidroinsequenz von Latrodectus hesperus. Hauptsächlich sollte nur der Teil

der Sequenz benutzt werden, welcher β-Faltblätter bildet. Es sollte von den beiden β-Faltblatt-

Abschnitten, genauer den repetitiven Kernsequenzen beider Spidroins, je ein PDB-File erstellt

werden. Zu diesem Zweck sollten die kompletten Sequenzen von MaSp1 und MaSp2 in die

einzelnen drei Sequenzabschnitte unterteilt werden. Es galt, die N-terminale Domäne, die C-

terminale Domäne sowie den repetitiven Mittelteil in der kompletten Sequenz zuzuordnen.

32

Unter Zuhilfenahme der Domänensequenz der „major ampullate spidroins“ einer anderen

Spinne und des Programms LALIGN sollten so die einzelnen terminalen Domänen in der

gesamten Sequenz des MaSp1 bzw. MaSp2 von L. hesperus gefunden werden. Anschließend

sollte der repetitive Mittelteil des MaSp1/MaSp2 in das Tool SWISS-MODEL Template

Identification eingefügt werden, um ein Template zu finden. Ein Template ist eine Vorlage.

Template Identification von SWISS-MODEL ist ein Tool, welches zu einer eingegeben Sequenz

mit Hilfe verschiedener Datenbanken und Programmen ähnliche Sequenzen sucht, um eine

Vorlage einer ähnlichen Struktur zu liefern. [34] Anhand dieser Vorlage sollte ein

Strukturmodell erstellt werden, falls möglich. Dieses Strukturmodell sollte ein PDB-File liefern,

welches anschließend auf die pH-Wert-abhängigen Eigenschaften wie Ladung und

Stabilisationsenergie mittels PROPKA untersucht werden sollte. Ferner sollte eine

Bestandsaufnahme angefertigt werden, die das gesamte bisherig gesammelte Wissen über die

terminalen Domänen der Spinnenseidenproteine enthielt. Eine weitere Aufgabe bestand darin,

mit Hilfe des Tools SMART die terminalen Domänen innerhalb der „major ampullate spidroins“

von L. hesperus zu identifizieren. Außerdem sollte die CDD-Suche an den Seidenproteinen von

L. hesperus durchgeführt werden, um ähnliche Proteindomänen zu den eingegebenen

Seidenproteinen zu finden. Parallel zu den genannten Aufgaben sollte die Suche nach

Programmen fortgesetzt werden, welche pH-Wert-abhängige Sekundär- bzw. Tertiärstrukturen

von Proteinen vorhersagen können.

Der Grundidee der Benutzung von LALIGN erwies sich als nicht umsetzbar, da von den anderen

Spinnenseidenproteinen nur einzelne Fragmente in den Datenbanken existierten. Die

jeweiligen terminalen Domänen konnten aus den existierenden Fragmenten nicht vollständig

herausgefiltert werden. Mit anderen Worten, es konnte nicht zugeordnet werden, ob

vorliegende Sequenzfragmente eine komplette terminale Domäne charakterisierten.

Glücklicherweise waren in der zu den UniProt-Einträgen beider „major ampullate spidroins“

von L. hesperus gehörenden wissenschaftlichen Veröffentlichung die kompletten Sequenzen

aufgeführt. Anhand dieser Veröffentlichung konnten die N-terminalen Domänen, die C-

terminalen Domänen, sowie die repetitiven Kernsequenzen beider kompletter Sequenzen

identifiziert werden. Die N-terminale Domäne von MaSp1 erstreckt sich von der ersten

Aminosäure (MTW…) bis einschließlich zur Aminosäure 202 (…PVS). Die C-terminale Domäne

von MaSp1 beginnt bei der Aminosäure 3011 (SGP…) und erstreckt sich bis zum Ende der

Sequenz (…AFA). Zwischen N-und C-terminaler Domäne befindet sich der repetitive Mittelteil

von Aminosäure 203 (YGQ…) bis 3010 (…AAA). MaSp1 besteht insgesamt aus 3129

Aminosäuren. [3, S. 2-3; 45] MaSp2 dagegen besteht aus insgesamt 3779 Aminosäuren. Die N-

33

terminale Domäne von MaSp2 beginnt bei der ersten Aminosäure (MTT…) und endet

einschließlich bei der Aminosäure 217 (…AAA). Es folgt der repetitive Mittelteil ab Aminosäure

218 (GSG…) bis zur Aminosäure 3657 (…AAA). Schließlich erstreckt sich die C-terminale

Domäne von Aminosäure 3658 (SGS…) bis zur letzten Aminosäure der Sequenz (…AMG). [3, S.

3-4; 46]

Die Bestandsaufnahme, die das gesamte bisherig gesammelte Wissen über die terminalen

Domänen der Spinnenseidenproteine enthielt, wurde angefertigt. Wissenschaftliche

Experimente und zugehörige Veröffentlichungen besagen, dass sowohl die C-terminale als

auch die N-terminale Domäne einen hohen Anteil an α-Helices, sowie eine hohe thermische

Stabilität besitzen. [11, S. 310; 23, S. 239-240] Beide terminale Domänen weisen hydrophobere

Eigenschaften als der repetitive Mittelteil auf. [10, S. 239; 19, S. 3] Die hydrophobste Stelle in

MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne, wie in Abbildung 17

erkennbar ist. [3, S. 6; 48] Diese Abbildung dient dem bioinformatischen Nachweis der

hydrophoben Eigenschaften der verschiedenen Sequenzabschnitte.

34

Abbildung 17: Hydrophobizitätsplot nach Kyte und Doolittle von MaSp1 sowie MaSp2 der Spinne Latrodectus

hesperus.

Die Hydrophobizitätsplots wurden pro Sequenzabschnitt, siehe Beschriftung, bei einer Fensterlänge von 7

durchgeführt. Anhand der Hydrophobizitätsskala ist erkennbar, dass die N-terminale Domäne von MaSp1 (links

unten) der hydrophobste aller verglichenen Sequenzabschnitte ist. Die repetitiven Kernsequenzen (oben rechts und

oben links) beider spidroins bestehen aus abwechselnd hydrophoben und hydrophilen Bereichen. Diese Eigenschaft

wird auch als Amphiphilie bezeichnet. Erkennbar ist auch, dass die terminalen Domänen (mitte rechts, mitte links,

unten rechts, unten links) hydrophober als die repetitiven Kernsequenzen (oben links, oben rechts) sind. Die

hydrophobste Stelle in MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne (unten rechts, unten

links). Die vollständigen Ergebnisse der Hydrophobizitätsplots sind in einer gleichnamigen Datei gespeichert und mit

Hilfe eines Computers abrufbar. [44]

35

Experimente, welche an den Spinnenproteinen unter verschiedenen Bedingungen

durchgeführt worden waren, belegen, dass sowohl die C-terminale als auch die N-terminale

Domäne eine große Rolle für die korrekte Assemblierung der Seidenfaser spielen. [2, S. 236;

23, S. 240-241] Die C-terminale Domäne wird für die Aggregation der Spinnenproteine

während der abnehmenden Natriumchloridkonzentration innerhalb des Spinnkanals benötigt

(siehe Kapitel „Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals“). [3, S. 9;

23, S. 241] Außerdem sorgt die C-terminale Domäne für die Bildung kristalliner Strukturen. [3,

S. 9] Die N-terminale Domäne unterstützt diese Faserassemblierung, indem sie für die nötige

Stabilität des Proteins verantwortlich ist. [3, S. 10; 47, S. 312] Einer N-Terminalen Domäne ist

es möglich mit einer anderen N-terminalen Domäne ein Dimer auszubilden. Diese

Dimerisierung ist stark von der umgebenden Salzkonzentration sowie vom pH-Wert abhängig.

[10, S. 238; 47, S. 312] Durch die Bildung der kristallinen Strukturen, initiiert durch die C-

terminale Domäne, sowie die Dimerisierung der N-terminalen Domänen entstehen

kontrollierte Wechselwirkungen zwischen den Seidenproteinen und ermöglichen so ein

Verlängerung der Proteinketten. [10, S. 238; 47, S. 312] Das Resultat ist die Entstehung der

charakteristischen Faserstrukturen. Kernmagnetresonanzexperimente zeigten, dass die N-

terminale Domäne bei einem pH-Wert von 6 ein stabiles Dimer mit einer anderen N-

terminalen Domäne ausbildet, unabhängig von der umgebenden Salzkonzentration. [11, S.

311] Während der Speicherung der Seidenproteine innerhalb der Spinndrüse, bei einem pH-

Wert von 7, sorgt Natriumchlorid für eine Stabilisierung der Monomerstruktur der N-

terminalen Domäne. Gleichzeitig wird die Dimerisierung unterbunden. [10, S. 239; 47, S. 311-

312] So ist es möglich, dass selbst bei einer sehr hohen Proteinkonzentration die

Seidenproteine innerhalb der Drüse weder eine Faserstruktur einnehmen noch verklumpen.

[10, S. 239] Wie kommt diese enorm hohe Stabilität der Seidenproteine während der

Speicherung in der Spinndrüse zu Stande? Diese Frage kann mit einer von zwei Theorien

beantwortet werden, welche von unterschiedlichen Forschungsgruppen postuliert worden

sind. Doch um sich nicht ohne eigens durchgeführte Experimente auf diese beiden Theorien zu

beziehen, wurden MaSp1 sowie MaSp2 der Spinne Latrodectus hesperus mit Hilfe anderer

bioinformatischer Strukturvorhersagetools untersucht.

Der repetitive Mittelteil des MaSp1/MaSp2 wurde in das Tool SWISS-MODEL Template

Identification eingefügt, um ein Template zu finden. Anhand dieses Template sollte ein

Strukturmodell erstellt werden, falls möglich. Dieses Strukturmodell sollte ein PDB-File liefern,

welches anschließend auf die pH-Wert-abhängigen Eigenschaften wie Ladung und

Stabilisationsenergie mittels PROPKA untersucht werden sollte. Die Suche nach einem

36

Template blieb erfolglos. Es existierten keine homologen Daten zu der repetitiven Kernsequenz

des MaSp1 bzw. MaSp2 von L. hesperus, weder ähnliche Sequenzen noch ähnliche Strukturen.

Ohne das Template konnte somit kein Strukturmodell erzeugt werden. Ein Modell des

repetitiven Mittelteils des MaSp1 von L. hesperus konnte daher mittels SWISS-MODEL nicht

erstellt werden. Lediglich die Informationen der N-terminalen Domäne sind vorhanden. Der

Automated Mode von SWISS-MODEL lieferte ebenfalls kein Ergebnis. Der Automated Mode

sucht mit automatisch konfigurierten Parametern nach Templates und erstellt anschließend

ein Homologiemodell falls möglich, ebenfalls automatisch. Mit Hilfe des Tools „Secondary

Structure Prediction and Domain Assignment” von SWISS-MODEL konnten die terminalen

Domänen beider „major ampullate spidroins“ identifiziert werden. Zur Identifikation von

Sekundärstrukturen und zur Lokalisation von Proteindomänen verwendet das Tool Programme

von verschiedenen Datenbanken wie z. B. Hidden Markov Modelle der Pfam, des SMART, der

PIR und andere. [34] Pfam ist eine Datenbank, welche konservierte Proteinfamilien sowie

Proteindomänen enthält. [9, S. „D211“] In Abbildung 18 (MaSp1) und 19 (MaSp2) ist ein

Ausschnitt des Ergebnisses von „Secondary Structure Prediction and Domain Assignment“

dargestellt. Die Vorhersage der Helixstrukturen am Anfang und Ende beider spidroin-

Sequenzen stimmt mit den Ergebnissen aus den Röntgenanalysen-Experimenten der

Forschungsgruppen überein. [2, S. 237; 23, S. 239-240] Diese Bereiche kennzeichnen die

terminalen Domänen des Seidenproteins. Der repetitive Mittelteil der Sequenz bildet laut

diesem Tool Coil-Strukturen aus, da noch keine genaueren Informationen zu diesen

Sekundärstrukturen existieren. Das Ergebnis der „Secondary Structure Prediction and Domain

Assignment” stellt somit eine gute Zusammenfassung der bisherigen Informationen über die

Strukturen der Seidenproteine MaSp1 und MaSp2 dar. Die experimentell gewonnenen Daten

über die Strukturen der terminalen Domänen wurden so bioinformatisch nachgewiesen.

37

Abbildung 18: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von MaSp1.

Die Sequenz besteht aus 3129 Aminosäuren (oben im Bild zu erkennen). Die Darstellung enthält daher nur 2

zusammengefügte Teilabschnitte des Ergebnisses (Abschnitt 1 von Aminosäure 1 bis 362 und Abschnitt 2 von

Aminosäure 2881 bis 3129). Die laut diesem Tool vorhergesagten Sekundärstrukturen sind über der Sequenz

abgebildet. Die Sekundärstrukturen werden in Abhängigkeit von der Wahrscheinlichkeit in einer Art Diagramm

dargestellt. Je höher die Wahrscheinlichkeit der Ausbildung einer bestimmten Sekundärstruktur ist, desto höher ist

der jeweilige Graph im Diagramm. Unterhalb des Wahrscheinlichkeitsplots ist der Typ des

Sekundärstrukturelementes aufgeführt, welcher farblich mit dem Graphen der Wahrscheinlichkeit übereinstimmt:

rot-H-Helix; grün-C-Coil; gelb-E-Strand. blau-sonstiges. Erkennbar ist, dass sich am Anfang (N-terminale Domäne)

und Ende der Sequenz (C-terminale Domäne) Helixstrukturen bilden. Dazwischen (repetitiver Mittelteil) bilden sich

ausschließlich Coil-Strukturen. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und

mit Hilfe eines Computers abrufbar.

38

Abbildung 19: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von MaSp2.

Die Sequenz besteht aus 3779 Aminosäuren (oben im Bild zu erkennen). Die Darstellung enthält daher nur 2

zusammengefügte Teilabschnitte des Ergebnisses (Abschnitt 1 von Aminosäure 1 bis 362 und Abschnitt 2 von

Aminosäure 3481 bis 3779). Die laut diesem Tool vorhergesagten Sekundärstrukturen sind über der Sequenz

abgebildet. Die Sekundärstrukturen werden in Abhängigkeit von der Wahrscheinlichkeit in einer Art Diagramm

dargestellt. Je höher die Wahrscheinlichkeit der Ausbildung einer bestimmten Sekundärstruktur ist, desto höher ist

der jeweilige Graph im Diagramm. Unterhalb des Wahrscheinlichkeitsplots ist der Typ des

Sekundärstrukturelementes aufgeführt, welcher farblich mit dem Graphen der Wahrscheinlichkeit übereinstimmt:

rot-H-Helix; grün-C-Coil; gelb-E-Strand. blau-sonstiges. Erkennbar ist, dass sich am Anfang (N-terminale Domäne)

und Ende der Sequenz (C-terminale Domäne) überwiegend Helixstrukturen bilden. Dazwischen (repetitiver

Mittelteil) bilden sich ausschließlich Coil-Strukturen. Das vollständige Ergebnis des Tools ist in einer gleichnamigen

Datei gespeichert und mit Hilfe eines Computers abrufbar.

39

Des Weiteren wurden keine bioinformatischen Programme oder Tools gefunden, welche eine

pH-abhängige Struktur vorhersagen können. Mit Hilfe des Tools SMART konnten die

terminalen Domänen innerhalb der „major ampullate spidroins“ von L. hesperus nicht

identifiziert werden. In Abbildung 20 ist ein Ausschnitt des Ergebnisses von SMART abgebildet.

Beide kompletten Sequenzen von MaSp1 und MaSp2 wurden eingefügt. Unabhängig von der

Wahl der SMART-Modi (Genome oder Normal) wurden die gleichen Ergebnisse ausgegeben.

[45]

Abbildung 20: Identifikation der terminalen Domänen von MaSp1 (oben) sowie MaSp2 (unten) der Spinne

Latrodectus hesperus mittels SMART.

Es handelt sich hierbei um einen Ausschnitt des gesamten Ergebnisses, da beide Sequenzen zu groß sind, um

komplett in der Abbildung dargestellt zu werden. Unabhängig vom gewählten SMART-Modus (Genome oder

Normal) werden die gleichen Ergebnisse ausgegeben. Die pink hervorgehobenen Sequenzbereiche kennzeichnen

Regionen von geringer Komplexität. Die grauen Bereiche markieren Regionen, über die keine Informationen

vorliegen. Die vollständigen Ergebnisse der SMART-Anwendung sind in einer gleichnamigen Datei gespeichert und

mit Hilfe eines Computers abrufbar. [45]

Außerdem wurde die CDD-Suche des MaSp1, sowie MaSp2 von L. hesperus durchgeführt, um

ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden. Die Suchanfrage

beider Proteine gab jeweils ein und denselben Treffer aus. Es wurde eine Übereinstimmung

mit dem Pfam-Eintrag 11260 gefunden. Der Pfam-Eintrag 11260 enthält Informationen über

sowohl MaSp1 als auch MaSp2, zusammengetragen aus verschiedenen Datenbanken des NCBI.

Aus diesen Daten geht die Ähnlichkeit der Strukturen der C-terminalen Domänen einher. So

ähnelt die C-terminale Domäne der Proteine MaSp1/MaSp2 von L. hesperus stark der C-

terminalen Domäne des Fibroins von Araneus diadematus. Dadurch wird die in vorherigen

Kapiteln erwähnte Konservierung der C-terminalen Regionen bioinformatisch bestätigt.

Abbildung 21 zeigt das Ergebnis der Suche mittels CDD. Die Übereinstimmung der

40

eingegebenen Sequenzen mit den Sequenzen des Pfam-Eintrags 11260 ist durch einen roten

Rahmen gekennzeichnet. Beide Suchergebnisse sind lokal gespeichert und können über einen

Computer abgerufen werden. [46]

Abbildung 21: CDD-Suche an MaSp1 (oben) sowie MaSp2 (unten) von L. hesperus.

Die CDD-Suche wurde durchgeführt, um ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden.

Die Suchanfrage beider Proteine gab jeweils ein und denselben Treffer aus. Es wurde eine Übereinstimmung mit

dem Pfam-Eintrag 11260 gefunden, durch den roten Rahmen gekennzeichnet. Aus diesen Daten geht die

Ähnlichkeit der Strukturen der C-terminalen Domänen einher. So ähnelt die C-terminale Domäne der Proteine

MaSp1/MaSp2 von L. hesperus stark der C-terminalen Domäne von Araneus diadematus. Dadurch wird die in

vorherigen Kapiteln erwähnte Konservierung der C-terminalen Regionen bioinformatisch bestätigt. Beide

Suchergebnisse sind lokal gespeichert und können über einen Computer abgerufen werden. [46]

41

4.3 Methodenkomplex 3

Anhand der Anwendung der bioinformatischen Tools SWISS-MODEL, SMART und CDD ist

auffällig, wie wenig strukturelle Informationen über die Proteine des Spinnenfadens bekannt

sind. Es existierten weder Templates einer homologen Sequenz (SWISS-MODEL), noch konnten

bestimmte Domänen innerhalb der Seidenproteine identifiziert werden (SMART). Lediglich die

Suche in der CDD des NCBI nach ähnlichen Sequenzen war erfolgreich. Es konnte die

Ähnlichkeit der C-terminalen Domänen innerhalb verschiedener Spinnenarten festgestellt

werden. Wieso sind weder Sekundärstrukturvorhersagetools noch Tools, die

Homologiemodelle erstellen erfolgreich? Trotz der einfachen, stark repetitiven Primärstruktur

der Seidenproteine, konnten bisher keine 3D-Strukturen modelliert bzw. simuliert werden. Die

Strukturbildung scheint zu komplex zu sein, um sie mit bioinformatischen Programmen

nachzuweisen oder zu verstehen. Aus diesem Grund sollte der nächste Aufgabenbereich den

praktischen Experimenten gewidmet werden. Die Ergebnisse der Kernmagnetresonanz,

Röntgenbeugungsanalyse und weitere an den Proteinen des Spinnenfadens durchgeführte

Experimente sollten noch genauer analysiert werden. Außerdem sollte das Programm 3D-

PSSM genutzt werden, um die Faltung der Spinnenseidenproteine vorherzusagen.

Mittels Rasterelektronenmikroskopie (SEM-scanning electron microscopy) und

Atomkraftmikroskopie (AFM-atomic force microscopy) wurden kleine mizellenartige

Unterstrukturen der sich in einer wässrigen Lösung befindenden spidroins entdeckt. [18, S.

1058] Transmissionselektronmikroskopie-Versuche belegen ebenfalls eine Bildung von

mizellenartigen Strukturen. [20, S. 8908] Die Forschungsgruppe um Fritz Vollrath entdeckte

eine andere Strukturbildung. Entgegen der Mizellentheorie wird von einer Flüssigkristalltheorie

ausgegangen, bei der die neusynthetisierten Seidenproteine zunächst eine flüssigkristalline

Phase innerhalb der Spinnlösung annehmen. [8, S 3644] Beide Theorien scheinen auf den

ersten Blick sehr gegensätzlich zu sein, jedoch schließt die Mizellentheorie von Jin und Kaplan

die Flüssigkristallinität nicht aus. [8, S. 3646] Im weiteren Verlauf der Arbeit galt es, diese

beiden Theorien zu untersuchen, zu vergleichen und durch das Einbringen eigener

Erkenntnisse zu verstehen. Außerdem wurde ein weiteres bioinformatisches Tool namens 3D-

PSSM benutzt, um homologe Strukturen bzw. Sequenzen zu finden. Das Problem war hierbei,

dass die Eingabesequenz nur aus 30 bis 800 Aminosäuren bestehen durfte. Um eine gezielte

Suche nach homologen Sequenzen zu ermöglichen, mussten die einzelnen Muster, genauer die

einzelnen Repeats der Proteine MaSp1 und MaSp2 in das Programm eingefügt werden. Zu

diesem Zweck wurde die Analysemethode Dotplot angewandt, um die einzelnen Repeats

42

innerhalb der Sequenzen beider spidroins zu identifizieren. Ein einfaches Programm, Dotlet

genannt, wurde an den Seidenproteinen angewandt, um die enthaltenen Repeats zu

erkennen. Anhand des paarweisen Alignments mittels Dotlet konnte der repetitive Mittelteil

des MaSp1 und des MaSp2 eindeutig identifiziert werden. Die terminalen Domänen heben sich

deutlich von dem Mittelteil ab. In Abbildung 22 ist die Sequenz des MaSp1 von L. hesperus im

Programm Dotlet dargestellt, in Abbildung 23 die Sequenz von MaSp2. Beide Sequenzen

wurden jeweils gegen sich selbst paarweise aligniert, um identische Bereiche innerhalb ein und

derselben Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats, die es galt

herauszufinden, um sie anschließend in das Programm 3D-PSSM einzufügen. Die eingestellten

Parameter (Fenstergröße 15; Gray Scale 100%-12%) sind bei beiden Proteinsequenzen

identisch, um einen einheitlichen Vergleich zu ermöglichen. Im oberen Teil der Abbildungen

(grün gekennzeichnet) befinden sich der Eingabebutton, sowie die Auswahlfenster, um

verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich

der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor

durch den Benutzer innerhalb des Sequenzalignments gesteuert werden. Die Markierung

mittels Cursor ist durch den Schnittpunkt der beiden blauen Geraden gekennzeichnet.

Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert wurden. Je nachdem,

welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der

Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots.

Unterhalb des Dotplots ist erkennbar, dass beide Eingabesequenzen an dieser Position

identisch sind (da es sich um ein und dieselbe Sequenz handelt). Ebenfalls gut erkennbar ist die

Diagonale durch die Matrix, ein zweiter Nachweis für die Identität der Eingabesequenzen.

Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)

konfiguriert werden.

In Abbildung 24 gut erkennbar ist, dass zu Beginn der Sequenz keine Repeats existieren. Erst ab

ca. 200 Aminosäuren sind Repeats erkennbar. Repeats sind im Dotplot mit schwarzen Linien

gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto

häufiger und desto größer sind die Repeats. Erstaunlich ist, dass die Kernsequenzen der

Seidenproteine MaSp1 und MaSp2 enorm viele Repeats enthalten. Außerdem sind die Repeats

ineinander geschachtelt, das bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats.

Die Sequenz besteht aus immer wiederkehrenden Mustern. Gut erkennbar ist dies in

Abbildung 24 und 25. In Abbildung 24 ist der Mittelteil des MaSp1 von L. hesperus im Dotplot

dargestellt, in Abbildung 25 der Mittelteil des MaSp2. Deutlich zu sehen sind die repetitiven

Muster. Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-

43

identischen Bereichen umgeben sind, entstehen quadratähnliche Formen im Dotplot. Die

Dotplots beider „major ampullate spidroins“ zeigen regelmäßige Quadrate innerhalb der

Sequenzen. Die Quadrate von MaSp1 sind größer als die Quadrate von MaSp2. Außerdem

ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren

Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot

gescrollt wird.

Abbildung 22: Sequenz (N-terminal) des MaSp1 von L. hesperus im Programm Dotlet.

Die komplette Sequenz von MaSp1 wurde gegen sich selbst paarweise aligniert, um identische Bereiche in der

Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats. Die eingestellten Parameter

(Fenstergröße 15; Gray Scale 100%-12%) sind mit denen in Abbildung 23 identisch, um einen einheitlichen Vergleich

zu ermöglichen. Im oberen Teil der Abbildung (grün gekennzeichnet) befinden sich der Eingabebutton sowie die

Auswahlfenster, um verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich

der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor durch den Benutzer

innerhalb des Sequenzalignments gesteuert werden. Die Markierung mittels Cursor ist durch den Schnittpunkt der

beiden blauen Geraden gekennzeichnet. Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert

wurden. Je nachdem, welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der

Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots. Unterhalb des Dotplots

ist erkennbar, dass beide Eingabesequenzen an dieser Position identisch sind (da es sich um ein und dieselbe

Sequenz handelt). Ebenfalls gut erkennbar ist die Diagonale durch die Matrix, ein zweiter Nachweis für die Identität

der Eingabesequenzen. Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)

konfiguriert werden. Weiße Stellen im Dotplot kennzeichnen nicht-identische Bereiche. Repeats sind im Dotplot mit

schwarzen Linien gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto häufiger

und desto größer sind die Repeats. Zu Beginn der Sequenz existieren keine Repeats. Erst ab ca. 200 Aminosäuren

sind Repeats erkennbar.

44

Abbildung 23: Sequenz (N-terminal) des MaSp2 von L. hesperus im Programm Dotlet.

Die komplette Sequenz von MaSp2 wurde gegen sich selbst paarweise aligniert, um identische Bereiche in der

Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats. Die eingestellten Parameter

(Fenstergröße 15; Gray Scale 100%-12%) sind mit denen in Abbildung 22 identisch, um einen einheitlichen Vergleich

zu ermöglichen. Im oberen Teil der Abbildung (grün gekennzeichnet) befinden sich der Eingabebutton sowie die

Auswahlfenster, um verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich

der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor durch den Benutzer

innerhalb des Sequenzalignments gesteuert werden. Die Markierung mittels Cursor ist durch den Schnittpunkt der

beiden blauen Geraden gekennzeichnet. Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert

wurden. Je nachdem, welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der

Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots. Unterhalb des Dotplots

ist erkennbar, dass beide Eingabesequenzen an dieser Position identisch sind (da es sich um ein und dieselbe

Sequenz handelt). Ebenfalls gut erkennbar ist die Diagonale durch die Matrix, ein zweiter Nachweis für die Identität

der Eingabesequenzen. Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)

konfiguriert werden. Weiße Stellen im Dotplot kennzeichnen nicht-identische Bereiche. Repeats sind im Dotplot mit

schwarzen Linien gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto häufiger

und desto größer sind die Repeats. Zu Beginn der Sequenz existieren keine Repeats. Erst ab ca. 200 Aminosäuren

sind Repeats erkennbar.

45

Abbildung 24: Sequenz (Mittelteil) des MaSp1 von L. hesperus im Programm Dotlet.

Die Sequenz besteht aus immer wiederkehrenden Mustern. Erstaunlich ist, dass die Kernsequenz des

Seidenproteins MaSp1 enorm viele Repeats enthält. Außerdem sind die Repeats ineinander geschachtelt, das

bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats. Deutlich zu sehen sind die repetitiven Muster.

Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-identischen Bereichen umgeben

sind, entstehen quadratähnliche Formen im Dotplot. Der Dotplot zeigt regelmäßige Quadrate innerhalb der

Sequenz. Außerdem ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren

Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot gescrollt wird.

Abbildung 25: Sequenz (Mittelteil) des MaSp2 von L. hesperus im Programm Dotlet.

Die Sequenz besteht aus immer wiederkehrenden Mustern. Erstaunlich ist, dass die Kernsequenz des

Seidenproteins MaSp1 enorm viele Repeats enthält. Außerdem sind die Repeats ineinander geschachtelt, das

bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats. Deutlich zu sehen sind die repetitiven Muster.

Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-identischen Bereichen umgeben

sind, entstehen quadratähnliche Formen im Dotplot. Der Dotplot zeigt regelmäßige Quadrate innerhalb der

Sequenz. Außerdem ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren

Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot gescrollt wird.

46

Mit Hilfe des Cursors im Dotplot und der darunterliegenden Markierung des

Sequenzabschnittes wurden einige Repeats in der Sequenz identifiziert und gekennzeichnet.

Beide Sequenzen enthalten zu viele Repeats, welche nicht alle identifiziert werden konnten

(siehe Abbildungen 22-25).

Anschließend konnten die einzelnen Repeats von MaSp1 und MaSp2 in das Programm 3D-

PSSM eingefügt werden. Die vollständigen Ergebnisse von 3D-PSSM sind lokal gespeichert und

mit Hilfe eines Computers abrufbar. In den Ergebnissen von 3D-PSSM befinden sich ebenfalls

die einzelnen Eingabesequenzen, welche die im Dotplot ausgewählten Repeats darstellen. Im

Anhang ist in Abbildung 30 ein Screenshot des Ergebnisses von 3D-PSSM aufgeführt.

Nachfolgend werden die Ergebnisse grob zusammengefasst. Die Sequenzen beider spidroins

ähneln sich ziemlich, unterscheiden sich aber auch in gewissen Dingen. (siehe Kapitel 2.4) Aus

diesem Grund werden einige ähnliche Ergebnisse, sowie einige unterschiedliche Ergebnisse der

Strukturhomologie ausgegeben. Bis zu einer Übereinstimmung von 50 Prozent wird die

Strukturähnlichkeit der Repeats von MaSp1 mit jeweiligen Treffern vorhergesagt. Die

Übereinstimmung der Strukturähnlichkeit der Repeats von MaSp2 beträgt sogar bis zu 58

Prozent. Im Wesentlichen wurden für die Repeats von MaSp1 drei homologe Strukturen

ausgegeben. Die Repeats von MaSp1 stimmen zu 50 Prozent mit der Sequenz von „major prion

protein“ (PDB-ID: 1oei), zu 39-43 Prozent mit der Sequenz von Collagen (PDB-ID: 1bkv) und zu

38 Prozent mit der Sequenz des Models von einer „Collagen-Mikrofibrille“ (PDB-ID: 2clg)

überein. Die Repeats von MaSp2 stimmen zu 38-58 Prozent mit dem Model einer „Collagen-

Mikrofibrille“ (PDB-ID: 2clg; 4clg) überein. Außerdem stimmt ein Repeat zu 61 Prozent mit der

Sequenz von Collagen (PDB-ID: 1bkv) überein. Ein Unterschied zu MaSp1 ist die

Übereinstimmung (34-41 %) der Struktur der Repeats von MaSp2 mit der „Collagen Triple

Helix“ (PDB-ID: 1k6f). Collagen (verschiedene PDB-ID’s) ist bei beiden spidroins der häufigste

ausgegebene Treffer. [19]

Mittels Rasmol 2.6 wurden die Strukturen der Proteine (PDB-ID’s: 1bkv, 2clg, 4clg, 1k6f)

betrachtet. Der Treffer des „major prion proteins“ wurde vernachlässigt. In Abbildung 26 sind

die mittels Rasmol betrachteten Strukturen dargestellt. Darin ist die Ähnlichkeit der 4

Strukturen von Collagen deutlich zu erkennen. Die „Collagen-Mikrofibrille“ (PDB-ID: 4clg)

besteht aus mehreren Proteinketten, welche sich parallel zueinander anordnen. Die anderen

Strukturen von Collagen bestehen aus weniger Proteinketten (drei) als die größere Collagen-

Mikrofibrille. Wahrscheinlich ordnen sich die einzelnen Proteinketten so an, dass eine größere

fibrillenartige Struktur entsteht, welche dem Modell der PDB-ID „4clg“ ähnelt.

47

Da die Sequenzen der Repeats der Spinnenseidenproteine den Sequenzen von Collagen

ähneln, (zusammengefasst 34-58 Prozent), ähneln sich vermutlich auch ihre Strukturen. Die

Besonderheit an Collagen ist der enorm hohe Anteil an Glycin. Eine weitere, im Collagen häufig

vorkommende Aminosäure ist Prolin. Mehr Informationen zu den Besonderheiten der Struktur

von Collagen im Buch Grundstudium Biologie 1. Aufl. - Heidelberg u.a.: Spektrum

Akademischer Verlag GmbH, 2000 [23, S. „5-15“].

Abbildung 26: Betrachtung von Proteinstrukturen mittels Rasmol 2.6.

Mittels Rasmol 2.6 wurden die Strukturen der Proteine, deren Primärstrukturen den Sequenzen der Repeats von

MaSp1/MaSp2 ähneln, betrachtet. Die Ähnlichkeit der Sequenzen wurde mittels 3D-PSSM herausgefunden.

Abbildung 26 zeigt vier 3D-Strukturen von Collagen (PDB-ID’s: 1bkv, 2clg, 4clg, 1k6f). Oben links im Bild ist die

Längsstruktur von Collagen der PDB-ID 1bkv, Mitte links die Längsstruktur von Collagen der PDB-ID 1k6f, oben

rechts die Längsstruktur von dem Modell „Collagen-Mikrofibrille“ der PDB-ID 4clg, Mitte rechts die Längsstruktur

von dem Modell „Collagen-Mikrofibrille“ der PDB-ID 2clg und unten die Querstruktur von dem Modell „Collagen-

Mikrofibrille“ der PDB-ID 4clg dargestellt. Die Ähnlichkeit der 4 Strukturen von Collagen ist deutlich zu erkennen.

Die „Collagen-Mikrofibrille“ (PDB-ID: 4clg) besteht aus mehreren Proteinketten, welche sich parallel zueinander

anordnen (oben rechts und unten). Die anderen Strukturen von Collagen bestehen aus weniger Proteinketten als

die größere Collagen-Mikrofibrille. Wahrscheinlich können sich die einzelnen Proteinketten so anordnen, dass eine

größere fibrillenartige Struktur entsteht, welche dem Modell der PDB-ID „4clg“ ähnelt.

48

Ein weiteres angewandtes Tool ist das Tool „Prediction of TransMembrane Beta-Barrel

Proteins (PRED TMBB)“. Als Input wurden die kompletten Sequenzen von MaSp1 sowie MaSp2

eingefügt. Das Tool berechnete auf Grundlage dreier verschiedener Algorithmen (Viterbi, N-

best, Posterior decoding) die Topologie von Transmembransträngen und β-Barrels in den

Eingabeproteinen. Weitere Informationen in der wissenschaftlichen Ausarbeitung [4]. Die

ermittelten Daten können in einer Grafik dargestellt werden, siehe Abbildung 27 und 28. In

Abbildung 27 ist das Ergebnis der Vorhersage der Topologie von MaSp1 mittels Viterbi-

Algorithmus erkennbar, in Abbildung 28 das Ergebnis der Vorhersage der Topologie von MaSp2

mittels Viterbi-Algorithmus. In beiden Abbildungen wird deutlich, dass sich der Großteil der

Proteine im Inneren befindet. Ein kleiner Teil befindet sich außerhalb (im umgebenden

Medium) der Doppellipidschicht. Zu erwähnen ist, dass sich MaSp1 sowie MaSp2 eigentlich

nicht in einer Doppellipidschicht befinden. Das Tool PRED TMBB wurde genutzt, um das

Strukturverhalten der Seidenproteine in Lösung zu ermitteln. Wie bereits erwähnt, können sich

die Eiweißketten von MaSp1 bzw. MaSp2 so anordnen, dass eine mizellenartige Struktur

entsteht. Entsprechend der Ergebnisse aus PRED TMBB befindet sich der Großteil der

Seidenproteine im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung,

ragt. Ein Teil der N-terminalen Domäne befindet sich im Inneren nahe der Doppellipidschicht.

Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der

Doppellipidschicht. Der Großteil sowie die C-terminale Domäne der „major ampullate

spidroins“ befinden sich innerhalb der Doppellipidschicht bzw. der mizellenartigen Struktur.

Mittels PRED TMBB wurde nachgewiesen, dass sich die N-terminalen Domänen nach außen

anordnen bzw. die äußere Wand der mizellenartigen Strukturen der Seidenproteine, während

der Speicherung innerhalb der Spinndrüsen, bilden.

49

Abbildung 27: Vorhersage der Topologie von MaSp1 mittels Viterbi-Algorithmus des PRED TMBB.

Das Ergebnis zeigt das Strukturverhalten von MaSp1 in einer Doppellipidschicht. Farblich gekennzeichnet ist das

hydrophobe Potential jeweiliger Aminosäuren (gelb=hydrophob, blau=hydrophil). Ein kleiner Teil (Aminosäure 13-

30) befindet sich außerhalb (im umgebenden Medium) der Doppellipidschicht. Eigentlich befindet sich MaSp1 nicht

in einer Doppellipidschicht. Das Tool PRED TMBB wurde genutzt, um das Strukturverhalten des Seidenproteins in

Lösung zu ermitteln. Wie bereits erwähnt, können sich die Eiweißketten von MaSp1 so anordnen, dass eine

mizellenartige Struktur entsteht. Die in PRED TMBB verwendete Doppellipidschicht entspricht der „Membran“ der

mizellartigen Struktur. Entsprechend des Ergebnisses aus PRED TMBB befindet sich der Großteil des Seidenproteins

im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung, ragt. Die N-terminale Domäne von

MaSp1 erstreckt sich von Aminosäure 1-202. Ein Teil der N-terminale Domäne befindet sich im Inneren nahe der

Doppellipidschicht. Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der

Doppellipidschicht. Der Großteil sowie die C-terminale Domäne des MaSp1 befinden sich innerhalb der

Doppellipidschicht bzw. der mizellenartigen Struktur, was jedoch nicht in der Grafik des Ergebnisses aus PRED TMBB

dargestellt ist. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und mit Hilfe eines

Computers abrufbar.

50

Abbildung 28: Vorhersage der Topologie von MaSp2 mittels Viterbi-Algorithmus des PRED TMBB.

Das Ergebnis zeigt das Strukturverhalten von MaSp2 in einer Doppellipidschicht. Farblich gekennzeichnet ist das

hydrophobe Potential jeweiliger Aminosäuren (gelb=hydrophob, blau=hydrophil). Ein kleiner Teil (Aminosäure 16-

39) befindet sich außerhalb (im umgebenden Medium) der Doppellipidschicht. Eigentlich befindet sich MaSp2 nicht

in einer Doppellipidschicht. Das Tool PRED TMBB wurde genutzt, um das Strukturverhalten des Seidenproteins in

Lösung zu ermitteln. Wie bereits erwähnt, können sich die Eiweißketten von MaSp2 so anordnen, dass eine

mizellenartige Struktur entsteht. Die in PRED TMBB verwendete Doppellipidschicht entspricht der „Membran“ der

mizellartigen Struktur. Entsprechend des Ergebnisses aus PRED TMBB befindet sich der Großteil des Seidenproteins

im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung, ragt. Die N-terminale Domäne von

MaSp2 erstreckt sich von Aminosäure 1-217. Ein Teil der N-terminale Domäne befindet sich im Inneren nahe der

Doppellipidschicht. Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der

Doppellipidschicht. Der Großteil sowie die C-terminale Domäne des MaSp2 befinden sich innerhalb der

Doppellipidschicht bzw. der mizellenartigen Struktur, was jedoch nicht in der Grafik des Ergebnisses aus PRED TMBB

dargestellt ist. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und mit Hilfe eines

Computers abrufbar.

51

5 Zusammenfassung und Auswertung

5.1 Methoden

In Abbildung 29 ist ein Schema der durchgeführten Methoden dargestellt. Nachfolgend sind

die Ergebnisse, sowie die Interpretation derselben zusammenfassend aufgeführt.

Abbildung 29: Workflow der durchgeführten Methoden.

Hier sind die durchgeführten Methoden grob zusammengefasst. Entsprechend des Arbeitsplans wurden die

Aufgaben in 3 einzelne Methodenkomplexe unterteilt. Im Schema aufgeführt sind lediglich die Inhalte, welche

bearbeitet wurden sowie die erhaltenen Ergebnisse (kurz). Nicht enthalten sind die Auswertung und die

Interpretation der Ergebnisse. Der vollständige Inhalt ist den einzelnen Methodenkomplexen aufgeführt, während

die Interpretation und Bewertung der Ergebnisse im Kapitel Zusammenfassung und Auswertung zu finden ist.

Mittels PROPKA 2.0 wurde nachgewiesen, dass die Stabilität der N-terminalen Domäne bei

einem neutralen pH-Wert von 7, welcher während der Speicherung des Seidenproteins

innerhalb der Drüse vorliegt, geringer ist als bei einem sauren pH-Wert (siehe Abbildung 15).

52

Ein saurer pH-Wert (ca. 6) liegt während der Umstrukturierung der Seidenproteine innerhalb

des Spinnkanals vor. (siehe Kapitel 2.3). Das bedeutet, dass die N-terminale Domäne durch

einen sauren pH-Wert stabilisiert wird. Dies würde auch mit den Informationen aus [2]

übereinstimmen. Kontrovers sind die Ergebnisse, die die Untersuchung der C-terminalen

Domäne (Fibroins 3 von Araneus diadematus) mittels PROPKA, lieferte. Es stellte sich heraus,

dass die Stabilität der C-terminalen Domäne von ADF-3 bei einem neutralen pH-Wert größer

ist als die Stabilität bei einem sauren pH-Wert. Die Stabilität der C-terminalen Domäne von

ADF-3 verhält sich demnach genau umgekehrt wie die Stabilität der N-terminalen Domäne von

MaSp1 von E. australis in Abhängigkeit vom pH-Wert. Die Art der Stabilität beider terminaler

Domänen variiert ebenfalls. Die N-terminale Domäne des MaSp1 von E. australis weist

überwiegend negative Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4 positive

Werte auf. Dagegen besitzt die C-terminale Domäne von ADF-3 durchgängig positive Werte

der Stabilität. Bisher gingen Forschungsgruppen stets davon aus, dass sowohl die N-terminale

Domäne als auch die C-terminale Domäne nach der Proteinsynthese schnell eine stabile Form

annehmen. Die mittels PROPKA gewonnenen Daten sind daher nur unter Vorbehalt zu

verwenden.

Die Recherche nach Informationen über Proteine, von denen bekannt ist, dass sie bei zwei

unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden, blieb erfolglos.

Demnach konnten auch keine Abbildungen generiert werden, welche die Sekundär- bzw.

Tertiärstrukturen der jeweiligen fertig gefalteten Proteine in Abhängigkeit vom pH-Wert

darstellen. Während der Recherchen über Informationen von 3D-Strukturen der

Spinnenseidenproteine konnte eine komplette Sequenz der Proteine MaSp1 sowie MaSp2 von

Latrodectus hesperus in der Universal Protein Resource (UniProt) gefunden werden, welche für

nachfolgende Arbeiten verwendet wurde.

Die Sekundärstruktur der Proteine MaSp1 und MaSp2 von L. hesperus wurde mit Hilfe der

Tools GOR und Chou-Fasman vorhergesagt. Beide Tools sagten eine Helix-Struktur-Bildung der

Poly-Alanin-Muster vorher (siehe Abbildung 16). Diese Daten sind als „falsch“ bzw. als nicht

aussagekräftig zu werten. Kernmagnetresonanzexperimente, sowie Röntgenbeugungsanalyse,

welche am Abseilfaden von Nephila clavipes durchgeführt worden waren, belegen die Bildung

von β-Faltblättern der Poly-Alanin-Muster. [47, S. 545; 13, S. 82] Da die bioinformatischen

Vorhersagetools GOR und Chou-Fasman keine aussagekräftigen Ergebnisse über die

Sequenzen beider „major ampullate spidroins“ von Latrodectus hesperus lieferten, sollten

andere Vorhersagetools angewandt werden.

53

Es galt, mittels SWISS-MODEL Homologiemodelle aus der kompletten Spidroinsequenz von

Latrodectus hesperus zu erstellen. Hauptsächlich sollten nur die repetitiven Kernsequenzen

beider Spidroins benutzt werden, da diese Bereiche β-Faltblätter bilden. Unter Zuhilfenahme

des Tools LALIGN sollten die einzelnen terminalen Domänen, sowie der repetitive Mittelteil

innerhalb der gesamten Sequenz des MaSp1 bzw. MaSp2 von L. hesperus identifiziert werden.

Die Grundidee der Benutzung von LALIGN erwies sich als nicht umsetzbar, da von den anderen

Spinnenseidenproteinen nur einzelne Fragmente in den Datenbanken existierten. Die

jeweiligen terminalen Domänen konnten aus den existierenden Fragmenten nicht vollständig

herausgefiltert werden. Mit anderen Worten, es konnte nicht zugeordnet werden, ob

vorliegende Sequenzfragmente eine komplette terminale Domäne charakterisierten. Anhand

der Veröffentlichung zu den UniProt-Einträgen beider „major ampullate spidroins“ von L.

hesperus konnten die N-terminalen Domänen, die C-terminalen Domänen, sowie die

repetitiven Kernsequenzen beider Sequenzen identifiziert werden. Anschließend wurde der

repetitive Mittelteil in das Tool SWISS-MODEL Template Identification eingefügt, um ein

Template zu finden. Die Suche nach einem Template blieb erfolglos. Es existierten keine

homologen Daten zu der repetitiven Kernsequenz des MaSp1 bzw. MaSp2 von L. hesperus,

weder ähnliche Sequenzen noch ähnliche Strukturen. Ohne das Template konnte somit kein

Strukturmodell erzeugt werden. Ein Modell des repetitiven Mittelteils des MaSp1 von L.

hesperus konnte daher mittels SWISS-MODEL nicht erstellt werden. Der Automated Mode von

SWISS-MODEL lieferte ebenfalls kein Ergebnis.

Lediglich mit Hilfe des Tools „Secondary Structure Prediction and Domain Assignment” von

SWISS-MODEL konnten die terminalen Domänen beider „major ampullate spidroins“

identifiziert werden (siehe Abbildung 18 und 19). Die Vorhersage der Helixstrukturen am

Anfang und Ende beider spidroin-Sequenzen stimmt mit den Ergebnissen aus den

Röntgenanalysen-Experimenten der Forschungsgruppen überein. [2, S. 237; 23, S. 239-240]

Diese Bereiche kennzeichnen die terminalen Domänen des Seidenproteins. Der repetitive

Mittelteil der Sequenz bildet laut diesem Tool Coil-Strukturen aus, da noch keine genaueren

Informationen zu diesen Sekundärstrukturen existieren. Das Ergebnis der „Secondary Structure

Prediction and Domain Assignment” stellt somit eine gute Zusammenfassung der bisherigen

Informationen über die Strukturen der Seidenproteine MaSp1 und MaSp2 dar. Die

experimentell gewonnenen Informationen über die Strukturen der terminalen Domänen

wurden so bioinformatisch nachgewiesen. Mit Hilfe des Tools SMART konnten die terminalen

Domänen innerhalb der „major ampullate spidroins“ von L. hesperus nicht identifiziert werden

(siehe Abbildung 20).

54

Außerdem wurde die CDD-Suche des MaSp1, sowie des MaSp2 von L. hesperus durchgeführt,

um ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden. Es wurde eine

Übereinstimmung mit dem Pfam-Eintrag 11260 gefunden. Aus diesen Daten geht die in

vorherigen Kapiteln erwähnte Konservierung der C-terminalen Regionen hervor und wird

somit bioinformatisch bestätigt. (Abbildung 21) [46].

Wissenschaftliche Experimente und zugehörige Veröffentlichungen besagen, dass sowohl die

C-terminale als auch die N-terminale Domäne einen hohen Anteil an α-Helices, sowie eine

hohe thermische Stabilität besitzen. [11, S. 310; 23, S. 239-240] Beide terminale Domänen

weisen hydrophobere Eigenschaften als der repetitive Mittelteil auf. [10, S. 239; 19, S. 3] Die

hydrophobste Stelle in MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne,

wie in Abbildung 17 erkennbar ist. [3, S. 6; 48]

Außerdem wurde das Tool 3D-PSSM benutzt, um homologe Strukturen bzw. Sequenzen zu

finden. Um die einzelnen Repeats innerhalb der Sequenzen beider spidroins zu identifizieren

(und diese anschließend in das Programm 3D-PSSM einzufügen), wurde die Analysemethode

Dotplot angewandt (siehe Abbildung 22-25). Nachfolgend werden die Ergebnisse von 3D-PSSM

grob zusammengefasst. (Abbildung 30 im Anhang zeigt ein Screenshot des Ergebnisses von 3D-

PSSM). Collagen (verschiedene PDB-ID’s) ist bei beiden spidroins der häufigste ausgegebene

Treffer. [19] Mittels Rasmol 2.6 wurden die Strukturen der 4 Proteine (PDB-ID’s: 1bkv, 2clg,

4clg, 1k6f) betrachtet und eine hohe Ähnlichkeit der 4 Proteinstrukturen festgestellt

(Abbildung 26). Wahrscheinlich ordnen sich die einzelnen Proteinketten so an, dass eine

größere fibrillenartige Struktur entsteht (PDB-ID: 4clg). Da die Sequenzen der Repeats der

Spinnenseidenproteine den Sequenzen von Collagen ähneln, ähneln sich vermutlich auch ihre

Strukturen. Die Besonderheit an Collagen ist der enorm hohe Anteil an Glycin. Eine weitere, im

Collagen häufig vorkommende Aminosäure ist Prolin. (Mehr Informationen zu den

Besonderheiten der Struktur von Collagen im Buch Grundstudium Biologie 1. Aufl. - Heidelberg

u.a.: Spektrum Akademischer Verlag GmbH, 2000 [23, S. „5-15“]). Im Kapitel 5.2 wird näher

auf die Strukturbildung der Spinnenseidenproteine eingegangen.

5.2 Strukturbildung der Spinnenseidenproteine

Während der Speicherung der Seidenproteine innerhalb der Spinndrüse, bei einem pH-Wert

von 7, sorgt Natriumchlorid für eine Stabilisierung der Monomerstruktur der N-terminalen

Domäne. Gleichzeitig wird die Dimerisierung unterbunden. [10, S. 239; 47, S. 311-312] So ist es

möglich, dass selbst bei einer sehr hohen Proteinkonzentration die Seidenproteine innerhalb

55

der Drüse keine Faserstruktur einnehmen. [10, S. 239] Doch wieso verklumpen bzw.

kristallisieren die Proteine in solch einer hohen Konzentration (bis zu 50 % w/v) nicht?

Mit Hilfe der gesammelten Daten aus den praktischen Experimenten und den

bioinformatischen Versuchen wurden zwei Theorien der Faserassemblierung aufgestellt. Eine

Theorie ist die Flüssigkristalltheorie, die andere Theorie wird als Mizellentheorie bezeichnet.

Verschiedene Forschungsgruppen postulierten diese Theorien anhand von praktischer

Experimente (siehe Methodenkomplex 3) [18, S. 1058; 21, S. 8908; 8, S 3644].

Laut der Flüssigkristalltheorie nehmen die neusynthetisierten Seidenproteine zunächst eine

flüssigkristalline Phase innerhalb der Spinnlösung an. In dieser Phase ordnen sich die Proteine

so an, dass die Längsachsen der Moleküle parallel zueinander und senkrecht zum Epithel

angeordnet sind. Beim Fluss durch die Drüse ordnen sich die Proteinketten immer enger

nebeneinander und bilden scheibenartige Komplexe. Die im Spinnkanal auftretende

Dehnströmung sorgt für die Verlängerung der scheibenartigen Komplexe. In diesem Schritt

bilden sich aus den Coil-Strukturen des repetitiven Mittelteil β-Faltblattstrukturen. Die

Strukturänderung wird durch die Absenkung des pH-Werts begünstigt. Der anschließende

Wasserentzug sorgt für die endgültige Bildung der Faserstrukturen. [8, S. 3644]

Die andere Theorie ist die Theorie der Mizellenbildung. Bei dieser Theorie wird davon

ausgegangen, dass die terminalen Domänen der neusynthetisierten Seidenproteine sehr

schnell eine stabile Form bilden. Beide terminale Domänen spielen eine große Rolle für die

korrekte Assemblierung der Seidenfaser (siehe Methodenkomplex 2). [3, S. 9-10; 23, S. 241;

22, S. 236; 23, S. 240-241; 47, S. 312] Aufgrund der hohen Konzentration in der Spinnlösung

würden die stabilen Strukturen sehr schnell miteinander wechselwirken, was zu einer

Verklumpung bzw. Kristallisation der Proteine führen würde. Damit dies nicht geschieht,

müssen die Moleküle eine zur Lösung hin stabile, sowie energetisch günstige Struktur

annehmen. Aus diesem Grund nehmen die Seidenproteine in Lösung eine mizellenartige

Struktur an, bei der die terminalen Domänen eine stabile Oberfläche bilden. Da die Lösung

nicht nur die Seidenproteine und Wasser, sondern auch Natriumchlorid enthält, handelt es

sich um keine hydrophile Lösung im eigentlichen Sinne. Natriumchlorid spielt eine

entscheidende Rolle, indem es die die Wechselwirkungen der Mizellen untereinander

unterbindet (siehe Methodenkomplex 2) und sich sozusagen zwischen die mizellenartigen

Strukturen drängt. [30] Aufgrund dieser Tatsache können sich die hydrophoben terminalen

Domänen der Seidenproteine an der Oberfläche der mizellenartigen Strukturen befinden,

56

während sich die hydrophileren repetitiven Kernsequenzen im Inneren der Mizellen befinden.

Dabei nehmen die repetitiven Bereiche keine bestimmte Struktur ein, sondern besitzen eine

zufällige Coil-Struktur. Die Bildung dieser Mizellen wäre in reinem Wasser aus energetischen

Gründen nicht möglich. [30]

Beide Theorien scheinen auf den ersten Blick sehr gegensätzlich zu sein, jedoch schließt die

Mizellentheorie die Flüssigkristalltheorie nicht aus. [8, S. 3646] Vielleicht zeigen die

Seidenproteine der Spinne sowohl ein flüssigkristallines als auch ein mizellenartiges Verhalten.

Die mizellenartigen Strukturen werden im Spinnkanal durch eine erhöhte Dehnströmung und

auftretender Scherkräfte umstrukturiert. Die Mizellen lagern sich zu größeren

Makrostrukturen zusammen. Der Austausch von Natriumchlorid gegen Kaliumphosphat, die

pH-Wert-Abnahme von 7,0 auf 6,2 und der Wasserentzug ermöglichen diese Anhäufung, sowie

diese Umstrukturierung. [8, S. 3645; 14, S. 999] Außerdem werden die mizellenartigen

Strukturen „geöffnet“ und es kommt zur Bildung von β-Faltblattstrukturen der repetitiven

Kernsequenzen. Aufgrund der Dimerisierung je zweier N-terminaler Domänen entsteht ein aus

zwei Seidenproteinen bestehendes Molekül. Außerdem können je zwei C-terminale Domänen

mittels Disulfidbindung verknüpft werden. Durch die Dimerisierung, sowie die verknüpfende

Wirkung der Disulfidbindungen entstehen sehr lange Eiweißketten, wodurch die typische

Faserform resultiert. Letztendlich tritt die flüssige Faser durch die Spinnenwarze aus. Mit den

Gliedmaßen zieht die Spinne die Faser heraus, welche sich durch diesen Zugmechanismus

endgültig verfestigt.

Ob die repetitiven Kernsequenzen während der Umstrukturierung im Spinnkanal tatsächlich β-

Faltblattstrukturen bilden, ist zweifelhaft. Ergebnisse des 3D-PSSM zeigten, dass Collagen den

Repeats der Spinnenseidenproteine sehr ähnlich ist. Collagen besteht aus mehreren Helices,

die sich ineinander winden. Drei Helices ineinander gewickelt werden als Tripelhelix

bezeichnet. Aufgrund der hohen Sequenzähnlichkeit ist es möglich, dass die Repeats der

Spinnenseidenproteine anstelle der β-Faltblattstrukturen Tripelhelices bilden. Dies wird durch

die Ergebnisse von 3D-PSSM verlautet. Doch auch dieses Ergebnis ist wie alle

Strukturvorhersagetools nur unter Vorbehalt zu verwenden. Die komplizierten Strukturen

lassen sich oftmals nicht mittels bioinformatischer Software vorhersagen, eben weil die Natur

nicht ausnahmslos allen Gesetzen oder Regelmäßigkeiten folgt. Hierbei wird die

anspruchsvolle Aufgabe der Bioinformatik sichtbar. Das Ziel der Bioinformatik ist unter

anderem die Vorhersage der Faltung von Proteinen. Proteine wie die Spinnenseidenproteine

57

und Collagen zeigen, dass die Simulation der Proteinfaltung nicht immer möglich ist. Nichts in

der Sequenz dieser Proteine deutet zunächst auf deren endgültige Struktur hin. Erst durch

verschiedene biologische, chemische und physikalische Faktoren entstehen die tatsächlichen

Strukturen.

58

6 Ausblick

Das Geheimnis des Spinnenfadens konnte in dieser Bachelorarbeit nicht gelöst werden.

Bekanntes Wissen aus praktischen Experimenten wurde mit Daten aus bioinformatischen

Programmen verglichen. Die bioinformatischen Untersuchungen am Spinnenfaden zeigten,

dass die Strukturvorhersage auf Basis der Sequenzinformation nicht immer möglich ist. Die

Strukturbildung der Spinnenseidenproteine konnte nicht simuliert oder modelliert werden. Die

Bioinformatik kommt bei solch komplizierten Strukturbildungen der spidroins oder der von

Collagen an ihre Grenzen. Hier wird deutlich, in welchen Bereichen die Bioinformatik noch

weiterzuentwickeln ist. Daher müssen bei Strukturvorhersagen die biologischen, chemischen

und physikalischen Bedingungen beachtet werden. Dies würde einen enormen

Rechenaufwand seitens der Informatik erfordern.

Um das Geheimnis des Spinnenfadens zu lüften, werden genauere Informationen über die

repetitiven Kernsequenzen der spidroins benötigt. Diese Informationen sind derzeit mit

bioinformatischen Programmen nicht zu beschaffen. Aus diesem Grund würde die Analyse der

Kernsequenzen der Spinnenseidenproteine weitere praktische Experimente erfordern.

Vielleicht bleibt das Geheimnis des Spinnenfadens dem Menschen noch eine lange Zeit

verborgen. Vielleicht lassen sich nicht ausnahmslos alle Aspekte der Natur nachbilden.

Nichtsdestotrotz ist der Spinnenfaden als biologisches Objekt äußerst interessant und

demnach ein sehr begehrtes Forschungsobjekt.

59

7 Danksagung

Besonderer Dank gilt meinem Betreuer Prof. Dr. rer. nat. Dirk Labudde, der mir überhaupt erst

die Bearbeitung dieses Themas in der Zeit des Praxismoduls und der Bachelorarbeit ermöglicht

hat. Dieses Thema interessierte mich bereits vor dem Studium. Deshalb danke ich Professor

Labudde, welcher mein Interesse gefördert hat. Während den Arbeiten gab es Zeiten, in denen

ich sprichwörtlich den Wald vor lauter Bäume nicht gesehen habe. Ohne Herrn Labudde wäre

ich vermutlich ewig in diesem Wald des inhaltlichen Durcheinanders herum geirrt.

Herzlicher Dank gilt auch allen „sonstigen“ Helfern, die mir während der Arbeit entweder Mut

zugesprochen oder mir den nötigen Ansporn gegeben haben. Außerdem möchte ich mich bei

allen bedanken, die diese Arbeit zur Korrektur gelesen haben. An dieser Stelle möchte ich

Michael Thiele namentlich erwähnen.

Außerdem möchte ich mich bei Alex Demba bedanken, welcher mich bei den physikalischen

Grundlagen des Spinnenfadens inhaltlich unterstützt hat.

Weiterer Dank gilt allen Freunden in meinem Umfeld, die mich während der Zeit der

Bachelorarbeit moralisch unterstützten. Ohne sie hätte ich wahrscheinlich früher oder später

das Handtuch geworfen.

60

8 Quellen

[1] Arnold, Konstantin; Bordoli, Lorenza; Kopp, Jürgen; Schwede, Torsten: The SWISS-

MODEL workspace: a web-based environment for protein structure homology

modeling. In: Bioinformatics - Oxford: Oxford University Press. - (2006) vol. 22, no. 2, S.

195-201

[2] Askarieh, Glareh; Hedhammar, My; Nordling, Kerstin; Saenz, Alejandra; Casals, Cristina;

Rising, Anna; Johansson, Jan; Knight, Stefan D.: Self-assembly of spider silk proteins is

controlled by a pH-sensitive relay. In: Nature - London: Macmillan Magazines Limited. -

(2010)465, S. 236-238

[3] Ayoub, Nadia A.; Garb, Jessica E.; Tinghitella, Robin M.; Collin, Matthew A.; Hayashi

Cheryl Y.: Blueprint for a high-performance biomaterial: full-length spider dragline silk

genes. In: PLoS ONE. - Riverside, California: PLoS ONE - 2(2007)6:e514, S. 1-13

[4] Bagos, Pantelis G.; Liakopoulos, Theodore D.; Spyropoulos, Ioannis C.; Hamodrakas,

Stavros J.: PRED-TMBB: a web server for predicting the topology of β-barrel outer

membrane proteins. In: Nucleic Acids Research - Oxford: Oxford University Press. -

(2004) vol. 32, Web Server issue, S. W400-404

[5] Bellmann, Heiko: Kosmos Atlas Spinnentiere Europas. - 3. Aufl. - Stuttgart: Franckh-

Kosmos Verlags-GmbH & Co. KG, 2006

[6] Berg, Jeremy M.; Tymoczko, John L.; Stryer, Lubert: Biochemie. - 6. Aufl. - Heidelberg,

u.a.: Elsevier GmbH, Spektrum Akademischer Verlag, 2007

[7] Dalton, Stephen: Spinnen: Die erfolgreichen Jäger. - 1. Aufl. - Bern: Haupt Verlag,

2009

[8] Eisoldt, Lukas; Smith, Andrew; Scheibel, Thomas: Decoding the secrets of spider silk. In:

Materials Today. - Oxford: Elsevier Ltd. - (2011) Volume 14, Issue 3, S. 80-86

[9] Finn, Robert D.; Mistry, Jaina; Tate, John; Coggill, Penny; Heger, Andreas; Pollington,

Joanne E.; Gavin, O. Luke; Gunasekaran, Prasad; Ceric, Goran; Forslund, Kristoffer;

Holm, Liisa; Sonnhammer, Erik L. L.; Eddy, Sean R.; Bateman, Alex: The Pfam protein

families database. In: Nucleic Acids Research - Oxford: Oxford University Press. - (2010)

vol. 38, Database issue, S. D211-222

[10] Hagn, Franz; Eisoldt, Lukas; Hardy, John G.; Vendrely, Charlotte; Coles, Murray;

Scheibel, Thomas; Kessler, Horst: A conserved spider silk domain acts as a molecular

switch that controls fibre assembly. In: Nature - London: Macmillan Magazines Limited.

- (2010)465, S. 239-242

61

[11] Hagn, Franz; Thamm, Christopher; Scheibel, Thomas; Kessler, Horst: pH-Dependent

Dimerization and Salt-Dependent Stabilization of the N-terminal Domain of Spider

Dragline Silk – Implications for Fiber Formation. In: Angew. Chem. Int. Ed. - Weinheim:

Wiley VCH Verlag GmbH & Co KGaA. - (2011)50, S.310-313

[12] Hänsel, Horst; Neumann, Werner: Physik: Mechanik und Wärmelehre. - 1. Aufl. -

Heidelberg u.a.: Spektrum Akademischer Verlag GmbH, 1993

[13] Heim, Markus; Keerl, David; Scheibel, Thomas: Spinnenseide: vom löslichen Protein

zur außergewöhnlichen Faser. In: Angew. Chem. - Weinheim: Wiley VCH Verlag

GmbH & Co KGaA. - (2009)121, S. 3638-3650

[14] Heim, Markus; Römer, Lin; Scheibel, Thomas: Hierarchical structures made of proteins.

The complex architecture of spider webs and their constituent silk proteins. In: Chem.

Soc. Rev. - London: The Royal Society of Chemistry. - (2009)39, S. 156-164

[15a] Garnier J.; Osguthorpe, D. J.; Robson, B.: Analysis of the accuracy and implications of

simple methods for predicting the secondary structure of globular proteins. In: Journal

of Molecular Biology - Amsterdam: Elsevier Ltd. - (1978) vol. 120, issue 1, S. 97-120

[15b] Gibrat, J. F.; Garnier, J.; Robson, B.: Further developments of protein secondary

structure prediction using information theory: New parameters and consideration of

residue pairs. In: Journal of Molecular Biology - Amsterdam: Elsevier Ltd. - (1987) vol.

198, issue 3, S. 425-443

[15c] Garnier, J.; Gibrat, J. F.; Robson, B.: GOR secondary structure prediction method

version IV. In: R.F. Doolittle Ed. - Methods in Enzymology. - (1996) vol. 266, S. 540-553

[16] Gerthsen, Christian; Kneser, Hans O.; Vogel, Helmut: Physik: ein Lehrbuch zum

Gebrauch neben Vorlesungen. - 16. Aufl. - Berlin u.a.: Springer-Verlag, 1989

[17] Gosline, J. M.; Guerette, P. A.; Ortlepp, C. S.; Savage, K. N.: The mechanical design of

spider silks: from fibroin sequence to mechanical function. In: The Journal of

Experimental Biology. - Cambridge: The Company of Biologists Limited. - (1999)202, S.

3295-3303

[18] Jin, Hyoung-Joon; Kaplan, David L.: Mechanism of silk processing insects and spiders.

In: Nature - London: Nature Publishing Group. - (2003)424, S. 1057-1061

[19] Kelley, Lawrence: < [email protected]> : Welcome to the 3D-PSSM Web Server V

2.6.0. URL: <http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html>, verfügbar am:

09.08.2011

62

[20] Lin, Zhi ; Huang, Weidong; Zhang, Jingfeng; Fan, Jing-Song; Yang, Daiwen: Solution

structure of eggcase silk protein and its implications for silk fiber formation. In: Proc.

Natl. Acad. Sci. - Washington D. C.: Proc. Natl. Acad. Sci. - (2009) vol. 106, no. 22,

S. 8906-8911

[21] Marchler-Bauer, Aron; Lu, Shennan; Anderson, John B.; Chitsaz, Farideh; Derbyshire,

Myra K.; DeWeese-Scott, Carol; Fong, Jessica H.; Geer, Lewis Y.; Geer, Renata C.;

Gonzales, Noreen R.; Gwadz, Marc; Hurwitz, David I.; Jackson, John D.; Ke, Zhaoxi;

Lanczycki, Christopher J.; Lu, Fu; Marchler, Gabriele H.; Mullokandov, Mikhail;

Omelchenko, Marina V.; Robertson, Cynthia L.; Song, James S.; Thanki, Narmada;

Yamashita, Roxanne A.; Zhang, Dachuan; Zhang, Naigong; Zheng, Chanjuan; Bryant,

Stephen H.:

CDD: a Conserved Domain Database for the functional annotation of proteins. In:

Nucleic Acids Research - Oxford: Oxford University Press. - (2010) vol. 39, Database

issue, S. 225-229

[22] Merkl, Rainer; Waack, Stephan: Bioinformatik Interaktiv. - 2. Auflage. - Weinheim:

Wiley VCH Verlag GmbH & Co KGaA., 2009

[23] Munk, Katharina: Grundstudium Biologie. - 1. Aufl. - Heidelberg u.a.: Spektrum

Akademischer Verlag GmbH, 2000

[24] Pagni, Marco; Junier, Thomas: Dotlet: diagonal plots in a Web browser.

In: Bioinformatics - Oxford: Oxford University Press. - (2000) vol. 16, no. 2, S. 178-179

[25] Nieuwenhuys, Ed: Spider Silk.

URL: <http://ednieuw.home.xs4all.nl/Spiders/Info/spindraad.htm>,

verfügbar am: 16.06.2011

[26] Petzold, Tony: Projekt Biotechnologie/Bioinformatik. Thema: Das Geheimnis der

Spinnenseide. - 2011. - 31 S.; Mittweida, Hochschule Mittweida (FH),

Mathematik/Naturwissenschaften/Informatik, Belegarbeit, 2011

[27] Petzold, Tony: Praxisbericht. Thema: Der Spinnenfaden auf molekularer Ebene-

untersucht mit bioinformatischen Tools-. - 2011. - 13. S.; Mittweida, Hochschule

Mittweida (FH), Mathematik/Naturwissenschaften/Informatik, Praxismodulbeleg, 2011

[28] Ponting, Chris P.; Schultz, Jörg; Milpetz, Frank; Bork, Peer: SMART: identification and

annotation of domains from signalling and extracellular protein sequences. In: Nucleic

Acids Research - Oxford: Oxford University Press. - (1999) vol. 27, no. 1, S. 226-229

[29] Rashidi, Hooman H.; Bühler, Lukas K.: Grundriss der Bioinformatik: Anwendungen in

den Biowissenschaften und der Medizin. - 1. Aufl. - Heidelberg u.a.: Spektrum

Akademischer Verlag GmbH, 2001

63

[30] Richter, Falk: persönliche Mitteilung, 2011

[31] Römer, Lin; Scheibel, Thomas: Spinnenseidenproteine. Grundlage für neue Materialien.

In: Chem. Unserer Zeit. - Weinheim: Wiley VCH Verlag GmbH & Co KGaA. - (2007)41, S.

306-314

[32] Rostkowski, Michał; Olsson, Mats H. M.; Søndergaard, Chresten R.; Jensen, Jan H.:

Graphical analysis of pH-dependent properties of proteins predicted using PROPKA. In:

BMC Structural Biology - London: BioMed Central. - (2011)11, S. 1-6

[33] Schultz, Jörg; Copley, Richard R.; Doerks, Tobias; Ponting, Chris P.; Bork, Peer: SMART:

a web-based tool for the study of genetically mobile domains. In: Nucleic Acids

Research - Oxford: Oxford University Press. - (2000) vol. 28, no. 1, S. 231-234

[34] Schwede, Torsten: <[email protected]> : SWISS-MODEL Template Library.

URL: <http://swissmodel.expasy.org/workspace/index.php?func=special_help>,

verfügbar am: 09.08.2011

[35] Shao, Zhengzhong; Vollrath, Fritz: Surprising strength of silkworm silk. In: Nature -

London: Nature Publishing Group. - (2002)418, S. 741

[36] Spiess, Kristina; Lammel, Andreas; Scheibel, Thomas: Recombinant Spider Silk Proteins

for Applications in Biomaterials. In: Macromol. Biosci. - Weinheim: Wiley VCH Verlag

GmbH & Co KGaA. - (2010)10, S. 998-1007

[37] The UniProt Consortium <[email protected]> : The Universal Protein Resource

(UniProt) 2009. In: Nucleic Acids Research - Oxford: Oxford University Press. - (2008)

vol. 37, Database issue, S. D142-D148

[38] Verfasser unbekannt: About SIB. URL: <http://www.isb-sib.ch/aboutsib.html>,

verfügbar am: 09.08.2011

[39] Verfasser unbekannt <[email protected]> : LALIGN - find multiple

matching subsegments in two sequences. URL:

<http://www.ch.embnet.org/software/LALIGN_form.html>, verfügbar am 17.08.2011

[40] Verfasser unbekannt <[email protected]> : GOR IV SECONDARY STRUCTURE

PREDICTION METHOD. URL: <http://npsa-pbil.ibcp.fr/cgi-

bin/npsa_automat.pl?page=npsa_gor4.html>, verfügbar am: 01.08.2011

[41] Verfasser unbekannt <[email protected]> : CFSSP: Chou & Fasman

Secondary Structure Prediction Server. URL: <http://www.biogem.org/tool/chou-

fasman/>, verfügbar am 01.08.2011

[42] Verfasser unbekannt <[email protected]> : UniProtKB Entry A6YIY1. URL:

<http://www.uniprot.org/uniprot/A6YIY1>, verfügbar am: 02.08.2011

64

[43] Verfasser unbekannt <[email protected]> : UniProtKB Entry A6YIY0. URL:

<http://www.uniprot.org/uniprot/A6YIY0>, verfügbar am: 02.08.2011

[44] Verfasser unbekannt: ProtScale. URL: <http://web.expasy.org/protscale/>, verfügbar

am: 02.08.2011

[45] Verfasser unbekannt: SMART. URL: < http://smart.embl-heidelberg.de/>, verfügbar

am: 03.08.2011

[46] Verfasser unbekannt <[email protected]> : Conserved Domains and Protein

Classification. URL: <http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml>,

verfügbar am: 03.08.2011

[47] Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk. In: Nature -

London: Macmillan Magazines Limited. - (2001)410, S. 541-548

[48] Vollrath, Fritz; Madsen, Bo; Shao, Zhengzhong: The effect of spinning conditions on the

mechanics of a spider's dragline silk. In: Proc. Roy. Soc. - London: The Royal Society. -

B(2001)268, S. 2339-2346

[49] Vollrath, Fritz: Strength and structure of spiders' silks. In: Rev. Molec. Biotech. -

Amsterdam: Elsevier Science B.V. - (2000)74, S. 67-83

[50] von Ardenne, Manfred; Musiol, Gerhard; Klemradt, Uwe: Effekte der Physik und ihre

Anwendungen. - 3. Aufl. - Frankfurt am Main: Wissenschaftlicher Verlag Harri

Deutsch GmbH, 2005

[51] Multiples Sequenzalignment. (Bild)

URL: <http://www.xray.bioc.cam.ac.uk/xray_resources/whitepapers/mr-in-

action/img129.gif>, verfügbar am: 09.08.2011

65

9 Erklärung zur selbständigen Anfertigung der Arbeit

Erklärung

Ich erkläre, dass ich die vorliegende Arbeit selbständig und nur unter Verwendung

der angegebenen Literatur und Hilfsmittel angefertigt habe.

Bearbeitungsort, Datum

66

10 Anhang

Abbildung 30: Ergebnis der Identifizierung der Proteinfaltung von MaSp1 mittels 3D-PSSM.

Das Bild zeigt den Screenshot des Ergebnisses, welches anhand eines Repeats (Aminosäure 1448-1496) von MaSp1

ermittelt wurde. Oben im Bild sind eine kleine Beschreibung des Inhalts, verschiedene Links sowie die

Eingabeparameter aufgeführt. Darunter befindet sich eine Skala, die ein Maß für die Aussagekräftigkeit der

ausgegebenen Treffer (E-Wert) ist. Es folgt eine Auflistung aller gefunden Treffer in einer Tabelle. Die Treffer stellen

die zur Eingabesequenz ähnlichen Sequenzen dar. Hierbei handelt sich um eine Zusammenstellung, da die Liste der

Treffer insgesamt weitaus länger ist. Die Tabelle gibt Informationen über einen Treffer wie z. B. Ähnlichkeit (in %)

Sequenzlänge, Strukturmodell, E-Wert, PDB-ID, Name, Proteinfamilie u.a. aus. Je ähnlicher eine gefundene Sequenz

ist, desto besser. Ab einem gewissen Prozentsatz wird der Treffer rot markiert (siehe Abbildung). In der Abbildung

rot markiert ist der Treffer mit dem Titel Collagen (PDB-ID: 1bkv), welcher zu 41 Prozent mit der Eingabesequenz

übereinstimmt. Unterhalb der Tabelle befinden sich die Primärstruktur sowie die Sekundärstruktur (einschließlich

das Maß der Aussagekräftigkeit) der Eingabesequenz. Je höher der Zahlenwert unterhalb der vorhergesagten

Sekundärstruktur ist, desto wahrscheinlicher ist es, dass das Protein dieses Sekundärstrukturelement bildet. Laut

der Abbildung 30 bildet die Sequenz sehr unwahrscheinlich (Zahlenwert 0-2) Helices (H) aus, wohingegen die

Bildung von einer Coil-Struktur (C) sehr wahrscheinlich (Zahlenwert bis 9) ist. [19]