genomy - brown rozdział 2 - ocr

23
ROZDZIAŁ Mapowanie genomów technikami genetycznymi Spis treści 2.1 Mapy genetyczne i fizyczne 15 2.2 Markery dla map genetycznych 15 2.2.1 Geny były pierwszymi stosowanymi markerami 15 2.2.2 Markery DNA do mapowania genetycznego 18 2.3 Sposoby podejścia do mapowania genetycznego 22 2.3.1 Analiza sprzężeń jest podstawą mapowania genetycznego 22 2.3.2 Przeprowadzanie analizy sprzężeń u różnych typów organizmów 28

Upload: mmm13

Post on 08-Jun-2015

6.961 views

Category:

Documents


2 download

TRANSCRIPT

R O Z D Z I A Ł

Mapowanie genomów technikami genetycznymi

Spis treści

2.1 Mapy genetyczne i fizyczne 15 2.2 Markery dla map genetycznych 15

2.2.1 Geny były pierwszymi stosowanymi markerami 15 2.2.2 Markery DNA do mapowania genetycznego 18

2.3 Sposoby podejścia do mapowania genetycznego 22 2.3.1 Analiza sprzężeń jest podstawą mapowania

genetycznego 22 2.3.2 Przeprowadzanie analizy sprzężeń u różnych

typów organizmów 28

14 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Fakty i założenia Mapowanie genetyczne do tworzenia map genomów wykorzystuje takie techniki genetyczne jak krzyżowanie organizmów i analiza rodowodów. Pierwotnie jako markerów używano genów, lecz obecnie uzupełniono je o markery DNA takie jak RFLP, SSLP i SNP.

Podstawą mapowania genetycznego jest obliczenie częstości rekombinacji poprzez analizę sprzężeń.

Jeśli możliwe są eksperymenty hodowlane, to przeprowadza się dwu- lub wielopunktowe krzyżówki testowe. Trudności w mapowaniu genów u człowieka wynikają z ograniczeń analizy rodowodów. Analiza genetyczna bakterii wymaga przeniesienia genów z jednej komórki do drugiej.

Następne trzy rozdziały opisują techniki i strategie stosowane do otrzymania sekwencji genomu. Techniki te obejmują znacznie więcej niż tylko same metody sekwencjonowania DNA, które oczywiście mają fun­damentalne znaczenie. Mają także jedno podstawowe ograniczenie: nawet stosując najbardziej rozwinięte technologie, rzadko można w jednym eksperymencie otrzymać sekwencję dłuższą niż 750 bp, co oznacza, że sekwencję długiej cząsteczki DNA trzeba składać z serii krótszych sekwencji. Jednym z podejść jest podzielenie cząsteczki na fragmenty, ustalenie sekwencji każdego z nich i użycie komputera do znalezienia zachodzących na siebie fragmentów, a następnie złożenie oryginalnej sekwencji (rys. 2.1). Opisana strategia typu „shotgun" stanowi standardowe podejście do sekwencjonowania małych genomów prokariotycznych, ale ze wzrostem liczbv fragmentów, niezbędna analiza danych staje się niewspółmiernie bardziej złożona (dla n fragmentów liczbę możliwych zakładek opisuje 2n2-2n). Drugim problemem w metodzie „shotgun" jest możliwość powstawania błędów podczas analizy repetycyjnych regionów genomu. Jeśli sekwencję zawierającą po­wtórzenia podzieli się na fragmenty, w wielu otrzy­manych kawałkach będą takie same lub bardzo podob­ne motywy sekwencyjne. Łatwo można złożyć te sekwencje tak, że część regionów powtarzających się zostanie usunięta, a nawet tak, że dwa fragmenty tego samego lub różnych chromosomów zostaną ze sobą błędnie połączone (rys. 2.2).

Samo podejście „shotgun" jest więc nieodpowiednie dla większych, bardziej złożonych genomów. Zamiast tego, wpierw należy stworzyć mapę genomu. Mapa genomu stanowi przewodnik do prac nad sekwen-cjonowaniem, pokazując pozycje genów i innych charakterystycznych rodzajów sekwencji.

Gdy dostępna jest mapa, fazę sekwencjonowania można przeprowadzić na jeden z dwóch sposobów (rys. 2.3):

DNA

fragmenty

sekwencje

Rysunek 2.1 Podejście „shotgun" do składania sekwencji

Cząsteczkę D N A dzieli się na mate fragmenty, z których każdy jest sekwencjonowany. Oryginalną sekwencję składa się przez poszukiwanie zachodzących na siebie kawałków sekwencji pochodzących z poszczególnych fragmentów. W praktyce, by ustalić, że dwie sekwencje należy ze sobą połączyć, potrzeba zakładki o długości kilkudziesięciu par zasad

2.2 MARKERY DLA MAP GENETYCZNYCH 15

powtarzający się DNA

500 bp

DNA

fragmenty

sekwencje

nieprawidłowa zakładka

Rysunek 2.2 Problemy spotykane przy podejściu „shotgun"

W przedstawionym przykładzie cząsteczka D N A zawiera dwa segmenty powtarzającego się D N A , z których każdy składa się z wielu kopii motywu GATTA. Podczas badania sekwencji okazuje się, że dwa fragmenty z różnych części D N A zachodzą na siebie. Może to prowadzić do błędnej interpretacji, w której centralny segment cząsteczki D N A zostanie pominięty, a jeśli dwa powtarzalne segmenty D N A pochodziły z różnych chromosomów, sekwencje tych chromosomów mogą zostać błędnie złożone

• Przez zastosowanie kontigów klonów (sekcja 4.2.2). Genom dzieli się na nadające się do obróbki seg­menty, każdy o długości kilkuset kb lub kilku Mb, sekwencjonowane następnie indywidualnie, prze­ważnie metodą „shotgun". Po ukończeniu sekwen-cjonowania segmentu można go umieścić w prawi­dłowym miejscu na mapie.

• Poprzez ukierunkowaną strategię „shotgun" (sek­cja 4.2.3). Strategia ta wykorzystuje określone pun­kty na mapie genomu jako znaczniki do pomocy w składaniu głównej sekwencji z wielkiej liczby krótkich sekwencji otrzymanych przez podejście „shotgun". Mapy używa się także do sprawdzenia, czy nie popełniono błędów w składaniu sekwencji regionów powtarzalnych. Teoretycznie w ten spo­sób można zsekwencjonować cały genom człowieka (Venter i wsp., 1998).

W obu podejściach mapa stanowi szkic do kolejnej fazy projektu, czyli sekwencjonowania. Pewne typy map wskazują także pozycje genów, umożliwiając skierowanie początkowej fazy projektu sekwencjono­wania na interesujące regiony genomu tak, aby sek­wencje istotnych genów otrzymać tak szybko, jak to jest możliwe. Z tych powodów pierwsze 6 lat Projektu Poznania Genomu Człowieka poświęcono prawie cał­kowicie na mapowanie genomu człowieka, a nie na jego sekwencjonowanie.

2.1 MAPY GENETYCZNE I FIZYCZNE

Tradycyjnie metody mapowania genomu dzieli się na dwie kategorie

Mapowanie genetyczne opiera się na stosowaniu technik genetycznych do konstruowania map po­kazujących pozycje genów i innych charakterys­tycznych rodzajów sekwencji w genomie. Techniki genetyczne obejmują krzyżowanie organizmów lub, w przypadku ludzi, badanie historii rodzin (rodo­wodów). Mapowanie genetyczne opisano w tym rozdziale. Mapowanie fizyczne wykorzystuje techniki biologii molekularnej do badania cząsteczek DNA bezpo średnio w celu skonstruowania map pokazujących pozycje różnych typów sekwencji z genami włącz nie. Mapowanie fizyczne opisano w następnym rozdziale.

2.2 MARKERY DLA MAP GENETYCZNYCH

Jak każdy rodzaj mapy, mapa genetyczna musi poka­zywać pozycje poszczególnych genów w stosunku do określonych wyznaczników, czyli markerów. Na ma­pach geograficznych takimi markerami są rozpozna­walne składniki krajobrazu, jak rzeki, drogi i budynki. A jakich markerów możemy użyć w krajobrazie gene­tycznym?

2.2.1 Geny byty pierwszymi stosowanymi markerami

W pierwszych mapach genetycznych, konstruowanych na początku XX wieku dla organizmów takich jak muszka owocowa, jako markerów używano genów. Było to wiele lat przed tym, nim zrozumiano, że geny są segmentami cząsteczek DNA. Geny traktowano wówczas jako abstrakcyjne jednostki odpowiedzialne za przekazywanie cech dziedzicznych z rodziców na potomstwo. By być użyteczną w analizie genetycznej, cecha dziedziczna musi występować w dwóch alter­natywnych formach lub fenotypach, czego przykładem jest występowanie długich i krótkich łodyg u roślin groszku badanego przez Mendla. Każdy fenotyp jest określany przez inny allel odpowiadającego mu genu. Na początku jedynymi genami nadającymi się do badania były takie, które odpowiadały fenotypom rozróżnialnym wzrokowo. Tak więc na przykład pierw­sze mapy genomu muszki owocowej pokazywały pozycje genów odpowiedzialnych za barwę ciała, kolor oczu, kształt skrzydeł i podobnych. Wszystkie wymie­nione fenotypy można obserwować po prostu patrząc na muchy przez lupę o niewielkim powiększeniu lub okiem nieuzbrojonym. We wczesnych latach genetyki takie podejście było odpowiednie, ale genetycy szybko zdali sobie sprawę, że w ten sposób można badać dziedziczenie zaledwie ograniczonej liczby fenotypów nadających się do obserwacji wzrokowej, a w wielu przypadkach analiza jest trudniejsza, ponieważ na pojedynczą cechę fizyczną wpływa więcej niż jeden

16 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Analiza kontigów klonów

Analiza typu „shotgun"

mapa genomowa mapowany segment DNA

sekwencjonowanie „shotgun" zmapowanego segmentu

złożona sekwencja

złożone sekwencje

pozycja sekwencji jest już znana

markery używane do zakotwiczenia złożonych sekwencji na mapie

Rysunek 2.3 Alternatywne podejścia do sekwencjonowania genomu

Zmapowano genom, składający się z liniowej cząsteczki D N A długości 2,5 Mb i poznano pozycje ośmiu markerów (A-H). Z lewej - analiza kontigów klonów rozpoczyna się od segmentu DNA, którego pozycję na mapie genomu zidentyfikowano, ponieważ zawiera) markery A i B. Segment sekwencjonuje się metodą „shotgun" i otrzymaną sekwencję umieszcza się w znanej pozycji na mapie. Z prawej - ukierunkowana strategia „shotgun" obejmuje losowe sekwencjonowanie całego genomu. Uzyskuje się kawałki nieprzerwanych sekwencji, prawdopodobnie o długości setek kb. Jeśli nieprzerwana sekwencja zawiera marker, to można ją umieścić w odpowiednim miejscu na mapie. Zauważ, że w obu metodach im więcej markerów znajduje się na mapie genomu, tym lepiej. Więcej szczegółów dotyczących tych strategii sekwencjonowania - patrz podrozdział 4.2.

gen. Na przykład do roku 1922 zmapowano ponad 50 genów na czterech chromosomach muszki owocowej, lecz dziewięć z nich stanowiły geny koloru oczu i każdy nowicjusz, mający nadzieję na wniesienie czegoś nowego do tej dziedziny, wpierw musiał nauczyć się rozróżniać kolory oczu muchy: czerwony, jasnoczerwony i inne odcienie czerwieni, takie jak: cynober (cinnabar, vermilion), kolor granatu (garnet), cielisty (carnation), sepia, szkarłat (scarlet), różowy (pink), purpura (cardinal) lub bordo (claret). Aby stworzyć bardziej ogólne mapy genów, konieczne stało się znalezienie cech bardziej policzalnych, dają­cych się lepiej rozróżniać i mniej złożonych niż nada­jące się do obserwacji wzrokowej.

Odpowiedzią było wykorzystanie biochemii do roz­różniania fenotypów, szczególnie ważne u dwóch ty­pów organizmów - mikroorganizmów i ludzi. Mikro­

organizmy, jak na przykład bakterie i drożdże, mają niewiele cech, które można obserwować wzrokowo, więc mapowanie genów tych organizmów musi opierać się na fenotypach biochemicznych, takich jak wymie­nione w tabeli 2.1. Ludzie także mają cechy obserwowal-ne wzrokowo, ale już od lat dwudziestych badano fenotypy biochemiczne uzyskiwane przez typowanie krwi, i były to nie tylko standardowe grupy krwi jak ABO (Yamamoto i wsp., 1990), lecz także warianty alleliczne białek osocza krwi i białka immunologiczne, jak antygeny leukocytów człowieka (system HLA - ang. human leukocyte antigens). Dużą przewagą takich markerów nad fenotypami widzialnymi jest występowa­nie alleli wielokrotnych w wielu istotnych genach (Mori i wsp., 1997). Na przykład gen nazywany HLA--DRB1 posiada przynajmniej 59 alleli, a HLA-B przynaj­mniej 60. Ma to znaczenie ze względu na sposób, w jaki

markery 500 kb

sekwencjonowanie metodą „shotgun" catego genomu

2.2 MARKERY DLA MAP GENETYCZNYCH 17

Ramka 2 . 1 : Krótki przewodnik po genetyce mendlowskiej

Mapowanie genetyczne opiera się na zasadach dziedziczenia po raz pierwszy opisanych przez Grzegorza Mendla w roku 1865 (Orel, 1995). Z wyników krzyżowania roślin grochu Mendel wyciągnął wniosek, że każda roślina grochu ma dwa allele każdego genu, ale tylko jeden fenotyp. Łatwo to zrozumieć, gdy roślina należy do czystej linii lub jest homo-zygotą pod względem konkretnej cechy, gdyż wtedy ma dwa identyczne allele i odpowiedni fenotyp. Jednakże Mendel wykazał, że jeśli skrzyżuje się dwie czyste linie o różnych fenotypach, całe potomstwo (pokolenie F1) ma ten sam fenotyp. Członkowie pokolenia F1 muszą być heterozygota-mi pod względem badanego fenotypu, gdyż dziedziczą po jednym allelu od każdego z rodziców. Fenotyp rośliny F1 jest więc dominujący nad drugim, recesywnym fenotypem.

Mendel przeprowadził dodatkowe krzyżówki, które umoż­liwiły mu sformułowanie dwóch praw genetyki. Pierwsze prawo mówi, że allele segregują przypadkowo. Innymi słowy, jeśli rodzic ma allele A i a, to osobnik z pokolenia F1 ma taką samą szansę odziedziczenia A jak a. Drugie prawo mówi, że pory alleli segregują niezależnie, czyli dziedziczenie alleli genu A jest niezależne od dziedziczenia alleli genu B. Dzięki tym prawom wyniki krzyżówek genetycznych są przewidywal­ne, jak to pokazują przykłady u góry następnej kolumny.

Wielkim wkładem Mendla do współczesnej genetyki było, że niemal bezbłędnie określił sposób dziedziczenia genów. Teraz wiemy, że dwa allele genu są niesione przez dwa chromosomy homologiczne (patrz s. 25) w komórce diploi-

krzyżówka jednopunktowa

krzyżówka dwupunktowa

dalnej i że sposób, w jaki allele są przenoszone z rodziców na potomstwo, zgodnie z tym co wydedukował Mendel, od­powiada wydarzeniom zachodzącym podczas wytwarzania haploidalnych gamet podczas mejozy (patrz rys. 2.10). Za­uważamy również, że prosta reguła dominacji-recesywności zaproponowana przez Mendla może się skomplikować w sy­tuacjach, których nie spotkał u swoich roślin grochu. Jedną z nich jest niepełna dominacja, gdy fenotyp heterozygoty jest pośredni między dwiema formami homozygotycznymi. Na przykład jeśli czerwone goździki krzyżuje się z białymi, to w F1 heterozygoty są różowe. Inną komplikacją jest kodo-minacja, gdy oba allele można wykryć u heterozygoty. Kodominacja jest sytuacją typową dla markerów DNA, któ­rych allele można wykryć bezpośrednio metodami badania DNA (sekcja 2.2.2). Mendel popełnił tylko jeden poważny błąd: jego drugie prawo nie zakłada istnienia sprzężeń, czyli możliwości, żeby allele dwóch genów dziedziczyły się wspól­nie, ponieważ znajdują się na jednym chromosomie. Jak zobaczymy w sekcji 2.3.1, odkrycie sprzężeń przez następców Mendla doprowadziło do metod stosowanych w mapowaniu genetycznym.

Tabela 2.1 Typowe markery biochemiczne używane w analizie genetycznej Saccharomyces cerevisiae

Marker Fenotyp Metoda identyfikacji komórek niosących marker

ADE2 CANI CUPI CYHI LEU2 SUC2 URA3

wymaga adeniny oporny na kanawaninę oporny na miedź oporny na cykloheksimid wymaga leucyny zdolny do fermentacji sacharozy wymaga uracylu

rośnie tylko wtedy, gdy w pożywce jest obecna adenina rośnie w obecności kanawaniny rośnie w obecności miedzi rośnie w obecności cykloheksimidu rośnie tylko wtedy, gdy w pożywce jest obecna leucyna rośnie, gdy sacharoza jest jedynym węglowodanem w pożywce rośnie tylko wtedy, gdy w pożywce jest obecny uracyl

rodzice

genotypy F1

fenotypy F1

rodzice wysoki okrągłe TtRr x TtRr wysoki okrągłe

genotypy F1 TR Tr tR tr

TR TTRR TTRr TtRR TtRr Tr TTRr TTrr TtRr Ttrr tR TtRR TtRr ttRR ttRr tr TtRr Ttrr ttRr ttrr

fenotypy F1 9 wysokich, okrągłe : 3 wysokie, pomarszczone : 3 niskie, okrągłe: 1 niski, pomarszczone

Gen Allele

wysokość wysoki T niski t

nasiona grochu okrągłe R pomarszczone t

rodzice wysoki TTxtt niski okrągłe RR x rr pomarszczone

rośiiny F1 dziedziczą po jednym allelu od każdego z rodziców

genotypy F1 wszystkie Tt wszystkie Rr Fenotypy F1 wszystkie wysokie wszystkie okrągłe

wniosek wysoki jest dominujący okrągłe jest dominujące

18 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

przeprowadza się mapowanie genów człowieka (sekcja 2.3.2). Zamiast przeprowadzić wiele eksperymentów krzyżówkowych, co jest procedurą stosowaną do or­ganizmów eksperymentalnych, takich jak muszki owo­cowe czy myszy, dane o dziedziczeniu genów ludzkich trzeba zbierać przez badanie fenotypów członków jednej rodziny. Jeśli członkowie rodziny są homo-zygotami pod względem badanego genu, nie uzyskuje się żadnej użytecznej informacji. Może się to często zdarzać, jeśli gen ma zaledwie dwa allele, ponieważ przypadkowo małżeństwo zawarły osoby homozygo-tyczne względem tego samego allelu. Jest to mniej prawdopodobne, jeśli badany gen ma 60 alleli, a nie dwa.

2.2.2 Markery DNA do mapowania genetycznego

Geny są bardzo użytecznymi, jednak nie idealnymi, markerami. Jeden problem, szczególnie w badaniu większych genomów - kręgowców i roślin kwiato­wych, stanowi to, że mapa oparta całkowicie na genach nie jest zbyt szczegółowa. Byłoby to prawdą, nawet jeśli można by zmapować każdy gen, ponieważ jak zobaczyliśmy w rozdziale 1, w genomach tych or­ganizmów geny są poprzedzielane dużymi przerwami (patrz rys. 1.7, s. 10). Problem jest tym trudniejszy, że zaledwie część pełnej liczby genów występuje w for­mach allelicznych łatwych do odróżnienia. Mapy genów nie są więc zbyt dokładne. Potrzebujemy innych typów markerów.

Mapowane cechy nie będące genami nazywa się markerami DNA. Tak jak markery genowe, aby były użyteczne, markery DNA muszą występować w przy­najmniej dwóch formach allelicznych. Trzy typy cech sekwencji DNA odpowiadają temu wymogowi.

Polimorfizm długości fragmentów restrykcyjnych (RFLP) RFLP (ang. restriction fragment length polymorphism) były pierwszymi badanymi typami markerów DNA. Fragmenty restrykcyjne powstają, gdy na cząsteczkę DNA działa się endonukleazą restrykcyjną, będącą typem enzymu tnącego cząsteczki DNA w określonych sekwencjach (patrz Metody badań 3.1, s. 40). Na przy­kład endonukleazą restrykcyjna EcoRI tnie dwuniciowy DNA jedynie w obrębie sekwencji:

5' - GAATTC - 3' 3' - CTTAAG - 5'

Taka specyficzność sekwencyjna oznacza, że trawienie określonej cząsteczki DNA danym enzymem restryk­cyjnym powinno zawsze dawać ten sam zestaw frag­mentów. Nie zawsze jest to prawdą w przypadku cząsteczek genomowego DNA, ponieważ niektóre miejsca restrykcyjne są polimorficzne, występują jako dwa allele: jeden allel mający prawidłową sekwencję dla miejsca restrykcyjnego, i w związku z tym cięty podczas trawienia DNA enzymem, oraz drugi allel

Rysunek 2.4 Polimorfizm długości fragmentów restrykcyjnych (RFLP)

Cząsteczka D N A z lewej strony ma polimorficzne miejsce restrykcyjne (oznaczone gwiazdką) nieobecne w cząsteczce po stronie prawej. RFLP ujawnia się po działaniu enzymem restrykcyjnym, ponieważ jedna cząsteczka jest cięta na cztery fragmenty, podczas gdy druga jest cięta na trzy fragmenty

- z taką zmianą, że miejsce restrykcyjne nie jest rozpoznawane. W drugim przypadku dwa graniczące fragmenty restrykcyjne po traktowaniu enzymem pozostają ze sobą złączone, co prowadzi do poli­morfizmu długości (rys. 2.4). To jest RFLP, a jego pozycję na mapie można odnaleźć przez prześle­dzenie dziedziczenia jego form allelicznych, tak jak wtedy, gdy stosowanymi markerami są geny. Uważa się, że w genomie człowieka jest około 105 RFLP, ale oczywiście dla każdego RFLP występować mogą tylko dwa allele (z miejscem restrykcyjnym i bez). Wartość RFLP w mapowaniu genów człowieka jest więc ograniczana przez duże prawdopodobieństwo, że rodzina będzie całkowicie homozygotyczna pod względem danego RFLP.

W celu oznaczenia RFLP niezbędne jest określenie wielkości tylko jednego lub dwóch pojedynczych fragmentów restrykcyjnych na tle wielu nieistotnych fragmentów. Nie jest to łatwy problem: enzym EcoRI, rozpoznający sekwencję o długości 6 bp, może ciąć DNA raz na 46 (czyli raz na 4096 bp), (sekcja 3.1.2). Jeśli przecinamy ludzki DNA, to otrzymamy prawie 750000 fragmentów. Na szczęście istnieją techniki umożliwiające wykrycie pojedynczych fragmentów:

• Hybrydyzacja metodą Southerna (patrz Metody badań 2.1) była pierwszą techniką stosowaną do oznaczania RFLP. Fragmenty DNA otrzymane po trawieniu rozdziela się przez elektroforezę w żelu agarozowym, a poszukiwane wykrywa się dzięki hybrydyzacji z sondą.

• Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction), (patrz Metody badań 2.2) jest obecnie stosowana powszechniej, ponieważ jest szybsza niż analiza Southerna. W reakcji PCR region DNA zawierający RFLP namnaża się do wielu kopii przed pocięciem DNA enzymem re­strykcyjnym. Wówczas RFLP można uwidocznić przez barwienie fragmentów restrykcyjnych brom­kiem etydyny w żelu agarozowym, co jest metodą

dodanie nukleazy restrykcyjnej

4 fragmenty 3 fragmenty

polimorfczne miejsce restrykcyjne

2.2 MARKERY DLA MAP GENETYCZNYCH 19

Hybrydyzacja metodą Southerna

Wykrywanie określonych fragmentów restrykcyjnych na tle wielu innych fragmentów restrykcyjnych

W hybrydyzacji metodą Southerna zestaw fragmentów re­strykcyjnych przenosi się z żelu agarozowego na błonę nylonową i specyficzny, badany fragment wykrywa się przez hybrydyzację z sondą. Technika ta, oprócz zastosowania do mapowania RFLP (sekcja 2.2.2), jest także używana w innych procedurach wymagających identyfikacji szczególnych frag­mentów restrykcyjnych, na przykład do sprawdzenia klono­wanego fragmentu (Metody badań 3.4, s. 52)

Elektroforeza w żelu agarozowym (Metody badań 3.2, s. 43) służy do rozdzielania liniowych cząsteczek DNA, takich jak fragmenty restrykcyjne, zależnie od ich wielkości. Jeśli trawie­nie dało tylko kilka fragmentów, to każdy tworzy oddzielny prążek, który można zobaczyć po wybarwieniu żelu brom­kiem etydyny. Jeżeli jest więcej niż około 50 fragmentów, prążki łączą się ze sobą tworząc smugę i nie można zobaczyć pojedynczych fragmentów. Wówczas fragmenty przenosi się na błonę nylonową po prostu kładąc ją na żelu. Bufor przesiąkając przenosi DNA z żelu na błonę, do której DNA się przyłącza (rysunek u góry). Do przenoszenia można kupić drogą maszynę, lecz prościej użyć pliku papierowych ręcz­ników.

Sondą do hybrydyzacji jest wyznakowana cząsteczka DNA o sekwencji komplementarnej do docelowego DNA, który

chcemy wykryć. Ponieważ sonda i docelowy DNA są kom­plementarne, mogą tworzyć pary czyli hybrydyzować. Po­zycję docelowego fragmentu restrykcyjnego na filtrze iden­tyfikuje się przez wykrycie sygnału znacznika dołączonego do sondy. Sondą może być syntetyczny nukleotyd (patrz rys. 2.7) lub sklonowany fragment DNA (Metody badań 3.4, s. 52). W wykrywaniu RFLP sondą jest przeważnie sklonowany fragment obejmujący polimorficzne miejsce re­strykcyjne.

Aby przeprowadzić hybrydyzację, błonę umieszcza się w szklanej butelce z wyznakowaną sondą oraz buforem i delikatnie obraca przez kilka godzin, aby sonda miała możliwość hybrydyzowania z docelowym DNA. Następnie błonę płucze się w celu usunięcia sondy, która nie zhyb-rydyzowała, i wykrywa się sygnał znacznika. Szczegóły zna­kowania i detekcji prezentują Metody badań 3.3, s. 46; w poniższym przykładzie sondę wyznakowano radioaktywnie, a sygnał wykrywa się stosując autoradiografię. Na auto-radiogramie widoczne są prążki komplementarne z sondą. Widzimy, że w ścieżce 2 jest tylko jeden hybrydyzujący prążek, a w ścieżce 3 dwa prążki. DNA w ścieżce 3 został przecięty w polimorficznym miejscu restrykcyjnym, natomiast w ścieżce 2 - nie.

20 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Reakcja łańcuchowa polimerazy

Wykładnicze namnażanie wybranego regionu cząsteczki D N A

Reakcja łańcuchowa polimerazy (PCR - ang. polymerase chain reaction) prowadzi do powielenia wybranego fragmentu cząsteczki DNA. Bez trudu można namnażać odcinki długości nawet ponad 5 kb, a po zmodyfikowaniu standardowej techniki możliwe są dłuższe amplifikacje - aż do 40 kb. Technika PCR ma wiele zastosowań w biologii molekularnej, na przykład w mapowaniu DNA (patrz sekcja 2.2.2), sekwen-cjonowaniu DNA (patrz sekcje 4.1.1 i 4.2.1) i filogenetyce molekularnej (rozdział 15). Zmodyfikowaną wersję reakcji PCR można stosować do namnażania cząsteczek RNA w po­staci DNA (Metody badań 5.1, s. 91). Technika PCR jest także szeroko używana w wyspecjalizowanych dziedzinach, takich jak medycyna sądowa i diagnostyka kliniczna, gdzie szczególnie użyteczna jest możliwość pracy z niewielką wyjściową liczbą cząsteczek.

Reakcję przeprowadza się przez zmieszanie ze sobą cząs­teczki DNA stanowiącej matrycę, która może być obecna w bardzo niewielkich ilościach, oraz nukleotydów, dwóch syntetycznych oligonukleotydowych starterów i termostabil-nej polimerazy DNA (patrz Metody badań 4.2, s. 64), odpornej na denaturację pod wpływem wysokiej temperatury. Zwykle używa się polimerazy Taq z bakterii Thermus aquaticus żyjącej w gorących źródłach. Dwa startery muszą się przyłączyć do matrycy na obu końcach namnażanego regionu, co oznacza, że aby przygotować odpowiednie oligonukleotydy, musimy znać skrajne sekwencje. Oligonukleotydy zapoczątkowują syntezę nowego, komplementarnego polinukleotydu tworzo­nego - jak we wszystkich enzymatycznych syntezach DNA - w kierunku od 5' do 3' przez kopiowanie matrycowego DNA w kierunku od 3' do 5' (patrz rys. /./, s. 3 i sekcja 12.3.2).

Ponieważ polimeraza Taq jest termostabilna, mieszaninę reakcyjną można podgrzać do 90°C bez niszczenia aktywności enzymu. W tej temperaturze nowe nici oddzielają się od matrycowego DNA. Po ochłodzeniu mieszaniny do mat­rycowego DNA, a także do nowych nici, przyłącza się więcej starterów. Wtedy polimeraza Taq przeprowadza drugi cykl syntezy DNA.

PCR można kontynuować przez 30-40 cykli, nim enzym ulegnie ostatecznej inaktywacji albo startery lub nukleotydy zostaną zużyte. Pojedynczą cząsteczkę wyjściową można namnożyć do dziesiątek milionów identycznych fragmentów, co stanowi kilka mikrogramów DNA. Obecność polimorficz-nego miejsca restrykcyjnego w namnożonym regionie można sprawdzić przez trawienie produktu reakcji PCR enzymem restrykcyjnym i sprawdzenie próbki w żelu agarozowym.

2.2 MARKERY DLA MAP GENETYCZNYCH 21

mniej czułą niż hybrydyzacja z sondą. Tło niena-mnożonego DNA nie pokazuje się, jedynymi wi­docznymi fragmentami są te, które pochodzą z na­mnożonego DNA.

Zauważmy, że techniki te bezpośrednio wykrywają oba allele RFLP: oznacza to, że (jak przy innych markerach DNA) allele są kodominujące.

Polimorfizm długości prostych sekwencji (SSLP)

SSLP (ang. - simple sequence length polymorphism) są szeregami powtórzeń sekwencji, przejawiającymi różnice długości, a wiec różnymi allelami zawierający­mi różną liczbę jednostek powtarzalnych (rys. 1.5A). W odróżnieniu od RFLP, SSLP może być wieloallelowe, bo każdy SSLP może mieć wiele różnych wariantów długości. Istnieją dwa typy SSLP:

• Minisatelity, znane także jako zmienna liczba powtórzeń tandemowych (VNTR - ang. variable number of tandem repeats), w których jednostka powtarzalna ma kilkadziesiąt nukleotydów dłu­gości.

(A) Dwa warianty SSLP

allel I

allel 2

(B) Typowanie SSLP za pomocą reakcji PCR

elektroforeza w żelu agarozowym

ŚCIEŻKA A: test ŚCIEŻKA B: markery alleli WNIOSEK: badany DNA zawiera allel 2

Rysunek 2.5 SSLP i ich oznaczanie

(A) Dwa allele mikrosatelitarnego SSLP. W allelu I m o t y w „GA" jest powtórzony trzy razy, a w allelu 2 - pięć razy. (B) Sposób oznaczania SSLP w reakcji PCR. Region otaczający SSLP amplifikuje się, a badany produkt identyfikuje się przez elektroforezę w żelu agarozowym. Produkty PCR dają prążek odpowiadający dłuższej z sekwencji dwóch alleli wykazując, że testowany D N A zawierał allel 2. Opis elektroforezy w żelu znajduje się w Metodach badań 3.2, s. 43

allel 1

allel 2

Rysunek 2.6 Polimorfizm punktowy

• Mikrosatelity lub proste powtórzenia tandemowe (STR - ang. simple tandem repeats), w których powtórzeniami są znacznie krótsze jednostki, prze­ważnie dwu-, trzy- lub czteronukleotydowe. Dwa mikrosatelity spotkaliśmy w rozdziale 1, gdy pa­trzyliśmy na typowy 50-kb fragment genomu czło­wieka (patrz rys. 1.5, s. 6).

Jako markery DNA mikrosatelity są bardziej popularne niż minisatelity z dwóch powodów. Po pierwsze, minisatelity nie są równo rozprzestrzenione w geno­mie, lecz częściej znajduje się je bliżej końców chromo­somów. Stosując porównanie geograficzne, równo­ważne jest to z próbą użycia mapy latarni morskich, by znaleźć drogę wokół wyspy. Mikrosatelity są dogod­niej rozmieszczone w genomie. Po drugie, najszybszym sposobem oznaczania polimorfizmów długości jest reakcja PCR (rys. 2.5B), a za jej pomocą znacznie szybciej i dokładniej oznacza się sekwencje krótsze niż 300 bp. Większość alleli minisatelitarnych jest dłuższa, ponieważ jednostki powtarzalne są stosunkowo długie i często jest ich wiele w jednym ciągu. Typowy mikrosatelita zawiera 10-30 kopii powtarzalnej sek­wencji nie dłuższej niż cztery bp, i dlatego lepiej nadaje się do oznaczenia w reakcji PCR. Dotychczas w genomie człowieka znaleziono około 104 mikro-satelitów, ale prawdopodobnie jest ich znacznie więcej (sekcja 6.3.1).

Polimorfizmy punktowe (SNP) SNP (ang. single nucleotide polymorphism) stanowią bardzo licznie występujące w genomie pojedyncze mutacje punktowe (rys. 2.6). Niektóre równocześnie prowadzą do RFLP, choć nie większość, ponieważ sekwencji, w obrębie których leżą SNP, nie rozpoznaje żaden enzym restrykcyjny. Uważa się, że w genomie człowieka jest ponad 200 000 SNP położonych w ge­nach i prawdopodobnie dziesięć razy tyle, a może i więcej w DNA pozagenowym (Collins i wsp., 1997).

Każdy SNP ma tylko dwa allele *, więc z punktu widzenia mapowania genów człowieka ma te same wady co RFLP; istnieje duże prawdopodobieństwo, że wszyscy członkowie rodziny będą homozygotyczni pod względem pojedynczego SNP. Zaletą SNP jest ich

* Polimorfizm punktowy może mieć cztery allele odpowia­dające wystąpieniu jednego z czterech możliwych nukleotydów: A, C, T, G (przyp. tłum.).

22 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Rysunek 2.7 Hybrydyzacja z oligonukleotydami jest bardzo specyficzna

W bardzo dokładnie określonych warunkach hybrydyzacji stabilna cząsteczka hybrydowa powstaje tylko wtedy, gdy oligonukleotyd może utworzyć z docelowym D N A strukturę, w której wszystkie nukleotydy tworzą pary. Pojedyncze miejsce, w którym zasady nie tworzą pary, uniemożliwia tworzenie hybrydy. Aby osiągnąć taki poziom precyzji warunków, temperatura inkubacji musi być tuż poniżej t e m p e r a t u r y topnienia (T ) oligonukleotydu. W temperaturze powyżej 7 nawet cząsteczka, w której wszystkie zasady tworzą pary, jest niestabilna. Jeśli temperatura jest niższa od T o więcej niż 5°C, to hybrydy, w których nie wszystkie zasady tworzą pary, mogą być stabilne. T oligonukleotydu pokazanego na rysunku wynosi około 58°C. Obliczono to ze wzoru T m = (4 x liczba nukleotydów G i C) + (2 x liczba nukleotydów A i T) °C

olbrzymia liczba i możliwość oznaczania metodami nie wymagającymi elektroforezy w żelu. Jest to istotne dlatego, że elektroforeza w żelu jest trudna do zautomatyzowania, więc każda metoda detekcji na niej oparta będzie stosunkowo powolna i pracochłon­na. Wykrywanie SNP jest szybkie, ponieważ opiera się na analizie hybrydyzacji z oligonukleotydami. Oligo­nukleotyd to krótka, syntetyzowana chemicznie, jed-noniciowa cząsteczka DNA, zwykle krótsza niż 50 nukleotydów. Jeśli warunki są odpowiednie, oligo­nukleotyd będzie hybrydyzował z inną cząsteczką DNA tylko wtedy, gdy na całej swojej długości utworzy z nią pary nukleotydów. Jeśli pojawi się jednonukleotydowa różnica, jedna pozycja oligonuk­leotydu nie tworzy pary i hybrydyzacja nie zachodzi (rys. 2.7). Hybrydyzacja z oligonukleotydami pozwala rozróżnić dwa allele SNP. Strategia przeszukiwania obejmuje:

• Technologię „chip" DNA (patrz Metody badań 2.3). „Chip" DNA jest silikonową płytką, o powierzchni 2 cm2 lub mniejszej, niosącą wiele różnych gęsto poukładanych oligonukleotydów. Testowany DNA znakuje się znacznikiem fluorescencyjnym i pipe-tuje na powierzchnię płytki. Hybrydyzację wy­krywa się oglądając „chip" pod mikroskopem fluo­rescencyjnym. Pozycje emitujące sygnał fluores­cencyjny pokazują, który oligonukleotyd zhybry-

dyzował z badanym DNA. W ten sposób w jednym eksperymencie można oznaczyć wiele SNP (Wang i wsp., 1998).

• Dynamiczna hybrydyzacja specyficzna dla allelu (DASH - ang. dynamic allele-specific hybridization; Pennisi, 1998). W tej technice hybrydyzacja zachodzi w roztworze, na przykład w jednej ze studzienek 96-studzienkowej płytki mikrotitracyjnej i wykry­wana jest dzięki znacznikowi fluorescencyjnemu wiążącemu się jedynie z dwuniciowym DNA. Syg­nał emitowany jest wyłącznie wtedy, gdy zachodzi hybrydyzacja. Początkowo hybrydyzacja zachodzi w warunkach umożliwiających istnienie pojedyn­czych miejsc, gdzie zasady nie tworzą par. Na tym etapie eksperymentu oligonukleotydy i badany DNA hybrydyzują niezależnie od tego, jaki allel SNP występuje w DNA. Rozróżnienie między al-lelami osiąga się podnosząc temperaturę, ponieważ hybrydy, w których nie wszystkie zasady tworzą pary, są mniej stabilne niż pełne hybrydy i roz­padają się w niższej temperaturze. Obserwując, w jakiej temperaturze zanika sygnał fluorescencyjny zależny od hybrydyzacji, można określić, który allel znajduje się w badanym DNA.

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO

2.3.1 Analiza sprzężeń jest podstawą mapowania genetycznego

Teraz, kiedy zebraliśmy zestaw markerów, dzięki którym możemy skonstruować mapę, przyjrzyjmy się samym technikom mapowania. Wszystkie opierają się na sprzężeniu genetycznym, odkrytym przez Bate-sona, Saundersa i Punnetta w 1905 r., lecz zrozumia­nym dopiero gdy Tomasz H u n t Morgan rozpoczął swoje przełomowe badania na muszkach owocowych w latach 1910-1911. Pierwsi genetycy XX wieku roz­poznali, że geny leżą na chromosomach, a każdy chromosom dziedziczy się jako niepodzielna jednostka. Innymi słowy, jeśli dwa geny leżą na tym samym chromosomie, to są ze sobą fizycznie sprzężone i w związku z tym powinny dziedziczyć się wspólnie. Wyglądało to na bezpieczną hipotezę, jednak gdy pierwsi genetycy przeprowadzili krzyżówki genetycz­ne podobne do opublikowanych przez Mendla 40 lat wcześniej, stwierdzili, że niewiele genów wykazuje pełne sprzężenie. Pary genów dziedziczyły się albo niezależnie, jak geny z różnych chromosomów, albo jeśli wykazywały sprzężenie, było to jedynie sprzęże­nie częściowe: czasem dziedziczyły się razem, a cza­sem nie (rys. 2.8). Rozwiązanie tej sprzeczności między teorią a doświadczeniem było milowym krokiem w roz­woju technik mapowania genetycznego.

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 23

„ C h i p " D N A

G ę s t o u ł o ż o n e cząsteczk i D N A d o r ó w n o l e g ł y c h anal iz h y b r y d y z a c y j n y c h

„Chip" D N A zaprojektowano, by umożliwić przeprowadzanie

jednocześnie wielu eksperymentów hybrydyzacyjnych. Jego

głównym zastosowaniem jest poszukiwanie pol imorf izmów,

takich jak SNP (sekcja 2.2.2), i porównywanie populacji RNA

z różnych komórek (sekcja 5.4.1). Może być także stosowany

w nowych metodach sekwencjonowania D N A (sekcja 4.1.2).

„ C h i p " D N A niesie dużą liczbę sond D N A , każdą o innej

sekwencji i umieszczoną w określonym miejscu na powierz­

chni płytki. Sondy mogą być syntetycznymi oligonukleotydami

lub innymi krótk imi cząsteczkami D N A , takimi jak k o m ­

p l e m e n t a r n y D N A ( c D N A - ang. complementary D N A ;

patrz rys. 3.11, s. 50). W najwcześniejszych metodach oligo­

nukleotydy lub c D N A nanoszono na szkiełka mikroskopowe

lub błonę nylonową, by utworzyć m i k r o p a n e l e . W ten

sposób można było osiągnąć stosunkowo małą gęstość,

przeważnie 6400 kropek na powierzchni 18 mm na 18 mm

ustawionych 80 x 80. Aby stworzyć panele o dużym zagęsz­

czeniu, potrzebna była bardziej rozwinięta technologia. Roz­

wiązaniem okazała się synteza ol igonukleotydów in situ na

powierzchni płytki, co wymagało rozszerzenia metodologii

stosowanej w syntezie oligonukleotydów, jak pokazano na

rysunku obok. Zwykła metoda obejmuje dodawanie nukleo-

t y d ó w jeden po drugim do rosnącego końca; sekwencja

zależała od tego, k t ó r y z substratów d N T P dodano do

mieszaniny reakcyjnej. Taka metoda zastosowana do paneli

D N A zaowocowałaby wszystkimi oligonukleotydami o takiej

samej sekwencji. Zamiast tego używa się substratów d N T P

zmodyfikowanych tak, że przed przyłączeniem do końca

rosnącego oligonukleotydu wymagają aktywacji świetlnej.

d N T P dodaje się jeden po drugim do powierzchni płytki, a do

skierowania pulsów światła na konkretne pozycje, czyli okreś­

lenia, który z rosnących oligonukleotydów zostanie wydłużony

o dany d N T P , używa się fotolitografii.

W ten sposób można osiągnąć gęstość do jednego miliona

ol igonukleotydów na c m 2 (Ramsay, 1998), co przy poszuki­

waniu SNP pozwala typować pół miliona pol imorf izmów

w jednym eksperymencie, zakładając, że są oligonukleotydy

dla obu alleli SNP. „ C h i p " D N A nie jest trudny w użyciu

(patrz rysunek poniżej). Aby umożliwić zajście hybrydyzacji,

zwykta synteza

dodawanie tylko do zaktywowanych oligonukleotydów

„chip" inkubuje się z wyznakowanym docelowym D N A .

Przez skanowanie powierzchni płytki i zapisanie pozycji,

w których w y k r y t o emisję sygnału wysyłanego przez znacznik,

określa się, k t ó r e oligonukleotydy zhybrydyzowały z D N A .

Do mikropaneli o małej gęstości można stosować znaczniki

izotopowe, wykrywane elektronicznie za pomocą urządzenia

o nazwie p h o s p h o r i m a g e r . Metoda ta nie zapewnia jednak

rozdzielczości odpowiedniej dla paneli o dużej gęstości, do

nich niezbędne jest więc użycie znacznika fluorescencyjnego

(Metody badań 3.3, s. 46). Sygnał fluorescencyjny w y k r y w a się

przez skanowanie laserem czy bardziej r u t y n o w o - fluores­

cencyjnym mikroskopem konfokalnym.

dodawanie do wszystkich oligonukleotydów

synteza aktywowana światłem

DNA wyznakowany fluorescencyjnie

mikroskopia konfokalna „chip" DNA

hybrydyzacja

sygnały hybrydyzacji

24 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Rysunek 2.8 Częściowe sprzężenie

Częściowe sprzężenie odkryto na początku XX wieku. Pokazaną tutaj krzyżówkę przeprowadzili Bateson, Saunders i Punnett w roku 190S na grochu cukrowym. Krzyżówka rodzicielska daje wynik typowy dla krzyżówek dwupunktowych (patrz ramka 2. /, s. I 7), gdzie

wszystkie rośliny F1 mają taki sam fenotyp, wskazując, że za f ioletowe kwiaty i podłużne ziarna pyłku odpowiadają allele dominujące. Nieoczekiwanie potomstwo krzyżówki F ( nie wykazywało stosunku fenotypów 9:3:3:1 (oczekiwanego dla genów na różnych chromosomach) ani 3:1 (oczekiwanego przy całkowitym sprzężeniu). Ten niezwykły stosunek jest typowy dla częściowego sprzężenia

Zachowanie się chromosomów w czasie mejozy wyjaśnia, dlaczego geny wykazują sprzężenie częściowe, a nie całkowite Przełomowego odkrycia dokonał Tomasz H u n t Mor­gan wyjaśniając zależność między sprzężeniem częś­ciowym a zachowaniem chromosomów w czasie podziału jądra komórkowego. Cytolodzy w końcu XIX wieku rozróżniali dwa typy podziału jądra: mitozę i mejozę. Powszechniejszy z nich - mitoza to proces, w którym diploidalne jądro komórki so­matycznej dzieli się na dwa potomne, wciąż di­ploidalne jądra (rys. 2.9). Aby stworzyć wszystkie komórki niezbędne w ciągu całego ludzkiego życia, potrzeba około 101 7 mitoz. Zanim rozpocznie się mitoza, każdy chromosom w jądrze replikuje się, ale kopie nie od razu oddzielają się od siebie. Na początku pozostają połączone w swoich centrome-rach i nie rozłączają się do momentu, gdy chro­

mosomy są rozdzielane między dwa nowe jądra w czasie mitozy. Szczególnie istotne jest, że każde potomne jądro otrzymuje pełen zestaw chromoso­mów, a większość zdarzeń, które składają się na proces mitozy, służy osiągnięciu tego celu.

Proces mitozy nie ma bezpośredniego związku z mapowaniem genetycznym. Z mapowaniem zwią­zany jest inny proces podziałowy - mejoza. Mejoza zachodzi tylko w komórkach rozrodczych. W jej wyniku z komórki diploidalnej powstają cztery hap-loidalne gamety, z których każda może połączyć się z gametą płci przeciwnej w czasie rozmnażania płcio­wego. Łatwo wyjaśnić to, że po mejozie powstają cztery komórki haploidalne. Mitoza prowadzi do powstania dwóch komórek diploidalnych: w mejozie zachodzą, jeden po drugim, dwa podziały jądra. Podstawowa różnica między mitozą i mejoza jest subtelniejsza. Przypomnijmy, że w komórce diploidal-

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 25

Rysunek 2.9 Mitoza

W interfazie, czyli okresie między podziałami jąder, chromosomy znajdują się w formie rozciągniętej (sekcja 6.1.1). Na początku mitozy chromosomy kondensują i do późnej profazy formują struktury widoczne w mikroskopie świetlnym. Każdy chromosom właśnie przeszedł replikację D N A , ale dwa potomne chromosomy są połączone centromerami. W czasie metafazy pęka błona jądrowa (u większości eukariotów) i chromosomy ustawiają się w jednej płaszczyźnie na środku komórki . Teraz mikrotubule odciągają siostrzane chromosomy w stronę przeciwnych końców komórk i . W telofazie w o k ó ł każdego zbioru potomnych chromosomów odtwarzają się błony jądrowe. Wynikiem jest powstanie z jednego jądra rodzicielskiego dwóch identycznych jąder potomnych. Dla ułatwienia pokazano tylko jedną parę chromosomów homologicznych; jeden w parze jest czerwony, a drugi - niebieski

nej są dwie oddzielne kopie każdego chromosomu (sekcja 1.1.1), nazywane chromosomami homologicz­nymi. W czasie mitozy chromosomy homologiczne pozostają oddzielone od siebie. Każdy z pary replikuje się i jest przenoszony do jądra potomnego niezależnie od swojego homologa. Natomiast w czasie mejozy chromosomy homologiczne nie zachowują się nieza­leżnie. W pierwszym podziale mejotycznym każdy chromosom łączy się z homologiem tworząc biwalent (rys. 2.10). Zachodzi to po replikacji każdego chromo­somu, ale przed rozdzieleniem zreplikowanych struk­tur. Biwalent w rzeczywistości zawiera cztery kopie chromosomów, a przeznaczeniem każdej z nich jest odnalezienie drogi do jednej z czterech gamet wy­tworzonych na końcu mejozy. Wewnątrz biwalentu ramiona chromosomów (chromatydy) przechodzą fizyczne przerwanie i wymianę segmentów DNA. Proces ten nazywa się crossing-over lub rekombina­cją i został odkryty przez belgijskiego cytologa Jans-sensa w 1909 r., zaledwie na dwa lata przed tym, nim Morgan zaczął zastanawiać się nad częściowym sprzę­żeniem.

W jaki sposób odkrycie crossing-over pomogło Mor­ganowi wyjaśnić częściowe sprzężenie? Aby to zro­zumieć, musimy pomyśleć o wpływie jaki crossing-

-over może mieć na dziedziczenie genów. Rozważmy dwa geny, oba o dwóch allelach. Gen pierwszy na­zwijmy A, a jego allele A i a, zaś drugi gen B o allelach B i b. Wyobraźmy sobie teraz, że te dwa geny leżą na chromosomie 2 Drosophila melanogaster, gatunku mu­szki owocowej badanego przez Morgana. Prześledzimy teraz przebieg mejozy diploidalnego jądra, w którym jedna kopia chromosomu 2 ma allele A i B, zaś druga ma a i b. Sytuację tę ilustruje rysunek 2.11. Rozważmy dwa alternatywne scenariusze:

1) Crossing-over nie zachodzi między genami A i B. W tym przypadku dwie powstające gamety będą zawierały kopie chromosomów z allelami A i B, a pozostałe dwie będą zawierać a i b. Innymi słowy, dwie gamety mają genotyp AB, a dwie genotyp ab.

2) Crossing-over zachodzi między genami A i B. Do­prowadzi to do wymiany segmentów DNA zawie­rających gen B między chromosomami homologicz­nymi. W końcu otrzymuje się cztery gamety o róż­nych genotypach: AB, aB, Ab, ab.

Pomyślmy teraz, co się zdarzy jeśli spojrzymy na wyniki mejozy w 100 identycznych komórkach. Jeśli nigdy nie zachodzi rekombinacja, uzyskamy gamety

centromer

późna profaza

metafaza

mikrotubule

anafaza

telofaza

interfaza

btona jądrowa

26 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Pokazano zdarzenia obejmujące jedną parę chromosomów homologicznych; jeden z chromosomów tworzących parę jest czerwony, drugi niebieski. Na początku mejozy chromosomy kondensują i każda para chromosomów homologicznych ustawia się, by utworzyć biwalent. W biwalencie może zajść crossing-over, obejmujący przerwanie ramion chromosomów i wymianę D N A . Później w mejozie następują dwa podziały jądra; wynikiem pierwszego są dwa jądra, oba z dwiema kopiami każdego chromosomu. W końcu powstają cztery jądra, każde zawierające pojedynczą kopię każdego chromosomu. Końcowe produkty mejozy - gamety są więc haploidalne. Molekularne podstawy rekombinacji opisano w podrozdziale I 3.2

o następujących genotypach:

200 AB 200 ab

Oznacza to całkowite sprzężenie: geny A i B w cza­sie mejozy zachowują się jak pojedyncza jednostka. Ale jeśli (a jest to bardziej prawdopodobne) w nie­których jądrach zajdzie rekombinacja między A i B, pary alleli nie będą dziedziczone jak pojedyncze jednostki. Załóżmy, że rekombinacja zachodzi w cza­sie 40 ze 100 mejoz. Wśród powstałych gamet będzie:

160 AB 160 ab 40 Ab 40 oB

To sprzężenie nie jest całkowite, jest tylko częściowe. Oprócz dwóch genotypów rodzicielskich (AB, ab) widzimy gamety o genotypach zrekombinowanych (Ab, aB).

Od częściowego sprzężenia do mapowania genetycznego Kiedy Morgan zrozumiał, jak można wytłumaczyć częściowe sprzężenie przez crossing-over zachodzący w czasie mejozy, wymyślił sposób mapowania względ­nych pozycji genów na chromosomie. W rzeczywistości kluczowego odkrycia nie dokonał sam Morgan, ale student pracujący w jego laboratorium, Artur Stur-tevant (Sturtevant, 1913). Stwierdził on, że crossing--over jest zjawiskiem losowym, z czego wynika, że prawdopodobieństwo jego zajścia w każdej pozycji wzdłuż pary równolegle ułożonych chromatyd jest jednakowe. Jeśli to założenie jest prawdziwe, to dwa blisko siebie położone geny będą rozdzielane przez rekombinację rzadziej niż dwa geny bardziej od siebie oddalone. Idąc dalej - częstość, z którą geny będą rozprzęgane przez crossing-over, będzie wprost pro­porcjonalna do ich odległości na chromosomie. Częs­tość rekombinacji jest więc miarą odległości między dwoma genami. Jeśli uda się określić częstość rekom-

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 27

Rysunek 2.1 I W p ł y w crossing-over na sprzężone geny

Rysunek pokazuje parę chromosomów homologicznych jeden czerwony, a drugi niebieski. A i B są sprzężonymi genami o allelach A, a, 8 i fa. Z lewej strony pokazano mejozę, w której między A i B nie zaszedł crossing-over. Dwie otrzymane gamety mają genotyp AB, a pozostałe dwie ab. Z prawej strony między A i B zaszedł crossing-over: cztery gamety wykazują wszystkie możl iwe genotypy: AB, aB, Ab i ab

binacji dla różnych par genów, można skonstruować mapę ich względnych pozycji na chromosomie (rys. 211):

Okazało się, że założenie Sturtevanta o losowości crossing-over nie było do końca uzasadnione. Porów­nania między mapami genetycznymi a rzeczywistymi pozycjami genów w cząsteczkach DNA określonymi przez mapowanie fizyczne i sekwencjonowanie DNA wykazały, że w niektórych obszarach chromosomów,

nazywanych gorącymi punktami rekombinacji, cros­sing-over zachodzi częściej niż w innych. Oznacza to, że odległość na mapie genetycznej niekoniecznie odzwierciedla fizyczną odległość między dwoma mar­kerami. Teraz zdajemy sobie także sprawę z tego, że pojedyncza chromatyda może brać udział w więcej niż jednym akcie rekombinacji jednocześnie, ale też że odległość, w której te dwie rekombinacje mogą zajść, jest ograniczona. Prowadzi to do dalszych niedokład-

28 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Rysunek 2.12 Tworzenie mapy genetycznej na podstawie częstości rekombinacji

Przykład zaczerpnięto z oryginalnych eksperymentów z muszką owocową przeprowadzonych przez Artura Sturtevanta. Wszystkie cztery geny są potożone na chromosomie X muszki owocowej. Pokazano częstości rekombinacji między genami wraz z wydedukowanymi na ich podstawie pozycjami genów na mapie

ności w procedurze mapowania. Niezależnie od tych zastrzeżeń analiza sprzężeń zwykle prowadzi do prawidłowych wniosków o porządku genów, a oszaco­wania odległości są wystarczająco dokładne do stworze­nia m a p genetycznych nadających się do zastosowania jako szkic w projektach sekwencjonowania genomów.

2.3.2 Przeprowadzanie analizy sprzężeń u różnych typów organizmów

Aby zobaczyć, jak rzeczywiście przeprowadza się anali­zę sprzężeń, powinniśmy rozważyć trzy różne sytuacje:

• Analiza sprzężeń u organizmów takich jak muszka owocowa i mysz, które można poddawać planowa­nym eksperymentom hodowlanym.

• Analiza sprzężeń u ludzi, na których nie można przeprowadzać planowanych eksperymentów, można jednak wykorzystać rodowody rodzin.

• Analiza sprzężeń u bakterii, które nie przechodzą mejozy.

Analiza sprzężeń, gdy możliwe sq planowane eksperymenty hodowlane Pierwszym typem analizy sprzężeń jest nowoczesne uzupełnienie metody wynalezionej przez Morgana i jego współpracowników. Metoda opiera się na ana­lizie potomstwa z eksperymentalnych krzyżówek mię­dzy rodzicami o znanych genotypach i można ją stosować, przynajmniej w teorii, u wszystkich euka-riotów. Względy etyczne wykluczają jej zastosowanie u ludzi, a problemy praktyczne, takie jak długość

ciąży czy czas potrzebny potomstwu do osiągnięcia dojrzałości (a więc uczestniczenia w następnych krzy­żówkach) ograniczają efektywność metody w stosunku do niektórych zwierząt i roślin.

Jeśli wrócimy do rysunku 2.11, zobaczymy, że kluczem do mapowania genetycznego jest możliwość ustalenia genotypów gamet powstałych po mejozie. W kilku przypadkach jest to możliwe przez bezpośrednie badanie gamet. Na przykład gamety wytwarzane przez niektóre mikroorganizmy eukariotyczne, z Saccharomy-ces cerevisiae włącznie, można hodować jako kolonie komórek haploidalnych i określać ich genotyp stosując testy biochemiczne. Bezpośrednie genotypowanie ga­met jest także możliwe u wyższych Eukaryota z użyciem markerów DNA. DNA z pojedynczego plemnika może służyć do przeprowadzenia reakcji PCR, umożliwiając oznaczenie RFLP, SSLP i SNP. Niestety analizy DNA z plemników są dość pracochłonne. Rutynowej analizy sprzężeń u wyższych Eukaryota nie przeprowadza się więc bezpośrednio badając gamety, lecz ustalając genotypy diploidalnego potomstwa powstałego z fuzji dwóch gamet, po jednej od każdego z rodziców. Innymi słowy przeprowadza się krzyżówkę genetyczną.

Komplikacją krzyżówki genetycznej jest to, że uzys­kane potomstwo nie jest wynikiem jednej, lecz dwóch mejoz (jednej u każdego z rodziców), a u większości organizmów przypadki rekombinacji są równie praw­dopodobne w czasie tworzenia gamet zarówno męs­kich, jak i żeńskich. Musimy w jakiś sposób móc wyłonić z genotypów diploidalnego potomstwa przy­padki rekombinacji, które zaszły w obu tych mejozach. Oznacza to, że krzyżówkę należy przeprowadzać bardzo starannie. Standardowo wykorzystuje się krzy-

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 29

żówkę testową. Ilustruje ją rysunek 2.13, scenariusz 1, gdzie przeprowadziliśmy krzyżówkę testową, by zma-pować dwa spotkane wcześniej geny A (allele A i a) i B (allele B i b), oba z chromosomu 2 muszki owocowej. Istotną cechą testu jest genotyp każdego z rodziców:

• Jeden z rodziców jest podwójną heterozygotą. Oznacza to, że u tego rodzica obecne są wszystkie cztery allele: jego genotyp to AB/ab. Podwójne heterozygoty otrzymuje się przez skrzyżowanie dwóch linii czystych, na przykład AB/ABxab/ab (patrz ramka 2.1, s. 17).

• Drugi z rodziców jest pochodzącą z linii czystej podwójną homozygotą. Obie kopie homologicz­nych chromosomów 2 u tego rodzica są takie same: w przykładzie przedstawionym w scenariuszu 1 obie mają allele a i b, więc genotyp ab/ab.

Podwójne heterozygoty mają genotyp taki sam jak komórka, której mejozę prześledziliśmy na rysunku 2.11. Naszym celem jest wywnioskowanie, jakie były genotypy gamet wytworzonych przez tego rodzica i obliczenie frakcji rekombinantów. Zauważ, że gamety

produkowane przez drugiego z rodziców, będącego podwójną homozygotą, będą mieć genotyp ab niezależ­nie, czy będą gametami rodzicielskimi, czy po rekom­binacji. W rezultacie mejoza u tego rodzica w czasie badania genotypów potomstwa jest „niewidoczna" co oznacza, że jak pokazuje scenariusz 1 na rys. 2.13, genotypy diploidalnego potomstwa można jednoznacz­nie przyporządkować genotypom gamet od rodzica będącego podwójną heterozygotą. Krzyżówka testowa umożliwia bezpośrednie przebadanie pojedynczej me-jozy, a zatem obliczenie częstości rekombinacji i zma-powanie odległości dwóch genów.

Należy rozważyć jeszcze jeden punkt. Jeśli, jak na rysunku 2.13 w scenariuszu 1, stosuje się markery genowe wyrażające dominację lub recesywność, rodzic będący podwójną homozygotą musi mieć oba allele warunkujące fenotyp recesywny. Jeżeli jednak stosuje się kodominujące markery DNA, rodzic będący po­dwójną homozygotą może mieć jakąkolwiek kombina­cję alieli homozygotycznych (tzn. AB/AB, Ab/Ab, aB/aB, ab/ab). Powody ku temu pokazuje scenariusz 2 na rysunku 2.13.

Scenariusz I A i B są markerami genetycznymi A i 6 są dominujące względem o i b

Scenariusz 2 A i B są markerami genetycznymi A i 8 są kodominujące względem o i b

RODZICE

1 x 2 AB/ab ab/ab

krzyżówka testowa

RODZICE

1 x 2 AB/ab Ab/Ab

AB Ab aB ab

ab ab ab ab

gamety

AB Ab aB ab

Ab Ab Ab Ab

Każdy fenotyp jest taki sam jak gemeta rodzica I

Genotyp gamet rodzica I identyfikuje się na podstawie wykrytych alieli: Jeśli wykryto tylko A, gameta rodzica I byłaA. Jeśli wykryto A+a, to gameta rodzica I była a itd.

Rysunek 2.13 Dwa przykłady krzyżówki testowej

W scenariuszu I - A i B są markerami genetycznymi o allelach A, o, B i b. Uzyskane potomstwo liczy się badając jego fenotypy. Ponieważ rodzic będący podwójną homozygotą (rodzic 2) ma dwa allele recesywne, o i b, nic nie wnosi do fenotypów potomstwa. Fenotyp każdego osobnika z pokolenia F1 jest więc taki sam jak gamety od rodzica I, z której powstał dany osobnik. W scenariuszu 2 - A i B są markerami D N A , których pary alieli są kodominujące. W tym konkretnym przypadku rodzic będący podwójną homozygotą ma genotyp Ab/Ab. Allele obecne u każdego osobnika z pokolenia F1 wykrywa się bezpośrednio, na przykład techniką PCR. Kombinacje alieli pozwalają wydedukować genotypy gamet rodzica I, z których powstał każdy osobnik

GENOTYPY F1 FENOTYPY GENOTYPY F1 WYKRYTE ALLELE

ABab AB ABAb A+B+b Abab Ab AbAb A+b aBab aB aBAb A+a+B+b abab ab abAb A+a + b

30 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

Ramka 2.2: Krzyżówki wielopunktowe

Dokładność analizy sprzężeń jest większa, jeśli w jednej krzyżówce śledzi się więcej niż dwa markery. Nie tylko pozwala to szybciej uzyskać częstość rekombinacji, ale także, przez prostą analizę danych, umożliwia ustalenie względnego porządku markerów na chromosomie. Dzieje się tak dlatego, że aby w zestawie trzech markerów środkowy oddzielić od dwóch markerów zewnętrznych, potrzeba dwóch zdarzeń rekombinacyjnych. A dwa zewnętrzne markery można roz­dzielić przez tylko jedną rekombinację.

pojedynczy crossing-over

D £ F d E F

Ponieważ podwójna rekombinacja jest mniej prawdopodobna

niż pojedyncza, oddzielenie środkowego markera od pozo­

stałych będzie zachodzić stosunkowo rzadko. Przykład danych

otrzymanych z krzyżówki t rzypunktowej pokazano w tabelce. Krzyżówkę przeprowadzono między potrójną heterozygotą

(ABC/abc) i potrójną homozygotą (abcłabc). Najliczniejszą

klasę stanowi p o t o m s t w o mające jeden z dwóch genotypów

rodzicielskich pochodzące ż przypadków braku rekombinacji

w obszarze zawierającym markery A, B i C. Dwie następne

klasy potomstwa są stosunkowo częste (51 i 63 osobniki

w niniejszym przykładzie). Każda z nich powstała z pojedyn­

czej rekombinacji. Analiza ich genotypów wskazuje, że w pier­

wszej z tych dwóch klas marker A został rozprzęgnięty od

markerów B i C, a w klasie drugiej marker B został rozprzęg­

nięty od A i C. Wnioskiem jest, że A i B są markerami

zewnętrznymi. Potwierdza to liczba potomstwa, u którego

marker C został rozprzęgnięty od A i B. Jest ich tylko dwoje,

co wskazuje, że do powstania tego genotypu potrzebna jest

podwójna rekombinacja. Marker C znajduje się więc między

A i B .

Genotypy potomstwa

ABC/abc abc/abc

aBC/abc Abc/abc

AbC/abc abc/abc

ABc/obc abC/abc

Liczba potomstwa

987

51

63

2

Wywnioskowane przypadki rekombinacji

brak (genotypy rodzicielskie)

jeden, między A i B, C

jeden, między B i A,C

dwa: jeden między C i A oraz jeden między C i B.

Mapowanie genów przez analizę rodowodów u człowieka

Oczywiście u ludzi niemożliwy jest dobór genotypów rodziców i przeprowadzenie krzyżówki zaprojektowa­nej specjalnie tak, aby była użyteczna w mapowaniu. Zamiast tego, dane do obliczenia częstości rekombinacji trzeba uzyskać przez badanie genotypów kolejnych pokoleń istniejących rodzin. Wynika z tego, że dostęp­ne dane są ograniczone, a ich interpretacja trudna. Ludzkie małżeństwa rzadko stanowią odpowiednią krzyżówkę testową, a genotypów jednego lub większej liczby członków rodziny często nie można zbadać z powodu ich śmierci lub niechęci do współpracy.

Problem obrazuje rysunek 2.74. W tym przykładzie badamy chorobę dziedziczną obecną w rodzinie zło­żonej z dwojga rodziców i sześciorga dzieci. Choroby genetyczne są często stosowanymi markerami gene­tycznymi u ludzi. Stan choroby jest jednym allelem, a zdrowia drugim. Rodowód na rysunku 2.14A poka­zuje, że matka jest chora tak jak i czworo jej dzieci. Wiemy z wywiadu rodzinnego, że babka ze strony matki również cierpiała na tę chorobę, ale zarówno ona, jak i jej mąż - dziadek ze strony matki nie żyją. Możemy włączyć ich do rodowodu zaznaczając, że nie

żyją, przez przekreślenie symbolu, jednak nie uzys­kamy żadnych dalszych wiadomości o ich genotypach. Naszym celem jest zmapowanie pozycji genu od­powiedzialnego za chorobę genetyczną i w tym celu prześledzimy jej sprzężenie z mikrosatelitarnym mar­kerem M, którego cztery allele - M1 M2, M3 i M4 są obecne u żyjących członków rodziny. Pytanie brzmi: jak wiele dzieci jest rekombinantami?

Jeśli spojrzymy na genotypy sześciorga dzieci, zoba­czymy, że 1, 3 i 4 mają allele odpowiedzialne za chorobę i mikrosatelitarne allele M1. Natomiast 2 i 5 ma­ją allel odpowiadający zdrowiu i M?. Możemy więc postawić dwie alternatywne hipotezy. Pierwsza: dwie kopie chromosomów homologicznych matki mają genotyp choroba-M 1 i zdrowie-M 2, w wyniku czego dzieci 1, 2, 3, 4 i 5 mają genotypy rodzicielskie, a szóste dziecko jest jedynym rekombinantem (rys. 2.14B). Sugerowałoby to, że gen warunkujący chorobę i mik-rosatelita są względnie blisko sprzężone i rekombinacja między nimi zachodzi rzadko. W hipotezie alternatyw­nej zakłada się, że chromosomy matczyne mają geno­typy zdrowie-M, i choroba-M 2, dzieci 1-5 są rekom­binantami, a numer sześć typem rodzicielskim, co by oznaczało, że geny są położone na chromosomie

podwójny crossing-over

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 3 I

(A) Rodowód

(B) Możliwe interpretacje rodowodu

CHROMOSOMY MATKI

DZIECKO I

DZIECKO 2

DZIECKO 3

DZIECKO 4

DZIECKO 5

DZIECKO 6

choroba M1

zdrowie M2

choroba M1

choroba M1

zdrowie M2

choroba M2

hipoteza I

choroba M1

zdrowie M2

rodzicielski

rodzicielski

rodzicielski

rodzicielski

rodzicielski

zrekombinowany

hipoteza 2

zdrowie M1

choroba M2

zrekombinowany

zrekombinowany

zrekombinowany

zrekombinowany

zrekombinowany

rodzicielski

częstość rekombinacji 1/6 = 6,7% 5/6 = 83,3%

(C) „Wskrzeszenie" babki ze strony matki

allel choroby musi być sprzężony z M1

HIPOTEZA I JEST PRAWDZIWA

Rysunek 2.14 Przykład analizy r o d o w o d ó w u człowieka

(A) Rodowód przedstawia dziedziczenie choroby genetycznej w rodzinie: dwojga żyjących rodziców i sześciorga dzieci oraz według informacji o babce ze strony matki - z wywiadu rodzinnego. Allel warunkujący chorobę (pełne symbole) dominuje nad allelem prawidłowym (puste symbole). Naszym zadaniem jest ustalenie stopnia sprzężenia między genem warunkującym chorobę a mikrosatelitą M przez typowanie alleli tego mikrosatelity ( M ( , M2, itd.) u żyjących członków rodziny. (B) Rodowód można zinterpretować na dwa różne sposoby. Hipoteza I zakłada małą częstość rekombinacji i wskazuje, że gen odpowiedzialny za chorobę jest blisko sprzężony z mikrosatelitą M. Hipoteza 2 sugeruje, że gen i mikrosatelita są znacznie słabiej sprzężone. W (C) problem zostaje rozwiązany przez ponowne pojawienie się babki ze strony matki; genotyp mikrosatelity babki jest zgodny wyłącznie z hipotezą I. Więcej szczegółów w tekście

LEGENDA

zdrowa kobieta chora kobieta zdrowy mężczyzna chory mężczyzna zmarły

32 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

względnie daleko od siebie. Nie możemy ustalić, która z hipotez jest prawidłowa: dane są frustrująco niejed­noznaczne.

Najbardziej satysfakcjonującym rozwiązaniem prob­lemu postawionego przez rodowód na rysunku 2.14 byłaby znajomość genotypu babki. Załóżmy na chwilę, że jesteśmy w serialu telewizyjnym w rodzaju „Dynas­tii" i babka w rzeczywistości nie umarła, natomiast ku

(A) Koniugacja

nukleoid

plazmidy

dawca biorca

(B) Transdukcja

DNA bakterii bakteriofag

(C) Transformacja

ogólnemu zaskoczeniu pojawia się ponownie w chwili odpowiedniej, by uratować wciąż malejącą oglądal­ność. Okazuje się, że jej genotyp pod względem mikrosatelity M to M1M5 (rys. 2.14C). To oznacza, że allel odpowiedzialny za chorobę i M1 znajdują się blisko siebie, na tym samym chromosomie. Teraz z pewnością możemy stwierdzić, że prawidłowa jest hipoteza 1 i tylko dziecko 6 jest rekombinantem.

Zmartwychwstanie kluczowych osobników zwykle nie jest opcją dostępną dla prawdziwego genetyka, chociaż DNA można uzyskać nawet ze zwłok lub kości ludzi nieżyjących. Niepełne rodowody analizuje się statystycznie stosując miarę zwaną lod score (Morton, 1995). Nazwa pochodzi od logarytmu prawdopodobień­stwa (ang. logarithm of the odds), że geny są sprzężone. Miary tej używa się na początku do ustalenia, czy badane markery leżą na jednym chromosomie, innymi słowy - czy geny są sprzężone, czy nie. Jeśli analiza lod score ustali sprzężenie, można następnie określić miarę najbardziej prawdopodobnej częstości rekombinacji. W sytuacji idealnej dane będą pochodzić z więcej niż jednego rodowodu, podnosząc wiarygodność wyniku. Analiza jest mniej niejednoznaczna dla rodzin z większą liczbą dzieci i, jak widzieliśmy na rysunku 2.14, istotna jest możliwość genotypowania przynajmniej trzech pokoleń. Z tego powodu stworzono kolekcje rodzin, takie jak zebrana przez Centre d'Etudes du Polymorphi-sme Humaine (CEPH) w Paryżu (Dausset i wsp., 1990). Kolekcja CEPH zawiera hodowlane linie komórkowe z rodzin, w których można przebadać wszystkich czworo dziadków, jak też co najmniej ośmioro dzieci z drugiego pokolenia. Kolekcja jest dostępna do mapo­wania markerów DNA dla każdego badacza, który zgadza się dostarczyć uzyskane dane do centralnej bazy danych CEPH (patrz Badania i odkrycia 2.1).

Mapowanie genetyczne u bakterii Ostatnim typem mapowania genetycznego, którym się zajmiemy, jest podejście stosowane u bakterii. Główną trudnością, z którą spotykają się genetycy próbujący rozwinąć techniki mapowania dla bakterii, jest brak mejozy u tych haploidalnych organizmów. Trzeba było wymyślić inny sposób wprowadzenia rekombinacji między homologiczne segmenty bak­teryjnego DNA. Rozwiązaniem stało się wykorzystanie

Rysunek 2.1 5 Trzy sposoby uzyskania transferu D N A między bakteriami

(A) Koniugacja może spowodować transfer chromosomowego lub plazmidowego D N A z bakterii będącej dawcą do biorcy. Koniugacja obejmuje fizyczny kontakt między dwiema bakteriami i przeniesienie zachodzące przez wąską rurkę zwaną pila. (B) Transdukcja to przeniesienie małego segmentu D N A z komórki dawcy za pośrednictwem bakteriofaga. (C) Transformacja jest podobna do transdukcji, ale przenoszony D N A jest „nagi". Zdarzenia przedstawione w (B) i (C) często wiążą się ze śmiercią komórki dawcy. W (B) śmierć następuje, gdy bakteriofag opuszcza komórkę dawcy; w (C) usunięcie D N A z komórki dawcy jest przeważnie konsekwencją naturalnej śmierci komórki

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 33

Mapa genetyczna człowieka

Jednym z pierwszych celów Projektu Poznania Genomu Człowieka była mapa genetyczna o gęstości przynajmniej jednego markera na każde I Mb genomu. Cel ten osiągnięto w 1994 r. Opisana tu publikacja, wydana dwa lata później, prezentuje mapę genetyczną o gęstości markerów wynoszącej średnio jeden na 0,6 Mb.

Mapę oparto na 5264 mikrosatelitach (sekcja 2.2.2) typu AC/TG:

5' - ACACACACACAC - 3' 3' - TGTGTGTGTGTG - 5'

Były dwie przyczyny, dla których wybrano mikrosatelity o tej konkretnej sekwencji. Po pierwsze są one częste w genomie, po kilka na każdy Mb DNA, co zapewnia stopień pokrycia odpowiedni do mapowania o dużej gęstości. Po drugie, ten typ mikrosatelity jest bardzo zmienny, wy­stępuje po kilka alleli każdego z nich w całej populacji. W praktyce oznacza to, że wykazują dużą heterozygo-tyczność, czyli wysokie prawdopodobieństwo, że przypad­kowo wybrana z populacji osoba będzie heterozygotą pod względem tego konkretnego mikrosatelity. Średnia hete-rozygotyczność wszystkich markerów użytych do badania wynosiła 0,7 (prawdopodobieństwo 7 na 10, że osobnik będzie heterozygotą), a tylko 7% markerów miało hete-rozygotyczność mniejszą niż 0,5.

Do wykonania większości mapowania użyto materiału pochodzącego od ośmiu rodzin z kolekcji CEPH. Rodziny te obejmowały 134 osoby i pozwalały na prześledzenie 186 mejoz. Uzyskane dane wykorzystano do stworzenia map chromosomów od I do 22. Aby zmapować chromosom X, włączono jeszcze 12 rodzin (170 osób, o 105 mejoz więcej). Dodatkowe dane były potrzebne, ponieważ przypadki rekom­binacji pomiędzy markerami sprzężonymi z X są w rodowo­dach rzadsze, gdyż mężczyźni mają tylko jeden chromosom X.

Mapa Analiza sprzężeń pozwoliła przypisać 5264 markery do 2335 pozycji chromosomowych. Liczba pozycji jest mniejsza niż liczba markerów, ponieważ niektóre mikrosatelity leżą zbyt blisko siebie, by je rozdzielić; dlatego zostały zmapowane w tej samej pozycji. Średnia gęstość dla całej mapy wyniosła jeden marker na 599 kb, sięgając od jednego na 495 kb dla chromosomu 17 do jednego markera na 767 kb dla chromo­somu 9. Tylko w trzech miejscach w genomie najbliższe siebie markery wydawały się odległe o więcej niż 4 Mb DNA. Podejrzewa się, że te przerwy w rzeczywistości nie są tak wielkie, jak się wydają, prawdopodobnie w związku z gorą­cymi punktami rekombinacji (patrz s. 27). Dwa markery po przeciwnych stronach takiego miejsca będą wydawać się bardziej oddalone, niż są w rzeczywistości, z powodu dużej częstości rekombinacji zachodzącej między nimi.

Krótko po publikacji mapy genetycznej ukończono mapę fizyczną o gęstości markerów sięgającej jeden na 100 kb. (Patrz Badania i odkrycia 3.1, s. 56). Ta i inne mapy fizyczne

obejmują pozycje 7000 mikrosatelitów obecnych na mapie genetycznej, umożliwiając integrację obu typów map w jedną obszerną mapę genomu człowieka.

Mapa mikrosatelitów w genomie człowieka

Każda czerwona kreska oznacza jedną z 2335 pozycji, w których zostaty zmapowane markery mikrosatelitarne. Przedrukowano za zgodą z: Dib C et al., Nature, 380, 152-154. Copyright 1996 Macmillan Magazines Limited

Literatura cytowana Dib C, Fuare S, Fizames C, et al. (1996) A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380, 152-154.

34 ROZDZIAŁ 2 • MAPOWANIE GENOMÓW TECHNIKAMI GENETYCZNYMI

dawca biorca

(A) Transfer kolejnych markerów w czasie koniugacji

(B) Jednoczesny transfer blisko sprzężonych markerów w czasie transdukcji lub transformacji

Rysunek 2.16 Podstawy mapowania genów u bakterii

Powyższy rysunek pokazuje transfer funkcjonalnego genu odpowiedzialnego za syntezę tryptofanu z dzikiej bakterii (o genotypie opisywanym jako trp+) do biorcy, któremu brakuje działającej kopii tego genu (trp~). Biorcę nazywa się auksotrofem t ryptofanowym (słowo używane do opisania zmutowanej bakterii, która może przeżyć tylko wówczas, gdy dostarczy się jej odpowiedniego składnika odżywczego - w t y m przypadku tryptofanu, który nie jest konieczny dla typu dzikiego, patrz sekcja 13.1.2). Po transferze potrzebna jest podwójna rekombinacja, by przeniesiony gen włączył się do chromosomu komórki biorcy, zmieniając fenotyp biorcy z trp- na trp+. (A) W czasie koniugacji D N A przenoszony jest z dawcy do biorcy w taki sposób, jak przeciąga się strunę przez rurkę. Względne pozycje markerów w cząsteczce D N A można zmapować ustalając czas, po którym markery pojawiają się w komórce biorcy. W pokazanym przykładzie markery A, B i C są przenoszone odpowiednio po 8, 20 i 30 minutach od rozpoczęcia koniugacji. Przeniesienie całego genomu £. coli zajmuje około 100 minut. (B) Aby zostać wspólnie przeniesione w czasie transdukcji lub transformacji, dwa markery (lub więcej) muszą być ściśle sprzężone, ponieważ zwykle procesy te umożliwiają przeniesienie z dawcy do biorcy mniej niż 50 kb DNA. Mapowanie z użyciem transdukcji i transformacji stosuje się do ustalenia względnych pozycji markerów położonych zbyt blisko siebie, aby zmapować je precyzyjnie stosując koniugację. Dalsze szczegóły - patrz Freifelder (1987)

2.3 SPOSOBY PODEJŚCIA DO MAPOWANIA GENETYCZNEGO 35

jednej z trzech istniejących metod przenoszenia frag­mentów DNA z jednej bakterii do drugiej (rys. 2.15):

1) Koniugacja, w czasie której dwie bakterie zbliżają się fizycznie i jedna z nich (dawca) przekazuje DNA drugiej bakterii (biorcy). Przeniesiony DNA może być kopią części lub, jeśli to możliwe, całości chromosomu komórki dawcy, albo też segmentem chromosomowego DNA długości do 1 Mb, włączo­nym do plazmidu (sekcja 1.2.2). Ten drugi przypa­dek nazywa się transferem episomu.

2) Transdukcja, która obejmuje przeniesienie małych (do ok. 50 kb) segmentów DNA z dawcy do biorcy za pośrednictwem bakteriofaga.

3) Transformacja, gdy komórka biorcy pobiera ze środowiska fragmenty DNA pochodzące z komórki dawcy, rzadko dłuższe niż 50 kb.

Po przeniesieniu musi zajść podwójna rekombinacja, tak aby DNA z bakterii dawcy włączył się do chromo­somu komórki biorcy (rys. 2.16A). Jeśli to się nie zdarzy, przeniesiony DNA jest gubiony w czasie podziału komórki biorcy. Jedynym wyjątkiem jest transfer episomu, gdyż plazmidy mogą się namnażać niezależnie od chromosomu gospodarza.

Tutaj też używa się markerów biochemicznych, fenotypem dominującym lub typu dzikiego jest pewna cecha biochemiczna (np. zdolność syntezy tryptofanu; wrażliwość na antybiotyk *), a fenotypem recesywnym - cecha przeciwna (np. brak zdolności syntezy tryptofa­nu, oporność na antybiotyk). Transfer genu przeważnie przeprowadza się między dawcą mającym allele dzikie a biorcą o allelach recesywnych. Przeniesienie do szczepu biorcy śledzi się poszukując pojawienia się u biorcy funkcji biochemicznych określanych przez badane geny (rys. 2.16B). Szczegóły procedury mapo­wania zależą od używanego typu transferu genów. W mapowaniu koniugacyjnym DNA dawcy jest prze­noszony do biorcy jako ciągła nitka, a pozycje genów mapuje się przez oznaczenie czasu wejścia alleli dzikich do biorcy. Mapowanie z zastosowaniem transdukcji i transformacji umożliwia zmapowanie genów położo­nych stosunkowo blisko siebie, ponieważ przenoszony segment DNA jest krótki (50 kb), a prawdopodobieńst­wo, że dwa geny zostaną przeniesione wspólnie, zależy od ich bliskości na chromosomie bakteryjnym.

* Wrażliwość na antybiotyki jest cechą dziką, na ogól recesywną (przyj), tłum.)

LITERATURA CYTOWANA

Collins FS, Guyer MS and Chakravart i A (1997) Variations on a theme: cataloging human D N A sequence variation. Science, 278, 1580-1581.

Dausset J, Cann H, Cohen D, et al. (1990) Program description: Centre d'Etude du Polymorphisme Humain - collaborative genetic mapping of the human genome. Genomics, 6, 575-577.

Freifelder D (1987) Microbiol Genetics. Jones & Bartlett, Boston. Mori M, Beatty PG, Graves M, Boucher KM and Milford EL (1997) HLA gene and haplotype frequencies in the N o r t h American

population. Transplantation, 65, U I. M o r t o n NE (1955) Sequential tests for the detection of linkage. Am. J. Hum. Genet., 7, 277-3 18. Orel V (1995) Gregor Mendel: The First Geneticist. Oxford University Press, Oxford. Pennisi E (1998) Sifting through and making sense of genome sequences. Science, 280, 1692-1693. Ramsay G (1998) D N A chips: state of the art. Nature Biotechnol, 16, 40-44. Sturtevant AH (1913) The linear arrangement of six sex-linked factors in Drosophila as shown by mode of association. J. Exp. Zoo/.,

14, 39-45. V e n t e r JC, Adams M D , Sutton G G , Kerlavage AR, Smith HO and Hunkapil ler M (1998) Shotgun sequencing of the human

genome. Science, 280, 1540-1542. W a n g D G , Fan J-B, Siao C-J, et al. (1998) Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in

the human genome. Science, 280, 1077-1082. Y a m a m o t o F, Clausen H, W h i t e T, M a r k e n J and H a k a m o r i S (1990) Molecular genetic basis of the histo-blood group ABO system.

Nature, 345, 229-233.

LITERATURA UZUPEŁNIAJĄCA

Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD (1994) Molecular Biology of the Cell. 3rd edition. Garland Publishing, NewYork. - Zawiera wszystkie szczegóły mitozy i mejozy.

Fincham JRS, Day PR and Radford A ( 1979) Fungal Genetics, 4th edition. Blackwell, London. - „Biblia" mapowania genów mikroorganizmów eukariotycznych.

Griffiths AJF, Miller JH, Suzuki D T , Lewontin RC and Gelbart WM (1996) An Introduction to Genetic Analysis, 6th edition. W. H. Freeman, NewYork. - Rozdziały 5 i 6 szczególnie dobrze opisują mapowanie genów za pomocą krzyżówek eksperymentalnych. Rozdział 10 dotyczy mapowania u bakterii.

Strachan T and Read AP (1996) Human Molecular Genetics. BIOS Scientific Publishers, Oxford. - Rozdział 12 obejmuje mapowanie genetyczne człowieka.

Sturtevant AH (1965) A History of Genetics. Harper and Row, N e w York. - Opisuje wczesne prace nad mapowaniem genów przeprowadzone przez Morgana i jego współpracowników.