Uniwersytet Warszawski
Wydział Biologii
Olga Anna Krysiak
Nr albumu: 305967
Analiza struktury i funkcji plazmidu pOK1
wyizolowanego egzogennie z bakterii występujących w
osadzie czynnym oczyszczalni ścieków „Czajka”
Structure and functions of plasmid pOK1 obtained by
exogenous isolation from bacteria of activated sludge
treatment plant „Czajka”
Praca licencjacka na kierunku Biotechnologia
w ramach Międzywydziałowych Indywidualnych Studiów
Matematyczno - Przyrodniczych
w zakresie Mikrobiologii
Praca wykonana pod kierunkiem
prof. dr hab. Dariusza Bartosika
w Zakładzie Genetyki Bakterii
Instytutu Mikrobiologii
Wydziału Biologii
Uniwersytetu Warszawskiego
Warszawa, wrzesień 2013
2
Oświadczenie kierującego pracą
Oświadczam, że niniejsza praca została przygotowana pod moim kierunkiem i stwierdzam, że
spełnia ona warunki do przedstawienia jej w postępowaniu o nadanie tytułu zawodowego.
Data Podpis kierującego pracą
Oświadczenie autora pracy
Świadom odpowiedzialności prawnej oświadczam, że niniejsza praca dyplomowa została
napisana przez mnie samodzielnie i nie zawiera treści uzyskanych w sposób niezgodny z
obowiązującymi przepisami.
Oświadczam również, że przedstawiona praca nie była wcześniej przedmiotem procedur
związanych z uzyskaniem tytułu zawodowego w wyższej uczelni.
Oświadczam ponadto, że niniejsza wersja pracy jest identyczna z załączoną wersją
elektroniczną.
Data Podpis autora pracy
3
Streszczenie
W niniejszej pracy zaprezentowano wyniki kompleksowej analizy bioinformatycznej
sekwencji nukleotydowej plazmidu pOK1 (41 277 pz), wyizolowanego metodą egzogenną z
bakterii osadu czynnego oczyszczalni ścieków „Czajka” w Warszawie. W plazmidzie pOK1
wyodrębniono potencjalne moduły genetyczne: (i) systemy replikacyjne (REP), (ii) systemy
odpowiedzialne za stabilne utrzymywanie plazmidu w komórce - system partycyjny (PAR) i
addykcyjny (TA), (iii) potencjalny system mobilizacji do transferu koniugacyjnego (MOB),
(iv) sekwencje insercyjne (IS) zintegrowane z genomem plazmidu oraz (v) determinanty
oporności. Przeprowadzono również analizę funkcjonalną zidentyfikowanych systemów REP
i MOB.
Słowa kluczowe
plazmid, analizy bioinformatyczne sekwencji nukleotydowej, antybiotykooporność,
horyzontalny transfer genów
Dziedzina pracy (kody wg programu Sokrates-Erasmus)
13.4 – Biotechnologia
4
Serdecznie dziękuję
Prof. dr hab. Dariuszowi Bartosikowi
za pomoc w powstawianiu tej pracy, wsparcie merytoryczne i cenne wskazówki
mgr. Marcinowi Adamczukowi
za cenne wskazówki podczas tworzenia pracy
Wszystkim Pracownikom, Koleżankom i Kolegom z Zakładu Genetyki
Bakterii
za stworzenie miłej atmosfery
5
Spis treści
Wykaz skrótów stosowanych w pracy .................................................................................... 7
Wstęp ......................................................................................................................................... 9
1. Geny oporności w środowisku ........................................................................................... 9
2. Rola oczyszczalni ścieków w generowaniu nowych oporności i ich transferze .............. 11
3. Izolacja i identyfikacja plazmidu pOK1 ........................................................................... 13
Cel pracy ................................................................................................................................. 15
Materiały ................................................................................................................................. 16
1. Szczepy i plazmidy bakteryjne ......................................................................................... 16
2. Podłoża ............................................................................................................................. 17
3. Roztwory i bufory ............................................................................................................ 18
3.1. Roztwory do izolacji DNA metodą lizy alkalicznej: ................................................ 18
3.2. Bufory i roztwory stosowane do elektroforezy DNA: .............................................. 18
3.3. Roztwory do transformacji bakterii metodą rubidowo-wapniową: ........................... 18
3.4. pozostałe bufory i roztwory:...................................................................................... 18
4. Enzymy, zestawy odczynników, wzorzec wielkości........................................................ 18
5. Odczynniki i ich pochodzenie .......................................................................................... 19
Metody (opisane według skryptu ZGB) ............................................................................... 19
1. Analiza in silico sekwencji nukleotydowych i aminokwasowych ................................... 19
2. Warunki hodowli .............................................................................................................. 21
3. Izolacja, obróbka i elektroforeza DNA ............................................................................ 21
3.1. Izolacja plazmidowego DNA w małej skali .............................................................. 21
3.2. Izolacja i wizualizacja plazmidowego DNA poprzez ekstrakcję mieszanina
fenol:chloroform ............................................................................................................... 22
3.3. Elektroforeza drobnocząsteczkowego DNA w żelu agarozowym ............................ 22
3.4. Enzymatyczna obróbka DNA .................................................................................... 22
4. Wprowadzanie DNA do komórek bakteryjnych .............................................................. 22
4.1. Transformacja komórek E. coli ................................................................................. 22
4.2. Koniugacja trójrodzicielska ....................................................................................... 23
Wyniki i Dyskusja .................................................................................................................. 24
1. Odczytanie kompletnej sekwencji nukleotydowej plazmidu pOK1 ................................ 24
2. Analiza sekwencji nukleotydowej plazmidu pOK1 ......................................................... 24
2.1. Analiza systemów replikacyjnych ............................................................................. 32
6
2.1.1. System REP1 ...................................................................................................... 32
2.1.2. System REP2 ...................................................................................................... 35
2.1.3. System REP3 ...................................................................................................... 40
2.2. Systemy odpowiedzialne za stabilne utrzymywanie plazmidu w komórce .............. 42
2.2.1. System partycyjny .............................................................................................. 43
2.2.2. Systemy toksyna-antytoksyna ............................................................................ 47
2.2.3 System restrykcji-modyfikacji ............................................................................ 51
2.3. Analiza potencjalnego systemu mobilizacji do transferu koniugacyjnego ............... 59
2.4. Inne elementy genetyczne zintegrowane z genomem plazmidu ............................... 60
2.4.1. Elementy transpozycyjne ................................................................................... 60
2.4.2. Integron .............................................................................................................. 64
2.5. Determinanty oporności ............................................................................................ 69
2.5.1. Fosfotransferaza streptomycyny ........................................................................ 69
2.5.2. Syntaza dihydroptrynianowa .............................................................................. 71
2.5.3. Białka warunkujące odporność na tetracyklinę .................................................. 71
2.5.4. Reduktaza dihydrofolianowa, acetylotransferaza aminoglikozydowa, β-
laktamaza, białko warunkujące oporność na czwartorzędowe związki amonowe ....... 73
2.6. Dodatkowy ładunek genetyczny plazmidu pOK1 ..................................................... 75
2.6.1. Transferaza adenozynofosforanu SoFic ............................................................. 75
2.6.2. Białko z rodziny SNF ......................................................................................... 76
2.6.3. Inwertaza DNA .................................................................................................. 76
2.6.4. Resolwaza ........................................................................................................... 77
2.6.5. Hipotetyczne białka o nieznanej funkcji ............................................................ 78
3. Analiza funkcjonalna wybranych modułów genetycznych plazmidu pOK1 ................... 79
3.1. Moduł replikacyjny. .................................................................................................. 79
3.1.1. Analiza funkcjonalna systemów replikacyjnych. ............................................... 79
3.1.2. Określenie zakresu gospodarzy systemów replikacyjnych pOK1. .................... 81
3.2. Badanie mobilizacji plazmidu pOK1 do transferu koniugacyjnego. ........................ 83
Wnioski .................................................................................................................................... 84
Bibliografia ............................................................................................................................. 85
7
Wykaz skrótów stosowanych w pracy
1. Skróty nazw nukleotydów:
A – adenina
C – cytozyna
G – guanina
T – tymina
N – dowolny nukleotyd
ATP – adenozynotrifosforan
cAMP – cykliczny adenozynomonofosforan
NADP – fosforan dinukleotydu nikotynoamidoadeninowego
2. Skróty nazw aminokwasów:
A – alanina N – asparagina
C – cysteina P – prolina
D – kwas asparaginowy Q - glutamina
E – kwas glutaminowy R – arginina
F – fenyloalanina S - seryna
G – glicyna T - treonina
H – histydyna V - walina
I – izoleucyna W - tryptofan
K – lizyna Y - tyrozyna
L – leucyna X – dowolny aminokwas
M – metionina
3. Pozostałe skróty:
aa – aminokwas(y) (ang. amino acid(s))
CoA – koenzym A (ang. coenzyme A)
DNA – kwas deoksyrybonukleinowy (ang. deoxyribonucleic acid)
HGT – horyzontalny transfer genów (ang. horizontal gene transfer)
HTH – motyw helisa – skręt – helisa (ang. helix – turn – helix)
IGS – region międzygenowy (ang. intergenic sequence)
IR – odwrócone powtórzenia sekwencji nukleotydowej (ang. inverted repeat)
8
IT – iteron
MGE – ruchome elementy genetyczne (ang. mobile genetic element)
NCBI – National Center for Biotechnology Information
nt – nukleotyd(y) (ang. nucleotide(s))
ORF – otwarta ramka odczytu (ang. open reading frame)
oriV – origin replikacji wegetatywnej
P – promotor
Pd – palindrom
pz – pary zasad
rbs – miejsce wiązania rybosomy (ang. ribosome binding site)
REP – moduł replikacyjny
R-M – system restrykcji – modyfikacji (ang. restriction - modification)
RNA – kwas rybonukleinowy (ang. rybonucleic acid)
TA – system toksyna – antytoksyna
TE – elementy transpozycyjnye (ang. transposable elements)
ZGB – Zakład Genetyki Bakterii
9
Wstęp
1. Geny oporności w środowisku
Nasilające się w ostatnich latach zjawisko antybiotykooporności bakterii jest niepokojącym
problemem. Niestety nie jesteśmy w stanie skutecznie przeciwdziałać powstawaniu coraz
większej liczby szczepów opornych. Dostępne dane wskazują, że w ponad 600 genomach
bakterii opornych na antybiotyki występuje ponad 1300 genów oporności (Liu i Pop, 2009),
które mogą być przenoszone miedzy bakteriami w wyniku horyzontalnego transferu genów
(HGT, ang. horizontal gene transfer).
Niekontrolowane stosowanie antybiotyków powoduje selekcję opornych szczepów
bakterii, które zaczynają dominować w różnych populacjach. Izolowane są często szczepy
wielooporne, wykazujące oporność na kilka różnych antybiotyków/chemioterapeutyków, np.
szczepy gronkowca złocistego, Staphylococcus aureus, niewrażliwe na metycylinę i
wykazujące mniejszą wrażliwość na antybiotyki glikopeptydowe oraz wankomycynę
(MRSA) (Witte, 1999).
Oporność jest często wynikiem zmniejszenia stopnia akumulacji szkodliwej substancji
we wnętrzu komórki, co jest spowodowane obecnością pomp błonowych, zwykle
charakteryzujących się szerokim spektrum substratowym (Poole, 2002). Oporność krzyżową,
wynikającą z obecności takich pomp, wykazują między innymi szczepy Pseudomonas
stutzeri, Pseudomonas areuginosa oraz mutanty mar Escherichia coli (Muñoz Bellido i wsp.,
2002). Należy zaznaczyć, że sprawcami groźnych infekcji stają się ostatnio nie tylko bakterie
uznawane od dawna za patogenne, lecz również szczepy oportunistyczne, do których zalicza
się m.in. bakterie z rodzajów Klebsiella, Serratia, Proteus i Pseudomonas (Vetter i Haver,
2002).
Często postrzegamy oporność w sposób uproszczony, tj. przyjmujemy, że szczep
bakterii jest oporny lub wrażliwy. Problematyczne jest jednak określenie progu
pozwalającego na zdefiniowanie rzeczywistej oporności. Często wzrost bakterii w obecności
niewielkiej ilości antybiotyku jest bagatelizowany, choć wiadomo, że poszczególne
mechanizmy mogą warunkować oporność na różnym poziomie. Nawet taka "szczątkowa"
oporność może pełnić ważną rolę w selekcji opornych szczepów w środowisku naturalnym.
Najpowszechniejszą odpowiedzią komórki na antybiotyk jest zahamowanie wzrostu,
czyli bakteriostaza. W leczeniu infekcji, efekt bakteriostatyczny jest często efektywny,
10
ponieważ patogeny są zabijane i usuwane z organizmu przez układ odpornościowy
gospodarza. Odmienną sytuację obserwujemy w środowisku, gdzie przenoszenie genów
oporności oraz rozprzestrzenianie się opornych szczepów jest stymulowane długotrwałą
obecnością antybiotyku w subterapeutycznym stężeniu (Kümmerer, 2004). Za główną
przyczynę wzrostu oporności uważa się nadmierne i nieuzasadnione stosowanie antybiotyków
(Séveno i wsp., 2002). Związki te są wykorzystywane nie tylko w celach leczniczych (w
medycynie i weterynarii), lecz również stosowane są jako substancje przyspieszające wzrost
zwierząt hodowlanych, a także jako związki antybakteryjne przy produkcji środków
czyszczących i dezynfekujących. Niektóre z antybiotyków stosowanych w medycynie, np.
amoksycylina i erytromycyna, są również stosowane jako promotory wzrostu zwierząt
(Sarmah i wsp., 2006). Związki te nie są całkowicie metabolizowane i trafiają do środowiska,
co stwarza warunki presji selekcyjnej (Al-ahmad i wsp., 1999).
Sugeruje się, że rozprzestrzenianiu szczepów opornych sprzyja także stosowanie
szczepionek i biocydów. Na przykład, skorelowano zastosowania szczepionki przeciwko
Streptococcus pneumoniae ze wzrostem liczby infekcji spowodowanych przez oporne
szczepy S. aureus, jednak podstawy tego zjawiska nie zostały szczegółowo zbadane (A report
from the American Society of Microbiology, 2009).
Zakłada się również, że biocydy, dodawane w stężeniach subletalnych do stosowanych
powszechnie środków czystości, prowadzą do selekcji wielu szczepów opornych. Podobną
rolę przypisuje się niektórym związkom chemicznym, m.in. związkom rtęci i srebra
(obecnym np. w wypełnieniach stomatologicznych), chininie, lekom przeciwwirusowym oraz
niektórym mikroelementom (np. cynk, arsen i miedź).
Pomimo wielu dowodów potwierdzających rolę presji antropogenicznej w
generowaniu fenotypów opornościowych, badania z ostatnich lat wskazują, że oporność nie
jest zjawiskiem nowym, istniała bowiem na długo przed odkryciem antybiotyków. Analizy
metagenomiczne starożytnego DNA, pochodzącego z osadów wiecznej zmarzliny
datowanych na 30 000 lat, pozwoliły na identyfikację genów oporności na β-laktamy,
tetracyklinę oraz antybiotyki glikopeptydowe. Stwierdzono ponadto, że kompletny wariant
genu vanA, warunkującego oporność na wankomycynę, jest podobny do współczesnego, co
dodatkowo potwierdza, że używanie antybiotyków jedynie zwiększa presję selekcyjną
szczepów opornych, lecz nie było czynnikiem indukującym powstania oporności (D’costa i
wsp., 2011).
Środowisko naturalne jest ogromnym rezerwuarem genów oporności, których źródłem
może być większość bakterii. Geny tego typu często pochodzą ze szczepów produkujących
11
antybiotyki, gdzie chronią komórki gospodarza przed szkodliwym działaniem wytwarzanych
przez nie związków. Oporność często związana jest z obecnością wspomnianych wcześniej
pomp usuwających niepożądane substancje z komórki. Pompy tego typu kodowane są nie
tylko przez szczepy produkujące antybiotyki. Prawdopodobnie pełnią one również ważne
funkcje m.in. w usuwaniu metabolitów pośrednich, wirulencji, czy sygnalizacji
międzykomórkowej (Piddock, 2006).
Geny oporności mogą też wywodzić się od genów zaangażowanych w metabolizm
bakterii. Na przykład enzym β-laktamaza, warunkujący oporność na antybiotyki -
laktamowe, należy do grupy białek wiążących penicylinę, z których wiele pełni ważne
funkcje w metabolizmie mureiny.
Głównym zjawiskiem umożliwiającym nabywanie przez bakterie oporności jest
horyzontalny transfer genów, warunkujący przenoszenie informacji genetycznej między
komórkami bakterii. Transfer ten w obecności antybiotyków może być zintensyfikowany, np.
w wyniku indukcji ekspresji genów systemów koniugacyjnych niektórych typów ruchomych
elementów genetycznych. W wyniku HGT do bakterii mogą być wprowadzone duże
segmenty DNA, niosące niekiedy kilka genów opornościowych, co skutkuje powstaniem
szczepów wieloopornych. Geny oporności są znajdowane zarówno w plazmidach jak i
chromosomach. Duża ich liczba występuje w obrębie integronów, które stanowią naturalne
systemy umożliwiające konwersję „wyciszonych” kaset genowych do funkcjonalnych genów.
Nabycie fenotypu oporności w wyniku HGT stanowi istotną korzyść w naturalnej konkurencji
między mikroorganizmami i niewątpliwie prowadzi do wzrostu liczebności populacji
opornych szczepów bakterii patogennych.
2. Rola oczyszczalni ścieków w generowaniu nowych oporności
i ich transferze
Głównym celem oczyszczalni ścieków jest usuwanie z nich toksycznych substancji
organicznych i nieorganicznych, zmniejszenie w nich stężenia organicznego węgla, azotu i
fosforu oraz eliminacja różnego typu organizmów patogennych. W tym celu wykorzystywane
są procesy fizyczne (np. filtracja), chemiczne (np. dezynfekcja), jak i procesy przeprowadzane
przez niektóre mikroorganizmy.
Osady czynne i biofilmy znajdowane w oczyszczalniach są bogate w substancje
odżywcze, co stwarza idealne środowisko bytowania dla bakterii (Dionisio i wsp., 2002;
Sorensen i wsp,. 2005). Dzięki temu różnorodność występujących tam mikroorganizmów jest
12
bardzo duża. Analizy metagenomowego DNA wyizolowanego z prób pochodzących z
oczyszczalni ścieków (amplifikacja PCR oraz sekwencjonowanie genów 16S rRNA)
pozwoliły zidentyfikować przedstawicieli ponad dwadziestu gromad bakterii. Najliczniejsze
grupy stanowiły: Proteobacteria, Chloroflexi, Firmicutes, Spirochaetes i Bacteroides
(Wagner i Loy, 2002), a więc zarówno bakterie gramdodatnie jak i gramujemne, w tym ważne
pod względem klinicznym patogeny oportunistyczne. Tak duże nagromadzenie bakterii
stwarza doskonałe warunki stymulujące zdarzenia HGT, które zwykle prowadzą do naturalnej
amplifikacji genów oporności i rozpowszechnienia fenotypów opornościowych. Tym
bardziej, że w izolatach pochodzących z oczyszczalni ścieków identyfikowane są szczepy
oporne na wszystkie ważne, z klinicznego punktu widzenia, klasy antybiotyków, takie jak:
makrolidy, tetracykliny, cefalosporyny, fluorochinolony, aminoglikozydy i β-laktamy
(Bennett, 2008; Martinem, 2009; Szczepanowski i wsp., 2009).
Powszechnie wiadomo, że głównymi sprawcami HGT są ruchome elementy
genetyczne (MGE, mobile genetic elements). Rezerwuar MGE identyfikowanych w
bakteriach z oczyszczalni ścieków jest bogaty i bardzo różnorodny. Wykryto np. liczne
elementy transpozycyjne (transpozony i sekwencje insercyjne), elementy koniugacyjne i
integrujące z DNA oraz integrony (Bennett, 2008; Slater i wsp. 2008). Elementy te
znajdowane są (w różnych kombinacjach) w genomach licznych plazmidów koniugacyjnych,
co stymuluje ich transfer do innych gospodarzy.
Elementy transpozycyjne kodują transpozazę, enzym katalizujący proces transpozycji.
Są one bardzo zróżnicowane pod względem struktury genetycznej. Jedną z najliczniejszych
grup transpozonów stanowi rodzina Tn21. Transpozony z tej grupy często występują w
obrębie integronów, które uważane są za jeden z głównych czynników determinujących
wielooporność u bakterii. Badania sugerują, że plazmidy nabywają mobilne elementy w
wyniku różnorodnych procesów rekombinacyjnych.
Liczne plazmidy opornościowe wyizolowane z izolatów z oczyszczalni ścieków niosą
integrony klasy pierwszej, często sprzężone z transpozonem z rodziny Tn402 (Schluter i wsp.,
2007). Integrony te mogą zawierać do sześciu różnych determinant opornościowych, w tym
warunkujących oporność na czwartorzędowe związki amoniowe. W genomach plazmidów
spotyka się również geny oporności na inne związki toksyczne, np. jony metali ciężkich i
ksenobiotyki, co wskazuje na ich wzmożoną presję selekcyjną w środowisku oczyszczalni.
Oczyszczalnie to zatem miejsce ważne z punktu widzenia ewolucji plazmidów, bowiem w
środowisku tym dochodzi do częstego transferu tych replikonów oraz nabywania przez nie
nowych modułów genetycznych.
13
Prowadzone dotąd badania potwierdzają, że bakterie niosące plazmidy opornościowe
nie są eliminowane w trakcie procesu oczyszczania ścieków. W bakteriach tych dominują
plazmidy o szerokim spektrum gospodarzy. Przeprowadzona identyfikacja i analiza genomów
140 plazmidów niosących geny oporności na antybiotyki o znaczeniu klinicznym, ilustruje
mozaikową strukturę tych replikonów (Szczepanowski i wsp., 2009). Niektóre z tych
plazmidów były izolowane z końcowego wycieku z oczyszczalni, wprowadzanego
bezpośrednio do środowiska. Najliczniejszą grupą stanowią plazmidy należące do grupy
niezgodności IncP-1. Pokrewne plazmidy izolowane są również ze środowisk naturalnych
(Bahl i wsp., 2009). Plazmidy z grupy IncP-1 nie tylko mogą się replikować w szerokim
spektrum gospodarzy, lecz mogą też mobilizować do transferu koniugacyjnego inne
plazmidy. Transfer ten może zachodzić również do bakterii gramdodatnich (Mazodier i wsp.,
1989), cyjanobakterii (Kreps i wsp., 1990) oraz do drożdży (Heinemann i Sprague, 1989).
Odcieki z oczyszczalni są zwykle uwalniane do rzek, dzięki czemu przedostają się do
innych zbiorników wodnych, takich jak jeziora czy wody przybrzeżne (Zang i wsp., 2009).
Ponadto, osady czynne wykorzystywane są w rolnictwie do nawożenia pól (Chee-Sanford i
wsp., 2009), co dodatkowo przyczynia się do wzrostu liczby szczepów opornych w
środowisku.
Rozpowszechnienie plazmidów opornościowych wśród mikroorganizmów
środowiskowych zależy głównie od możliwości stabilnego utrzymywania tych replikonów w
komórkach gospodarzy. Jak wspomniano, plazmidy często warunkują liczne, różnorodne
cechy fenotypowe. Dzięki temu plazmidy niosące geny oporności na antybiotyki mogą być
przenoszone i stabilnie dziedziczone nawet w środowiskach nie poddawanych działaniu presji
selekcyjnej antybiotyku (Sorensen i wsp., 2005; Allen i wsp., 2010). Szczególnie
niebezpieczne, z punktu widzenia człowieka, jest przekazywanie tych plazmidów bakteriom
patogennym, co utrudnia bądź uniemożliwia ich skuteczną eliminację (D’costa i wsp,. 2006).
3. Izolacja i identyfikacja plazmidu pOK1
W Zakładzie Genetyki Bakterii (ZGB) Wydziału Biologii UW prowadzone są badania mające
na celu identyfikację ruchomych elementów genetycznych niosących determinanty oporności
na antybiotyki. Jednym z analizowanych środowisk jest oczyszczalnia ścieków Czajka w
Warszawie. Z mieszaniny bakterii występujących w osadzie czynnym tej oczyszczalni
wyizolowano, metodą egzogenną, plazmid pOK1, o szacowanej wielkości ok. 40 kpz.
Egzogenna izolacja plazmidów polega na wyodrębnieniu replikonu poprzez transformację
14
metagenomowego DNA do zdefiniowanego biorcy (w tym przypadku E. coli TG1) z
zastosowaniem odpowiedniej selekcji. Plazmid zdefiniowano pierwotnie jako replikon
warunkujący oporność na kanamycynę. Odczytano kompletną sekwencję nukleotydową
pOK1. W niniejszej pracy przeprowadzono analizę bioinformatyczną uzyskanej sekwencji
oraz analizę funkcjonalną jego wybranych modułów genetycznych.
15
Cel pracy
Celem niniejszej pracy było przeprowadzenie kompleksowej analizy bioinformatycznej
sekwencji nukleotydowej plazmidu pOK1, wyizolowanego egzogennie z bakterii
występujących w osadzie czynnym oczyszczalni ścieków Czajka w Warszawie oraz
przeprowadzenie analiz funkcjonalnych wybranych modułów genetycznych tego replikonu.
16
Materiały
1. Szczepy i plazmidy bakteryjne
Szczepy i plazmidy bakteryjne, które wykorzystano i skonstruowano w tej pracy
przedstawiono w tabelach 1 i 2.
Tab. 1. Szczepy bakteryjne wykorzystywane w pracy.
Nazwa Charakterystyka Pochodzenie
E. coli TG1 F’;(traD36 proAB+ lacI
q
lacZΔM15) supE44 hsdΔ5 Δ(lac-
proAB.); szczep wykorzystywany
do transformacji
Gibson, 1984
E. coli DH5α F-; Φ80D lacZΔM15 (lacZYA-
orgF)U169 deoR recA1 endA1
hsdR17 phoA supE44 λ- thi1
gyrA96 relA1
Sambrook i Russell,
2001
Szczepy wykorzystywane w badaniu zakresu gospodarza wektorów wahadłowych niosących
systemy replikacyjne plazmidu pOK1:
Paracoccus aminovorans
JCM7685R
Rifr; pochodna dzikiego szczepu
JCM7685R
ZGB
Agrobacterium tumefaciens
LBA 288R
Rifr; pochodna dzikiego szczepu
LBA 288R
ZGB
Alcaligenes sp. LM16R Rifr; pochodna dzikiego szczepu
LM16R
ZGB
Stenotrophomonas sp.
LM24R
Rifr; pochodna dzikiego szczepu
LM24R
ZGB
Pseudomonas sp. LM12R Rifr; pochodna dzikiego szczepu
LM12R
ZGB
Vogesella sp. 93R Rifr; pochodna dzikiego szczepu
93R
ZGB
Klebsiella pneumoniae Rifr; pochodna dzikiego szczepu ZGB
Yersinia enterocoltica
Ye0:9R
Rifr; pochodna dzikiego szczepu
Ye0:9R
ZGB
Aeromonas sp. 82R Rifr; pochodna dzikiego szczepu
82R
ZGB
17
Tab. 2. Plazmidy bakteryjne wykorzystane w pracy.
Nazwa Charakterystyka Pochodzenie
pOK1 naturalny plazmid wyizolowany z
osadu czynnego oczyszczalni
ścieków
ZGB
pRK2013 Kmr; 4,8 kpz; oriColE1; Tra
+
(system transferu RK2); plazmid
pomocniczy w koniugacji
trójrodzicielskiej
Ditta i wsp., 1980
pABW1 Kmr; 4,5 kpz ori pMB1; Mob
+;
oriT RK2; lacZα; MCS
Bartosik i wsp., 1997
pOK1a Kmr; 13891 kpz; pochodna
plazmidu pABW1 zawierająca,
wklonowany w miejsce SacI,
EcoRI fragment restrykcyjny
SacI, EcoRI plazmidu pOK1 (9,4
kpz; pozycja 24234-33666
sekwencji pOK1), zawierający m.
in. system replikacyjny REP2
pOK1
ta praca
pOK1b Kmr; 18274 kpz; pochodna
plazmidu pABW1 zawierająca,
wklonowany w miejsce SacI,
KpnI, fragment restrykcyjny SacI,
KpnI plazmidu pOK1 (13,8 kpz;
pozycja 6320-33782 sekwencji
pOK1), zawierający m. in.
systemy replikacyjne REP1 i
REP3 pOK1
ta praca
2. Podłoża
W pracy stosowano podłoże LB (Luria-Bertani): trypton – 10g/l, ekstrakt drożdżowy – 5 g/l,
NaCl – 5 g/l; pH 7,0 (Sambrook i Russel, 2001).
Podłoże stałe (LA) otrzymywano poprzez zestalenie podłoża płynnego agarem – 15g/l.
W zależności od potrzeb eksperymentu podłoża uzupełniano:
- mieszaniną X – gal (5-bromo-4-chloro-3-indolilo-β-D-galaktopiranozyd) i IPTG (izopropylo
β-D-1-thiogalaktopiranozyd)
- roztworami antybiotyków w stężeniach dobranych eksperymentalnie, w zależności od
doświadczenia:
- kanamycyna – 50, 100, 300, 400, 500, 1000 μg/ml;
18
- trimetoprim – 50, 100 μg/ml;
- tetracyklina – 10, 20 μg/ml;
- streptomycyna – 50 μg/ml;
- ryfampicyna – 50 μg/ml.
3. Roztwory i bufory
3.1. Roztwory do izolacji DNA metodą lizy alkalicznej:
- roztwór I: 50 mM glukoza, 25 mM Tris-HCl, 10 mM EDTA; pH 8,0;
- roztwór II: 0,2 M NaOh, 1% SDS;
- roztwór III: 3 M octan potasu, 5 M kwas octowy; pH 4,8.
3.2. Bufory i roztwory stosowane do elektroforezy DNA:
- bufor TAE: 40 mM Tris base, 20 mM kwas octowy, 1mM EDTA;
- bufor obciążający: 0,25% błękit bromofenolowy, 30% glicerol;
- żel agarozowy: 0,8% agaroza w buforze TAE.
3.3. Roztwory do transformacji bakterii metodą rubidowo-wapniową:
- roztwór I: 10 mM MOPS, 10 mM RbCl2; pH 7,0;
-roztwór II: 100 mM MOPS, 50 mM CaCl2, 10 mM RbCl2; pH 6,5.
3.4. pozostałe bufory i roztwory:
- bufor TE: 10 mM Tris-HCl, 1mM EDTA; pH 8,0;
- mieszanina stosowana do odbiałczania preparatów DNA: fenol nasycony 1 M Tris-HCl (pH
8,0) : chloroform – 1:1 (v/v);
- roztwór fizjologiczny (RF): 0,85% NaCl.
4. Enzymy, zestawy odczynników, wzorzec wielkości
- enzymy restrykcyjne, ligaza DNA faga T4 – Fermentas, RNaza – Roche, do obróbki
enzymatycznej używano buforów dostarczonych przez producentów;
- zestawy odczynników: „Plazmid Miniprep Plus”, „DNA Clean Up” – A&A Biotechnology;
19
- wzorzec wielkości liniowych fragmentów DNA: a KB Plus DNA Lauder (wielkości
fragmentów: 12,0; 11,0; 10,0; 9,0; 8,0; 7,0; 6,0; 5,0; 4,0; 3,0; 2,0; 1,65; 1,0; 0,85; 0,65; 0,5;
0,4; 0,3; 0,2; 0,1 kpz) – Invitrogen.
5. Odczynniki i ich pochodzenie
- BIO 101: tetracyklina;
- BIOCORP: LB;
- MERC: agar-agar;
- POCh: aceton, błękit bromofenolowy, chloroform, kwas octowy, metanol, glicerol;
- PRONA: agaroza;
- SIGMA: 5-bromo-4-chloro-3-indolilo-β-D-galaktopiranozyd (X – gal), bromek etydyny,
chlorek rubidu, chlorek sodu, chlorek wapnia, dimetylosulfotlenek (DMSO), N,N-
dimetyloformamid (DMF), dodecylosiarczan sodowy (SDS), fenol, glukoza, izopropylo β-D-
1-thiogalaktopiranozyd (IPTG), kanamycyna, kwas 3-(N-morfolino)propanosulfonowy
(MOPS), kwas solny, octan potasu, octan sodu, ryfampicyna, streptomycyna, trimetoprim,
Tris Base, uwodniony wersenian dwusodowy (EDTA), wodorotlenek sodowy.
Metody (opisane według skryptu ZGB)
1. Analiza in silico sekwencji nukleotydowych i aminokwasowych
W tabeli 3 przedstawiono narzędzia wykorzystywane do przeprowadzenia analiz
bioinformatycznych.
Tab. 3. Narzędzia bioinformatyczne.
Narzędzie Zastosowanie Dostęp
Artemis adnotacja sekwencji, wyróżnienie ORF,
wyznaczanie zawartości par G+C w sekwencji
nukleotydowej, translacja in silico,
przewidywanie wielkości i masy
cząsteczkowej białek
http://www.sanger.ac.uk/res
ources/software/artemis/
Clone Manager
versja 8
adnotacja sekwencji, wyróżnienie ORF,
identyfikacja miejsc rozpoznawanych przez
enzymy restrykcyjne, identyfikacja
sekwencji powtórzonych i palindromowych,
wizualizacja map genetycznych plazmidów,
planowanie klonowania in silico
Scientific & Educational
Software
20
Narzędzie Zastosowanie Dostęp
Programy
BLAST
porównywanie sekwencji nukleotydowych i
aminokwasowych z sekwencjami
zdeponowanymi w bazach danych
http://blast.ncbi.nlm.nih.gov
BPROM identyfikacja potencjalnych sekwencji
promotorowych
http://linux1.softberry.com/b
erry.phtml?topic=bprom&g
roup=programs&subgroup
=gfindb
ORF Finder wyróżnienie ORF http://www.ncbi.nlm.nih.gov
/projects/gorf/
GYM 2.0
Helix–Turn–
Helix Motif
Prediction
identyfikacja potencjalnych motywów helisa
– skręt – helisa w sekwencjach
aminokwasowych
http://users.cis.fiu.edu/~giri/
bioinf/GYM2/welcome.html
http://npsa-pbil.ibcp.fr/cgi-
bin/npsa_automat.pl?page=
/NPSA/npsa_hth.html
ISfinder identyfikacja sekwencji podobnych do
sekwencji elementów transpozycyjnych
https://www-is.biotoul.fr//
T-Coffee przyrównanie sekwencji nukleotydowych i
aminokwasowych
http://www.ebi.ac.uk/Tools/
msa/tcoffee/
Motif Scan
Pfam
NCBI
Conserved
Domain Serach
InterProScan
identyfikacja konserwowanych domen i
motywów w sekwencjach białek
http://myhits.isb-sib.ch/cgi-
bin/motif_scan
http://pfam.sanger.ac.uk/
http://www.ncbi.nlm.nih.gov
/Structure/cdd/wrpsb.cgi
http://www.ebi.ac.uk/Tools/
pfa/iprscan/
BoxShade wizualizacja przyrównań sekwencji
nukleotydowych i aminokwasowych
http://www.ch.embnet.org/s
oftware/BOX_form.html
NCBI dostęp do baz danych GenBank, InterPro,
PubMed i in.
http://www.ncbi.nlm.nih.gov
/
Predict Protein
YASPIN
przewidywanie struktury drugorzędowej
białek
https://www.predictprotein.
org/
http://www.ibi.vu.nl/progra
ms/yaspinwww/
Reverse
Complement
konwersja sekwencji nukleotydowych na
sekwencje odwrócone i/lub komplementarne
http://www.bioinformatics.o
rg/sms/rev_comp.htm
21
Narzędzie Zastosowanie Dostęp
REBASE źródło danych dotyczących systemów
restrykcji - modyfikacji
http://rebase.neb.com/rebase
/rebase.html
2. Warunki hodowli
Szczepy bakteryjne namnażano w podłożu LB z wytrząsaniem przez noc lub do osiągnięcia
fazy wzrostu wykładniczego w łaźni powietrznej w temperaturze 37oC (Escherichia coli) lub
30oC (pozostałe szczepy). Na podłożu stałym (LA) prowadzono inkubację w identycznych
warunkach temperatury przez 24 godziny lub dłużej w zależności od potrzeb eksperymentu.
3. Izolacja, obróbka i elektroforeza DNA
3.1. Izolacja plazmidowego DNA w małej skali
Plazmidowy DNA izolowano według zmodyfikowanej metody Birnboima i Doly’ego (1979).
1,5 ml nocnej hodowli bakteryjnej wirowano przez czas 3 min w temperaturze pokojowej w
mikrowirówce MPW52 (12 000 rpm). Otrzymany osad zawieszano w 100 μl schłodzonego
roztworu I. Po 5-minutowej inkubacji w temperaturze pokojowej dodawano 200 μl roztworu
II, delikatnie mieszano i inkubowano w lodzie przez 5 min. Następnie dodawano 150 μl
schłodzonego roztworu III i ponownie inkubowano w lodzie przez 5 min. Po inkubacji
dodawano 30 μl mieszaniny fenol:chloroform. Po dokładnym wymieszaniu lizat wirowano 10
min w mikrowirówce (12 000 rpm), a do zebranego supernatantu dodawano 1 ml 96%
alkoholu etylowego. DNA wytracano przez 20 min w temperaturze -20 o
C. Następnie próbki
wirowano przez 10 min (12 000 rpm) w temperaturze 4oC, a otrzymany osad przemywano
70% etanolem, suszono i zawieszano w 20-40 μl buforu TE.
Do izolacji paliamidowego DNA z komórek E. coli i szczepów środowiskowych
wykorzystywano także zestaw „Plasmid Miniprep Plus” firmy A&A Biotechnology, zgodnie
z instrukcją załączoną przez producenta.
22
3.2. Izolacja i wizualizacja plazmidowego DNA poprzez ekstrakcję
mieszanina fenol:chloroform
Materiał poprany bezpośrednio z szalki zawieszano w 100 μl wody dejonizowanej, po czym
dodawano równą objętość mieszaniny fenol:chloroform. Następnie intensywnie mieszano
przy użyciu mikrowytrząsarki i wirowano 10 min (12 000 rpm) w temperaturze pokojowej. 15
μl fazy wodnej mieszano z buforem obciążającym i nanoszono na żel agarozowy.
3.3. Elektroforeza drobnocząsteczkowego DNA w żelu agarozowym
Elektroforezę DNA prowadzono w żelu agarozowym o stężeniu 0,8% w buforze TAE przy
gradiencie napięć 3-5 V/cm, przez 1-1,5 godz. w temp. pokojowej. Po rozdziale
elektroforetycznym żele umieszczano w wodnym roztworze bromku etydyny o końcowym
stężeniu 0,5 μg/ml (10 min), a następnie płukano w wodzie destylowanej (10 min). Wyniki
rozdziału analizowano w systemie ImageQuant 300, firmy GE Healthcare.
3.4. Enzymatyczna obróbka DNA
Trawienie enzymami restrykcyjnymi prowadzono w warunkach zalecanych przez producenta,
od 10 min do 1 godz., używając 2 jednostek enzymu na około 1 μg DNA. Jednoczesne
trawienie dwoma enzymami prowadzono, jeśli było to możliwe, w buforze, w którym oba
enzymy wykazywały nie mniej niż 50% aktywności w stosunku do warunków optymalnych.
Ligację fragmentów DNA otrzymanych w wyniku wcześniejszego trawienia
enzymami restrykcyjnymi z wektorami do klonowania prowadzono przez 12 godz. w temp.
16oC. Używano 1-2 jednostki ligazy w mieszaninie reakcyjnej o końcowej objętości 20 μl,
przy nadmiarze wstawki.
DNA po obróbce enzymatycznej oczyszczano za pomocą zestawu „DNA Clean Up”
firmy A&A Biotechnology, stosując zalecenia producenta.
4. Wprowadzanie DNA do komórek bakteryjnych
4.1. Transformacja komórek E. coli
Komórki E. coli transformowano z wykorzystaniem zmodyfikowanej metody rubidowo –
wapniowej Kushnera (1978). Nocną hodowlę E. coli szczepiono w stosunku 1:50 do nowej
23
porcji pożywki i hodowano z intensywnym wytrząsaniem do uzyskania OD600 0,4-0,5.
Hodowlę, w porcjach po 1,5 ml, schładzano przez 5 min w lodzie i wirowano przez 3 min w 4
oC (6 000 rpm). Osad zawieszano w 1 ml roztworu I do transformacji, inkubowano w lodzie
przez okres 10 min i ponownie wirowano jw. Po usunięciu supernatantu osad zawieszano w
200 μl roztworu II. Zawiesinę inkubowano 15 min w lodzie, po czym dodawano plazmidowy
DNA i nadal inkubowano w takich samych warunkach. Po 10 min komórki poddawano
szokowi cieplnemu w 43 o
C przez 50s, a następnie dodawano 1 ml LB o temperaturze
pokojowej. Przed wysiewem na odpowiednie podłoża selekcyjne bakterie inkubowano przez
1 godz. w temp. 37 oC.
4.2. Koniugacja trójrodzicielska
W celu wprowadzenia odpowiednich plazmidów wykorzystano metodę koniugacji
trójrodzicielskiej. Nocne hodowle szczepu dawcy (szczep E. coli TG1, zawierający
odpowiedni plazmid), szczepu biorcy (badane szczepy Rifr) oraz szczepu pomocniczego (E.
coli DH5α z plazmidem pRK2013 – Kmr, Tra
+), wirowano w celu usunięcia presji
antybiotykowej, a następnie otrzymany osad zawieszano w świeżej porcji podłoża.
Przygotowane hodowle dawcy, biorcy i szczepu pomocniczego mieszano w stosunku 1:2:1.
Po 24 godzinnej inkubacji w 30 oC wyrosła murawę bakteryjną zmywano z powierzchni
szalki 2 ml LB, a odpowiednie rozcieńczenia wysiewano na podłoże selekcyjne LA
uzupełnione ryfampicyną oraz innym antybiotykiem/antybiotykami w odpowiednim stężeniu
dobranym eksperymentalnie w zależności od szczepu.
24
Wyniki i Dyskusja
1. Odczytanie kompletnej sekwencji nukleotydowej plazmidu
pOK1
Wyizolowany DNA plazmidu pOK1 został poddany sekwencjonowaniu. Wykorzystano
technikę pirosekwencjonowania, która oparta jest na wykrywaniu pirofosforanu, uwalnianego
podczas syntezy DNA. Ponieważ w wyniku sekwencjonowania uzyskano kilka kontigów
sekwencji, konieczne było ich złożenie i ustalenie kompletnej mapy fizycznej replikonu. Ten
etap badań został przeprowadzony przez Marcina Adamczuka - doktoranta Zakładu Genetyki
Bakterii.
2. Analiza sekwencji nukleotydowej plazmidu pOK1
Odczytano kompletną sekwencję nukleotydową plazmidu pOK1, o wielkości 41 277 pz.
Procentowa zawartość par G+C sekwencji wynosi 38,74%. Analizę bioinformatyczną
sekwencji rozpoczęto od wyznaczenia otwartych ramek odczytu (ORF, ang. open reading
frame), kodujących potencjalne produkty białkowe. W tym celu wykorzystano programy
Artemis i ORF Finder oraz wyniki analiz porównawczych, uzyskanych przy użyciu pakietu
BLAST (NCBI). Wyróżniano ORF kodujące produkty białkowe o długości większej niż 50
aminokwasów (aa) lub mniejszej, w przypadku, gdy kodowane przez nie białka wykazywały
istotne podobieństwo do sekwencji zdeponowanych w bazach danych.
W rezultacie zidentyfikowano 49 ORF (Fig. 1), które zostały oznaczone, odpowiednio,
jako orf01, orf02 itd., do orf49. Ich potencjalne produkty białkowe oznaczono jako Orf01,
Orf02 itd. Jako pierwszy nukleotyd sekwencji została wybrana adenina występująca 539
nukleotydów powyżej kodonu START orf01.
25
Fig. 1. Organizacja genetyczna plazmidu pOK1 (41 277 pz). W górnym panelu przedstawiono profil zawartości par G+C (Artemis, okno 120 nt). Barwnymi ramkami
wyróżniono podstawowe moduły genetyczne: na zielono moduły odpowiedzialne za replikację plazmidu, na
pomarańczowo – systemy odpowiedzialne za stabilne utrzymywanie plazmidu w komórce (PAR – systemy
partycyjne, RM – restrykcji-modyfikacji oraz TA – toksyna-antytoksyna), na niebiesko – sekwencje insercyjne
(IS) zintegrowane z genomem plazmidu, na fioletowo – determinanty oporności (orf26 - prawdopodobnie
warunkuje oporność na streptomycynę, orf27 – na sulfonamidy, orf39 – na trimetoprim, orf40 – na
aminoglikozydy, orf41 – na β-laktamy, orf42 – na czwartorzędowe związki amoniowe, orf44-45 – na
tetracyklinę). Ramką zaznaczono integron. W dolnym panelu zaznaczono za pomocą strzałek zasięg i orientację transkrypcyjną wyznaczonych ORF.
Podstawowe informacje o wyznaczonych otwartych ramkach odczytu, tj. lokalizację,
orientacje transkrypcyjną, wielkość potencjalnych produktów białkowych oraz ich
prawdopodobna funkcję wraz z informacjami o ich najbliższych homologach zamieszczono w
tabeli 4. Wyznaczone sekwencje kodujące stanowią 75,82% genomu plazmidu.
Dzięki przeprowadzonym analizom porównawczym zidentyfikowanych ORF możliwe
było wyróżnienie w obrębie sekwencji plazmidu pOK1 kilku potencjalnych modułów
genetycznych. Są to: (i) systemy replikacyjne (REP), (ii-iii) moduły odpowiedzialne za
stabilne utrzymywanie plazmidu w komórce - system partycyjny (PAR) i addykcyjny (TA),
(iv) potencjalny system mobilizacji do transferu koniugacyjnego (MOB), (v) sekwencje
insercyjne (IS) zintegrowane z genomem plazmidu oraz (vi) determinanty oporności.
Ważną informacją jest fakt, że 21 z potencjalnych produktów białkowych kodowanych
w sekwencji pOK1 wykazuje znaczny poziom (niekiedy 100%) identyczności z sekwencjami
białek kodowanych w genomie Wohlfahrtiimonas chitiniclastica SH04 (Tabela 4). Pięć z nich
26
zostało opisanych jako potencjalne białka o nieznanej funkcji, nie wykazujące podobieństwa
do innych białek zdeponowanych w bazach danych. Pozostałe to, między innymi: (i) białko
inicjujące replikację (orf46), (ii) systemy toksyna-antytoksyna (orf14-15, orf20, orf23, orf47-
48) oraz (iii) transpozazy orf19, orf22, orf43, orf49). Należy pokreślić, że niektóre geny są
powielone w genomie pOK1, np. geny systemu TA ( orf20-orf 23 i orf47-orf48) oraz gen
transpozazy (orf49 i orf43).
27
Tabela 4. Otwarte ramki odczytu zidentyfikowane w plazmidzie pOK1.
ORF
Region
kodujący (pz)*
Orientacja
Wielkość
białka
(aa)†
Prawdopodobna funkcja‡
Największe podobieństwo (program BLASTP)
Procent
identyczności
(aminkwasy§)
Organizm Numer w GenBank
01 540-1121 → 193 hipotetyczne białko o
nieznanej funkcji 100 (193/193
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241700.1
02 2528-3705 → 392 białko replikacyjne
55 (134/242) Acinetobacter lwoffii SH145 ZP_06071093.1
03 4075-5154 → 358
transferaza
adenozynomonofosforanu
SoFic
96 (344/358) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21240492.1
04 5192-8035 → 945 białko z rodziny SNF2 74 (706/949) Acinetobacter baumannii WC-136 ZP_18914166.1
05 8087-11176 → 1029 metylotransferaza DNA
58 (617/1071) Acinetobacter sp. HA ZP_10187147.1
06 11182-13665 → 827
potencjalny enzym
restrykcyjny, N- końcowa
część
53 (427/802) Escherichia coli DEC1C EHU17630.1
07 13572-14639 → 355
potencjalny enzym
restrykcyjny, C- końcowa
część
44 (153/348) Escherichia coli DEC2A ZP_13569221.1
08 15025-15294 → 89 hipotetyczne białko o
nieznanej funkcji 99 (88/89) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241728.1
09 15295-15810 → 171 hipotetyczne białko o
nieznanej funkcji 99 (169/171)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241729.1
10 15952-16554 → 200 inwertaza DNA 99 (199/200) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241730.1
11 16643-17278 → 184 inhibitor inicjacji
sporulacji Soj, częściowy 99 (183/184)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241731.1
28
ORF
Region
kodujący (pz)*
Orientacja
Wielkość
białka
(aa)†
Prawdopodobna funkcja‡
Największe podobieństwo (program BLASTP)
Procent
identyczności
(aminkwasy§)
Organizm Numer w GenBank
12 17319-
17531 → 70
białko partycyjne ParB
53 (33/62)
Xanthomonas arboricola pv. pruni str.
CFBP 5530 YP_004888082.1
13 17748-18047 ← 99 hipotetyczne białko o
nieznanej funkcji 98 (97/990)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241755.1
14 18129-18392 ← 87 toksyna YoeB 100 (87/87) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241756.1
15 18385-18642 ← 85 antytoksyna YefM 100 (85/85) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241757.1
16 18847-18990 → 43 inhibitor inicjacji
sporulacji Sjo, częściowy 100 (43/43)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241758.1
17 19046-19165 → 38 transpozaza,
podjednostka A 68 (26/38) Vibrio cholerae HC-56A1 ZP_18079930.1
18 19152-19514 → 120 transpozaza,
podjednostka B 68 (79/116) Vibrio cholerae TM 11079-80 ZP_04410225.1
19 19460-19723 ← 85 transpozaza dla sekwencji
inercyjnej IS431mec 81 (69/85)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241703.1
20 19901-20107 → 67 potencjalna antytoksyna
systemu TA 91 (61/67)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241685.1
21 20108-20440 → 110 transpozaza z rodziny
IS3/IS911 77 (65/87) Glaciecola sp. 4H-3-7+YE-5 YP_004436720.1
22 20461-21264 → 267 element insercyjny IS407 55 (139/254) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241722.1
23 21329-21589 → 87 potencjalna toksyna
systemu TA 93 (80/86)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241684.1
24 22116-22676 → 186 hipotetyczne białko o
nieznanej funkcji 96 (178/186)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241735.1
29
ORF
Region
kodujący (pz)*
Orientacja
Wielkość
białka
(aa)†
Prawdopodobna funkcja‡
Największe podobieństwo (program BLASTP)
Procent
identyczności
(aminkwasy§)
Organizm Numer w GenBank
25 22746-23111 → 121
hipotetyczne białko
zaangażowane w
mobilizację bakterii,
endonukleaza VirD1
95 (115/121)
Wohlfahrtiimonas chitiniclastica
SH04
ZP_21241734.1
26 23403-24251 ← 282 fosfotransferaza A
streptomycyny 99 (281/282) Haemophilus parasuis ADP21235.1
27 24193-25044 ← 283 syntaza
dihydropterynianowa 100 (283/283) Actinobacillus pleuropneumoniae YP_245431.1
28 25053-25277 ← 74
hipotetyczne białko o
nieznanej funkcji,
częściowe
97 (72/74) Salmonella enterica subsp. enterica
serovar Typhimurium str. SL1344 YP_006203625.1
29 25232-25393 ← 53 hipotetyczne białko o
nieznanej funkcji 96 (51/53) Escherichia coli 3431 ZP_11485833.1
30 25910-26854 ← 314
potencjalne białko
inicjujące replikację,
RepC
99 (313/314) Actinobacillus pleuropneumoniae NP_955652.1
31 27097-27408 ← 103 hipotetyczne białko o
nieznanej funkcji 96 (99/103) Aeromonas bestiarum ABR10074.1
32 27562-28956 ← 464 białko replikacyjne RepA 90 (431/480) Aeromonas bestiarium YP_001220601
33 29132-29455 ← 107 białko partycyjne ParC
57 (61/107) Nitrosomonas eutropha C91 YP_743797.1
34 29773-30402 ← 209 białko partycyjne Par
99 (208/209) Aeromonas bestiarum YP_001220602.1
35 30498-31097 ← 199 resolwaza
100 (199/199) Aeromonas bestiarum YP_001220603.1
30
ORF
Region
kodujący (pz)*
Orientacja
Wielkość
białka
(aa)†
Prawdopodobna funkcja‡
Największe podobieństwo (program BLASTP)
Procent
identyczności
(aminkwasy§)
Organizm Numer w GenBank
36 31287-31490 ← 67
konserwowane
hipotetyczne białko o
nieznanej funkcji
88 (59/67) Aeromonas bestiarum ABR10075.1
37 31445-31699 ← 84 modulator transpozonu
Tn21 98 (79/81)
Salmonella enterica subsp. enterica
serovar Typhimurium str. T000240
YP_005250487.1
38 31668-32681 ← 337 integraza 100 (337/337)
Salmonella enterica subsp. enterica
serovar Typhi str. CT18
NP_569372.1
39 32838-33311 → 157
reduktaza
dihydrofolianowa
99 (155/157) Escherichia coli NP_065309.1
40 33287-33865 → 192 acetylotransferaza
aminoglikozydowa 98 (181/185) Escherichia coli NP_957555.1
41 33951-34826 → 291 β-laktamaza 99 (290/291) Escherichia coli YP_003108196.1
42 35038-35211 → 57
białko warunkujące
odporność na
czwartorzędowe związki
amonowe i bromek
etydyny
98 (53/54) Pseudomonas aeruginosa AEN25620.1
43 35264-35950 → 178 transpozaza sekwencji
insercyjnej IS431mec 96 (170/178)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241703.1
44 36109-36732 ← 207
represor TetR, białko
regulujące ekspresję
genów oporności na
tertacyklinę
100 (207/207) Actinobacillus pleuropneumoniae YP_001569045.1
31
ORF
Region
kodujący (pz)*
Orientacja
Wielkość
białka
(aa)†
Prawdopodobna funkcja‡
Największe podobieństwo (program BLASTP)
Procent
identyczności
(aminkwasy§)
Organizm Numer w GenBank
45 36824-38026 → 400
białko klasy H
warunkujące oporność na
tetracyklinę
100(400/400) Actinobacillus pleuropneumoniae
izolat 12494 plazmid p12494 YP_001966263.1
46 38450-39505 ← 350 potencjalne białko
inicjujące replikację 99 (347/350)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241699.1
47 39871-40092 → 73 potencjalna antytoksyna 89 (65/73) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241685.1
48 40093-40353 → 86 potencjalna toksyna 93 (80/86) Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241684.1
49 35264-35950 → 178 transpozaza sekwencji
insercyjnej IS431mec 96 (170/178)
Wohlfahrtiimonas chitiniclastica
SH04 ZP_21241703.1
* - pozycja pierwszego nukleotydu kodonu inicjacyjnego do kodonu stop w sekwencji † - aa, aminokwasy ‡ - potencjalna funkcja wyznaczona na podstawie porównania domen białkowych § - liczba identycznych aminokwasów w odniesieniu do liczby porównywanych; wg programu BLAST
Systemy replikacyjne
Moduł odpowiedzialny za stabilne utrzymywanie plazmidu w komórce
Determinanty oporności
Inne ruchome elementy genetyczne zintegrowane z genomem plazmidu
32
2.1. Analiza systemów replikacyjnych
W sekwencji plazmidu pOK1 wyróżniono trzy potencjalne systemy replikacyjne (REP). W skład
plazmidowych systemów replikacyjnych wchodzi zazwyczaj gen rep kodujący białko
replikacyjne (jeden z systemów pOK1 koduje dwa białka) oraz przyległy do tego genu region
DNA zawierający origin replikacji, tj. miejsce, w którym dochodzi do zapoczątkowania nowej
rundy replikacyjnej. W kolejnych podrozdziałach scharakteryzowano zidentyfikowane systemy.
2.1.1. System REP1
Otwarta ramka odczytu orf02 (Fig. 1) koduje potencjalne białko replikacyjne (Rep1) systemu
REP1. Białko to wykazuje podobieństwo sekwencji aminokwasowej (55%-57%) do białek
inicjujących replikację, kodowanych w genomach (i) Acinetobacter lwoffii SH145 (GenBank:
EEY88345.1), z Acinetobacter baumannii Naval-8219377 (GenBank: EKP54646.1) oraz (iii)
Acinetobacter johnsonii SH046 (GenBank: EEY94595.1) (sekwencje genomów tych szczepów
uzyskano w wyniku sekwencjonowania metodą Shotgun, zatem nie można określić czy geny rep
występują w obrębie plazmidów czy chromosomów). Białko Rep1 wykazuje także podobieństwo
(na poziomie 45-58%) do plazmidowych inicjatorów replikacji pochodzących ze szczepów
Acinetobacter spp. (GenBank: ADM89093.1 i ADM89094.1) (Bertini i wsp., 2010). Na Fig. 2.
przedstawiono porównanie sekwencji aminokwasowych Rep1 z sekwencjami najbardziej
podobnych białek.
Homologi białka Rep1 są definiowane jako RepB – białka inicjujące replikację,
wykazujące aktywność topoizomerazy I. Białka o takiej aktywności są najczęściej kodowane w
plazmidach replikujących się według mechanizmu toczącego się koła (RC, ang. rolling-circle
replication) (Diaz-Orejas i wsp. 1998).
Rep1_pOK1 1 VDNTPCTVVKDNVLINASYNLNLVEQRLILLAIVRSRETGKGITANDYLE 50
RepB 1 ---MRDLVVKDNALINASYNLDLVEQRLILLAIVEARESGKGINANNPLE 47
SH046 1 ---MRDLVVKDNALINASYNLDLVEQRLILLAIVEARGSGRGINANDPLE 47
SH145 1 ---MRDLVVKDNALINASYNLDLVEQRLILLAIVEARESGKGINANNPLE 47
Rep1_pOK1 51 IHASDYSDNFKTDRSSTYKSLRDNSKQLFKREFSFI----RGN-ETILSRWVSTIKYCDE 105
RepB 48 VHAEGYINQFGVHRNTAYQALKDACNDLFARQFSYQKINERGNIENYRSRWVSEIGYVDN 108
SH046 48 VHAESYVNQFNVARQTAYQALKDACKDLFARQFSYQEVNKRGNIENVLSRWVSEIRYIDD 108
SH145 48 VHAESYINQFNVARQTAYQALKDASKDLFARQFSYQEMNKRGNIENVLSRWVSEIRYVDA 108
Rep1_pOK1 106 TATVSLIFSPEVIVFISELEKHFTSYNLQSISGLTSSYAVRLYEIMSCWKYVQKTPIFGI 168
RepB 109 EAVVKLIFAPAIVPLITRLEEHFTKYELQQVSNLSSAYAVRLYELLIAWRSTGSTPIIEV 168
33
SH046 109 EATVKLIFAPAIVPLITRLEEQFTKYELQQISDLSSAYAVRLYELLIAWRSTGQTPVIEL 168
SH145 109 EATVKLIFAPAIVPLITKLEEQFTKYELQQVSNLSSAYAVRLYELLIAWRSTGQTPVIEI 168
Rep1_pOK1 169 EDFRQRLGVATHEYPRMSNFKTRVLDIAIKQVNTFTNLTVKCEQHKAGRNIIGFSFLISE 228
RepB 169 SDFRQRIGVLDTEYKRMERFKTSVLELAIKQINEHTDITVKYEQHKRGRSISGFSFTFKQ 228
SH046 169 AEFRQKIGVLDDEYTRMGNFKDRVLNLAIAQVNEHTDINVKCEQHKKGRNISGFSFTFKQ 228
SH145 169 EEFRKKIGVLDDEYTRMGNFKDRVLHLAMAQVNEFTDITVKYEQHKKGRSIYGFSFSFKQ 228
Rep1_pOK1 229 KKV-------ERDLNTIDCIDEKPN-EKYITEDEFIALGSDGSDAYEIAIKAFNQGFKIP 281
RepB 229 KKKDNPP--IERDPNTLDLFTKMTDAQRHLFANKLSELP--------------------- 265
SH046 229 KKVIT-----SKSSTSLELFSKMTDAQRHLFANKLSELP--------------------- 262
SH145 229 KKNVNKPNLEARDQNTLDIFTKLTDAQRHLFANKLSELP--------------------- 267
Rep1_pOK1 282 RNLQIKYGIEGDKFLKAKKSASQKAINTDKNKTTSDKATFIL-NDKTIGYLKKTITDSIN 341
RepB 265 ---------EMGRYSQGTESYPQFAIRIAEMLQDPDRIKELYPYLKKVGYMPSNKKDT-- 314
SH046 262 ---------DMNKYSQGTESYTQFAVRIAEMLQDKERFEELLPYLRKAGFN--------- 304
SH145 267 ---------EMSKYSQGTESYPQFAVRIAEMLLDAEKFKELYPYLVKVGFQ--------- 309
Rep1_pOK1 342 KNKHLTNEVKQSFIIVEINEVYDAITTKQNIVDVDNKSVSEMNFKTKMYEAFNIQK 398
RepB 315 -----------------------------------------------------VNG 317
SH046 304 ------------------------------------------------------TK 305
SH145 310 ------------------------------------------------------TK 311
Fig. 2. Porównanie sekwencji aminokwasowych Rep1 pOK1 i białek pokrewnych.
Sekwencje porównywane z Rep1 (Rep1_pOK1) pochodzą kolejno z Acinetobacter baumannii Naval-8219377
(GenBank: EKP54646.1) (RepB), Acinetobacter johnsonii SH046 (GenBank: EEY94595.1) (SH046) oraz
Acinetobacter lwoffii SH145 (GenBank: EEY88345.1) (SH145). Na niebiesko zaznaczono aminokwasy identyczne
we wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Za pomocą kolorowych ramek zaznaczono
przewidywaną strukturę drugorzędowa białka Rep1. Obramowaniami otoczono domeny typu winged-helix.
Jak widać na Fig. 2, wyróżniona orf2 koduje 398 aa białko. Długość sekwencji białek
najbliżej spokrewnionych jest mniejsza i zawiera się w przedziale 248-318 aa. Region sekwencji
konserwowanej w tych białkach nie obejmuje zatem C-końcowej części Rep1. Przeprowadzono
również analizę konserwowanych domen białkowych (program InterProScan), dzięki czemu
zakwalifikowano białko Rep1 do rodziny Rep_3, grupującej plazmidowe białka inicjujące
replikację (Pfam: PF01051). Charakterystyczna dla tej rodziny domena zlokalizowana jest
między 7 a 222 aminokwasem Rep1. Ta sama domena znajduje się również w podobnej
lokalizacji w najbliższych homologach białka Rep1 (Fig. 2).
Wykorzystując programy: PredictProtein, YASPIN i MotifScan nie znaleziono innych
konserwowanych motywów w sekwencji Rep1. Nie wyróżniono także potencjalnych motywów
helisa-skręt-helisa (HTH, ang. helix-turn-helix) (programy: GYM 2.0 i Helix-Turn-Helix Motif
Prediction). Za pomocą programu InterProScan wyznaczono natomiast lokalizację potencjalnych
domen typu wingled-helix-turn-helix (Fig. 2). Domena ta jest odpowiedzialna za oddziaływanie z
DNA, co wpływa na regulację procesu replikacji (Giraldo i wsp., 2004). Brak motywu HTH jest
34
charakterystyczny dla białek replikacyjnych plazmidów replikujących się według mechanizmu
toczącego się koła. Zazwyczaj w tych białkach identyfikowany jest potencjalny motyw zamka
leucynowego (nieobecny jednak w sekwencji Rep1 pOK1) (Diaz-Orejas i wsp., 1998).
Region leżący powyżej orf02 uznano jako potencjalne miejsce startu replikacji plazmidu
(oriV). Wyróżniono tam region sekwencji bogaty w pary G+C (GCR; pozycja ok. 450-500 bp,
średnia zawartość par G+G - 30,9%.) oflankowany przez regiony bogate w pary A+T (ATR1 i
ATR2) (Fig. 3). Regiony ATR1 i ATR2 obejmują, odpowiednio, pozycje ok. 160-200 pz i 300-
400 pz, o zawartości par G+C 23,8% oraz 23,6%. Na Fig. 3. przedstawiono organizację regionu
oriV plazmidu pOK1. W regionie ATR2 występuje 5 prostych, bezpośrednio po sobie 22-
nukleotydowych sekwencji powtórzonych (IT1-IT5). Trzy z nich są identyczne, w czwartej
występuje punktowa zmiana, natomiast w piątej identycznych jest tylko 5 pierwszych
nukleotydów. Prawdopodobnie te sekwencje repetytywne pełnią rolę iteronów, rozpoznawanych
specyficznie przez białko Rep1. Sekwencja dwudziestu nukleotydów wchodzących w skład
ostatniego iteronu ma strukturę palindromu (Pd). Powyżej iteronów obecna jest także inna
sekwencja palindromowa o długości 10 nukleotydów. Należy zauważyć, że w sekwencji
iteronów pojawia się 9-nukleotydowa sekwencja 5’-TTATACCAC-3’ wykazująca podobieństwo
do sekwencji konsensusowej rozpoznawanej przez białko komórkowe DnaA (tzw. DnaA-box)
5’-(T/C)(T/C)(A/T/C)T(A/C)C(A/G)(A/C/T)(A/C)-3’ (Schaefer i Messer, 1991).
W regionie ATR2 wyróżniono również potencjalną sekwencję promotorową genu rep1
[5’-ATGATA(N10)TTTATT-3’], wykazującą pewne podobieństwo do konsensusu sekwencji
promotorów E. coli, rozpoznawanych przez polimerazę RNA związana z podjednostką σ70
: 5’-
TTGACA(N15-19)TATAAT-3’ (Harley i Reynolds, 1987). Poniżej sekwencji paromotorowej
znajduje się potencjalne miejsce przyłączania rybosomu (rbs): 5’-AGGA-3’ (Fig. 3).
35
Fig. 3. Organizacja genetyczna potencjalnego oriV plazmidu pOK1. Przedstawiono wykres zawartości par G+C w obszarze modułu (Artemis, okno 120 nt), zaznaczono położenie
regionów bogatych w pary G+C (GCR) i A+T (ATR1, ATR2) względem genu rep1. W sekwencji wyróżniono
iterony (IT), sekwencje palindromu (Pd), sekwencje -10 i -35 oraz miejsce rbs. Gwiazdką zaznaczono brak
nukleotydu w iteronie IT4 (konserwowanego w IT1-IT3). Zieloną strzałką zaznaczono początek genu rep1.
2.1.2. System REP2
W skład systemu REP2 wchodzą dwie ORF (orf30 i orf32) kodujące potencjalne białka
replikacyjne. Pomiędzy nimi znajduje się orf31, kodujący hipotetyczne białko o nieznanej
funkcji.
Białko Orf30 wykazuje największe podobieństwo sekwencji aa do białka RepC plazmidu
pMS260 Actinobacillus pleuropneumoniae (GenBank: NP_955652.1). Identyczność obu
sekwencji wynosi 99%. Badacze opisali to białko jako potencjalnie inicjujące replikację. Co
ciekawe, regiony międzygenowe (IGS, ang. intergenic sequence), położone powyżej genów
porównywanych białek pOK1 i pMS260 (GenBank: AB109805.1), wykazują 96% identyczność
na poziomie sekwencji nukleotydowej. Zgodnie z adnotacją sekwencji zdeponowanej przez
badaczy, powyżej wspomnianego IGS zlokalizowany jest gen kodujący syntazę
dihydropterynianową typu II. W przypadku pOK1, homologiczne białko (100% identyczność
sekwencji aa) kodowane jest przez orf27(sulII), jednak w IGS pomiędzy orf27 a orf30(repC)
36
znajdują się dodatkowo dwie ORF (nieobecne w pMS20), kodujące hipotetyczne białka o
nieznanej funkcji (orf28, orf29) (Fig. 1 i Tabela 4; Fig. 4).
Region międzygenowy poprzedzający orf30 wykazuje 99% identyczność sekwencji
nukleotydowej z IGS plazmidu pMS260. Poniżej odpowiednika orf30, w plazmidzie pMS260
zlokalizowany jest gen repA, który nie jest obecny w pOK1. W tej pozycji pOK1 zlokalizowana
jest ORF kodująca hipotetyczne białko o nieznanej funkcji (orf31).
Fig. 4. Schemat organizacji genetycznej regionu pOK1 flankującego orf30.
Kolorowymi ramkami oznaczono ORF: niebieskie – kodujące hipotetyczne białka o nieznanej funkcji
niewyróżnione w sekwencji plazmidu pMS260, fioletowe – pochodzące z plazmidu pMS260 Actinobacillus
pleuropneumoniae (GenBank: NP_955652.1), żółte – wyróżnione w plazmidzie pOK1.
Inne białka pokrewne Orf30 pochodzą z plazmidów różnych przedstawicieli
Gammaproteobacteria: Pasteurella multocida (GenBank: 91% identyczności sekwencji aa,
YP_232871.1), Enterobacter cloacae (91%, GenBank: YP_002563153.1), E. coli (88%,
GenBank: YP_002527536.1) i Salmonella enterica (88%, GenBank: YP_006957938.1). Na Fig.
5 przedstawiono porównanie sekwencji aminokwasowych Orf30 i jego najbliższych homologów.
Analiza konserwowanych domen białkowych pozwoliła zakwalifikować Orf30 do
rodziny białek replikacyjnych RepC (Pfam: PF06504). Charakterystyczna dla niej domena
zlokalizowana jest między 35 a 313 aminokwasem Orf30. Ta sama domena znajduje się również
w podobnej lokalizacji w najbliższych homologach opisywanego białka (Fig. 5).
37
pOK1 1 MGHRSKTAGSGGTMAGCSSPPCWRSSARARGCAVVKPKNKHSLSHVRHDPAHCLAPGLFR 60
pleuropneumoniae 1 MGHRSKTAGSGGTMAGCSSPPCWRSSARARGCAVVKPKNKHSLSHVRHDPAHCLAPGLFR 60
cloacae 1 MGHRSKTAGSGGTMAGCSSPLCWSASARARGWPVAKPK--HDLSHARHDPAHCLAPGLFR 58
multocida 1 MGRRSKTAGSGGMTAGCSNPPCWKSSAKARGCAVVKPKNKYSLSHVRHDPAHCLAPGLFR 60
pOK1 61 ALKRGERKRSKLDVTYDYGDGKRIEFKGPEPLGADDLRILQGLVAMAGPNGLVLGPEPKT 120
pleuropneumoniae 61 ALKRGERKRSKLDVTYDYGDGKRIEFKGPEPLGADDLRILQGLVAMAGPNGLVLGPEPKT 120
cloacae 59 ALKRGERKRSKLDVTYDYGDGKRIEFSGPEPLGADDLRILQGLVAMAGPSGLVLGPEPKT 118
multocida 61 ALKRGERKRSKLDVTYDYGDGKRIEFKGPEPLGADDLRILQGLVAMAGPNGLVLSPEPKT 120
pOK1 121 PGGQQLRLFLEPKWEAVTADAMVVKGSYRALAREVGYADIEDS--RPIRECIERLWTVSI 178
pleuropneumoniae 121 PGGQQLRLFLEPKWEAVTADAMVVKGSYRALAREVGYADIEDS--RPIRECIERLWTVSI 178
cloacae 119 PGGQQLRLFLEPKWEAVETDAMVVKGSYRALAREVGYADIEDS--RPIRECIERLWKVSI 176
multocida 121 EGGQQLRLFLESKWEAVTADAMVVKGSYRALAREIGYAEDGGSQFKAIRECIERLWTVSI 180
pOK1 179 IAQNGRKRQGFRLLAEYASDEADGHLYVALNPLIAQAVMGGGLHVRISMDEVRALDSEAA 238
pleuropneumoniae 179 IAQNGRKRQGFRLLAEYASDEADGHLYVALNPLIAQAVMGGGQHVRISMDEVRALDSEAA 238
cloacae 177 IAQHGRKRQGFRLLSEYASDDAEGRLYVALNPLIAQAVMGGGQHVRISMDEVRALDSETA 236
multocida 181 IAQNGRKRQGFRLLAEYASDEAGGRLYVALNPLIAQAVMGGGQHVRISMDEVRALDSEAA 240
pOK1 239 RLLHQRLCGWIDPGKTGKASIDTLCSYVWPSEASSSAMRKRRQRVREALPELEALGWSVV 298
pleuropneumoniae 239 RLLHQRLCGWIDPGKTGKASIDTLCSYVWPSEASSSAMRKRRQRVREALPELEALGWSVV 298
cloacae 237 RLLHQRLCGWIDPGKTGKASIDTLCSYVWPSEAVGSAMRMRRKRVREALPELEALGWSVV 296
multocida 241 RLLHQRLCGWIDPGKTGKAAIDTLCGYVWPSEASGSTMRKRRQRVREALPELVALGWTVT 300
pOK1 299 EYAAGKYDITRPKAAG 314
pleuropneumoniae 299 EYAAGKYDITRPKAAG 314
cloacae 297 EYAAGKYDIARPKAVG 312
multocida 301 EFAAGKYDITRPKAAG 316
Fig. 5. Porównanie sekwencji aminokwasowych Orf30 i białek pokrewnych.
Sekwencje porównywane z sekwencją Orf30 (pOK1) pochodzą kolejno z Actinobacillus pleuropneumoniae
(GenBank: NP_955652.1) (pleuropneumoniae), Enterobacter cloacae (GenBank: YP_002563153.1) (cloacae)
oraz Pasteurella multocida (GenBank: YP_232871.1) (multocida). Na niebiesko zaznaczono aminokwasy
identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Kolorowymi ramkami zaznaczono
przewidywaną strukturę drugorzędowa białka Orf30. Obramowaniem zaznaczono zakres domeny RepC.
Kolejne białko kodowane w obrębie systemu REP2 to Orf32. Wykazuje ono
największe podobieństwo sekwencji aa (90%) do białka replikacyjnego (RepA) pochodzącego z
plazmidu pAb5S9 Aeromonas bestiarum (GenBank: YP_001220601.1). Analiza porównawcza
wykazała, że w strukturze plazmidu pOK1 znajduje się znacznych rozmiarów segment DNA
wykazujący duże podobieństwo (na poziomie sekwencji nukleotydowych) do plazmidu pAb5S9
(GenBank; EF495198.1). Fragment ten obejmuje, oprócz orf32, także orf31 (wraz z
38
poprzedzającym ją regionem międzygenowym) oraz orf34, orf35, orf36(orf) (Fig. 6).
Podobieństwo sekwencji nukleotydowych jest duże i dla poszczególnych ORF wynosi,
odpowiednio: 98%, 100%, 96%, 98%, 99%, a na poziomie sekwencji aa kodowanych białek,
odpowiednio, 96%, 90%, 99%, 100% i 88% identyczności.
orf31 koduje hipotetyczne białko o nieznanej funkcji, orf32 – białko replikacyjne,
orf34 – białko partycyjne ParA, orf35 – resolwazę, zaś orf36 – konserwowane hipotetyczne
białko. Warto zauważyć, że orf33 nie wykazuje podobieństwa sekwencji do sekwencji plazmidu
pAb5S9 (Fig. 6). orf33 koduje potencjalne białko partycyjne ParC, konserwowane w
Plazmidzie2 Nitrosomonas eutropha C91 (GenBank: YP_743797.1) (patrz rozdział 2.2.1.
System partycyjny).
Fig. 6. Schemat ilustrujący elementy wspólne plazmidów pOK1 i pAb5S9.
Kolorowymi ramkami oznaczono otwarte ramki odczytu: pomarańczowe – pochodzące z Plazmidu2 Nitrosomonas
eutropha C91 (GenBank: YP_743797.1), zielone – pochodzące z plazmidu pAb5S9 Aeromonas bestiarium
(GenBank: YP_001220601.1), żółte – wyróżnione w plazmidzie pOK1.
Białka homologiczne Orf32 kodowane są także w plazmidach różnych przedstawicieli
Proteobacteria: (i) z klasy Betaproteobacteria – Bordetella bronchiseptica (78%, GenBank:
CAI47016.1), Achromobacter arsenitoxydans (72%, GenBank: WP_008166574.1),
Gammaproteobacteria – Pseudomonas areuginosa (74%, GenBank: YP_001427363.1),
Xanthomonas arboricola (72%, GenBank: YP_004888062.1) oraz (ii) z klasy
Alphaproteobacteria – Azospirillum lipoferum 4B (34%, GenBank: YP_005039538.1),
Nitrobacter hamburgensis X14 (30%, GenBank: YP_575500.1). Homologiczne białka
kodowane są także w Firmicutes – Ammonifex degensii KC4 (37%, GenBank: YP_003240092.1)
oraz Geobacillus sp. WCH70 (31%, GenBank: YP_002951365.1). Badacze opisują białka te
jako niezbędne do replikacji lub inicjacji replikacji.
39
pOK1 1 MAAVEQLSLFDRAEEARAYHDPARAGFFSILVDVNGDKRQSSHRLIEMPTVLELIDKSRD 60
aeruginosa 1 MAGQAQLALFEPADEAGTYHDTARTGFFSLLVAVGKDKRQDSYRLTDMPTILGMVDQTRD 60
bestiarum 1 MAAVEQLSLFDRAEEARAYHDPARAGFFSILVDVNGDKRQSSHRLIEMPTVLELIDKSRD 60
bronchiseptica 1 MAAVAQLSLFDRAEEARAYHDPGRSGFFSILVDVHGDKRQSSHRLVEMPTVLELIDKTRD 60
pOK1 61 TWLTQAEFIRPNRRVVNLARLGLLFADLDTYRTPWAKGRTPEQLAASVLYHCAQEGIPTP 120
aeruginosa 61 TWLTQAEFMRPNRRVVNLARVGLLFADLDTYRQPWATGRTPEQLAATVLYHCAQEGIPTP 120
bestiarum 61 TWLTQAEFIRPNRRVVNLARLGLLFADLDTYRTPWAKGRTPEQLAASVLYHCAQEGIPTP 120
bronchiseptica 61 TWLTQAEFIRPNRRVVNLARIGLMFADLDTYRQPWATGRTPEQLAASVLYHCAQEGIPTP 120
pOK1 121 SMLIFSGRGIQAKWLLDGTIPRQALPRWNACQKYLIDRLRPVGADVAAKDASRVLRLVET 180
aeruginosa 121 SLLVYSGRGIQAKWLLDGTLPRQALPRWNACQRYLVDRLAGLGADPQAKDASRVLRLVST 180
bestiarum 121 SMLIFSGRGIQAKWLLDGTIPRQALPRWNACQKYLIDRLRPVGADVAAKDASRVLRLVET 180
bronchiseptica 121 SLLIFSGRGIQAKWLLDRPVPRQALPRWNACQKYLIDRLMAIGADVAAKDASRVLRLVDT 180
pOK1 181 VNSKSGEICRVVHVENGPDGQPVRYSFEYLAEMLLPVARWTIEQQRQERAERR-QLKLLS 239
aeruginosa 181 VNTKSGDVCRVVHVEHGQDGQPVRYGFEYLAEMLLPVARWDIEQQRRDRAERR-QLKLLP 239
bestiarum 181 VNSKSGEICRVVHVENGPDGQPVRYSFEYLAEMLLPVARWTIEQQRQERAERR-QLKLLS 239
bronchiseptica 181 VNTKSGEICRVVHVETGADGQPVRYGFEYLAEMLLPVARWEIEQQREARAERRQQLKLLP 240
pOK1 240 GAKTDNLRGFSGRQLAWHRLEDLRKLATLRGGVSEGERMQHLFWRLNFLLLSGATHSSQM 299
aeruginosa 240 GGKADNLRGFSGRQLAWDRLEDLRKLGELRGGVREGERMQHLFWRLNFLLLSGATHSGQM 299
bestiarum 240 GAKTDNLRGFSGRQLAWHRLEDLRKLATLRGGVSEGERMQHLFWRLNFLLLSGATHSSQM 299
bronchiseptica 241 GTKTDNLRGFSGRQLAWHRLEDLRKLATLRGGVQEGERMQHLFWRLNFLLLSGATHSGQM 300
pOK1 300 YYEAKALAGELAPPTWAYRDKELMTLYSKAKAYEKGEKISFAGREFAPLYTPKNDTLINL 359
aeruginosa 300 YHEAAALAGELDP-AWSYRSKELMTLYAKAKAYEAGEKVTLGGREFAPLYTPKNDTLISL 358
bestiarum 300 YYEAKALAGELAP-TWAYRDKELMTLYSKAKAYEKGEKISFAGREFAPLYTPKNDTLINL 358
bronchiseptica 301 YHEAKALARELAP-DWQQNSKELMTLYSKAKAYEAGEKITFGGKEYAPLYTPRNDTLINL 359
pOK1 360 FQITDDEQRELKTIISKGMAAERHKDREAD-RRRAAGAVDR---ETYLEAAKTKQAQAQE 415
aeruginosa 359 FQITDDEQRKLRTLISSDMAKERDRERHTA-RRRAAGAVDR---ETYLDAAEAKRAQAQA 414
bestiarum 359 FQITDDEQAQLRTIISKGMAKGRDRARKEA-ARRAAGAVDR---ETYLEAANAKQAQAQA 414
bronchiseptica 360 FQITDQEQCELRTIISRDMAAERRRSATESATRPVGGPLVRWIGKTYLEAANTKQAQAQA 419
pOK1 416 LREQGMTQKQIAEKMGVGLRSVKRYLAEG-------------------AKSVRITNGEA- 455
aeruginosa 415 LKAEGLSVRAIAQRMGISKSLAAMYAKEAAEC----------------PKSVRITADQAM 458
bestiarum 415 LRAQGLSIRAIAQQMGVSVGSVSGYLKAAPGVQSPSVLQA---DLAGCSKSVRITNGEA- 470
bronchiseptica 420 LREQGLSVRAIAAQMGVSVGSVSGYLKAGASVQSGSPITGAVMEKSGVQSPSPITNGEA- 478
pOK1 456 -----------------------HARAVGPA-F 464
aeruginosa 459 PVASIAGSDEGGREGVQSPSVLLMAEPTGRGAV 491
bestiarum 471 -----------------------HARPVGPAFE 480
bronchiseptica 479 -----------------------YARPVGPAFE 488
Fig. 7. Porównanie sekwencji aminokwasowych Orf32 i białek pokrewnych. Sekwencje porównywane z sekwencją Orf32 (pOK1) pochodzą kolejno z Pseudomonas areuginosa (GenBank:
YP_001427363.1) (aeruginosa), Aeromonas bestiarum (GenBank: YP_001220601.1) (bestiarum) oraz Bordetella
bronchiseptica (GenBank: CAI47016.1) (bronchiseptica). Na niebiesko zaznaczono aminokwasy identyczne we
wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Za pomocą kolorowych ramek zaznaczono
przewidywaną strukturę drugorzędowa białka Orf32. Czerwoną czcionką zaznaczono aminokwasy tworzące motyw
helisa – skręt – helisa. Obramowaniem zaznaczono fragment domeny należącej do rodziny DeoR.
40
Poszukiwanie konserwowanych domem białkowych w sekwencji Orf32 wykazało
obecność motywu HTH, odpowiedzialnego za oddziaływanie białka z DNA (HTH Motif
Prediction, Pfam). Wykorzystując program Conserved Domain Search (NCBI) wyróżniono
domenę charakterystyczna dla regulatorów transkrypcji z rodziny DeoR (COG2390). Obie
sekwencje znajdują się w N-końcowej części białka. W białkach homologicznych Orf32 również
występuje sekwencja tworząca potencjalny motyw HTH (Fig. 7).
Założono, że białka Orf30 i Orf31 stanowią jeden system replikacyjny. Byłby to system
podobny do systemów obecnych w plazmidach replikujących się według mechanizmu
odsuwanej nici (ang. strand displacement). W układach tego typu występują trzy kodowane
plazmidowo białka: RepA, RepB i RepC, wykazujące aktywność, odpowiednio, 5’→3’ helikazy,
prymazy i inicjatora (Sakai i Komano, 1996). W pobliżu genów tych białek powinno znajdować
się miejsce startu replikacji oriV, którego w genomie pOK1 nie udało się jednak zidentyfikować
metodami bioinformatycznymi.
2.1.3. System REP3
Białko Orf46 systemu REP3 wykazuje największe podobieństwo sekwencji aa (99%) do: (i)
potencjalnego białka inicjującego replikację Wohlfahrtiimonas chitiniclastica SH04 (GenBank:
ELV07223.1), (ii) do białka replikacyjnego Comensalibacter intestini A911, wyizolowanego z
jelita muszki owocowej (GenBank: AGFR01000020.1) (63% identyczności) oraz (iii)
Acidithiobacillus thiooxidans ATCC 19377 (GenBank: AFOH01000158.1) (54 %
identyczności). Na Fig. 8 przedstawiono porównanie sekwencji aminokwasowych Rep3 z
sekwencjami wymienionych białek. Pokrewne białka (55-49% identyczności) kodowane są także
w przedstawicielach Alphaproteobacteria (Rhodospirillum rubrum F11, GenBank:
AEO46828.1), Betaproteobacteria (Polaromonas naphthalenivorans CJ2, GenBank:
ABM40236.1) i Gammaproteobacteria (Arsenophonus nasoniae, GenBank: CBA72217.1).
Badania przeprowadzone przy użyciu programu InterProScan pozwoliły na
zakwalifikowanie białka Rep3 do rodziny bakteryjnych białek inicjacji replikacji RepA (Pfam:
PF10134). Członkowie tej rodziny to białka zdolne do wiązania jednoniciowego DNA,
zaangażowane w procesy replikacji, rekombinacji i naprawy DNA.
41
Rep3 1 LDMASMEFPLFALKAGDKKIREYCQGDFRIEIVPSVKYGRATIHDKDIWIYCISKLMQAL 60
A911 1 DDIASMEHPLFALKTGDNRVRRYEHNNFSIVIAPNPEYGMATIHDKDIWIYCISKLMQAI 60
ATCC_19377 1 DDTASMEHPLFALRAGDKRVRAYKRGNYKVEIQPGP-YGCATIHDKDVWIYCISQLMEAV 59
SH04 1 LDMASMEFPLFALKAGDKKIREYCQGDFRIEIVPSVKYGRATIHDKDIWIYCISKLMQAL 60
Rep3 61 RDG-EEINRTVHFTIYDYLKITNRHICGATYERTKDSLDRLSGTRVTTNIETDKIKEARG 119
A911 61 YEE-KEISRTVHFTIYDYLITTNRGVDGRYYEKAKNALDRLRSTNITTNIETAKTREARG 119
ATCC_19377 60 NRGRDDISRTVRFVAYDFLVTTNRPVAGVGYDRMADALRRLSGTRIETNIETDGKRERAG 119
SH04 61 RDG-EEINRTVHFTIYDYLKITNRHICGATYERTKDSLDRLSGTRVTTNIETDKIKEARG 119
Rep3 120 FGLIDAWRIVEE-KDGRMIRVSVTLPEWLYRSIASKSVLTINPDYFRLRKPLDRRIYELA 178
A911 120 FGLIDAWRVVEE-KDGRMVRVSVTLPDWLYRSVTSNQVLTISPDYFRLRKPLDRRIYELA 178
ATCC_19377 120 FGLIDAWKVVERGRDNRMTAVEVTLPDWLFRSVKARHVLTLDRDYFRLRKPLDRRIYEIA 179
SH04 120 FGLIDAWRIVEE-KDGRMIRVSVTLPEWLYRSIASKSVLTINPDYFRLRKPLDRRIYELA 178
Rep3 179 RKHCGNNQSWKFNLSTLHQRSGSTASMKEFRKAIKSLAESNQLPDYCVEFDGKKNQVTFV 238
A911 179 RKHCGSQKEWKIRLELLLKKTGSSENLREFRRSIKSLVATNELPDYNVFYNLESDLVNFT 238
ATCC_19377 180 RKHCGIQPRWRATTATLHEKSGSSATLREFRRLIKGLSDSNELPGYQVVFDHDADVVTFY 239
SH04 179 RKHCGNNQSWKFNLSTLHQRSGSTASMKEFRKAIKSLAESNQLPDYCVEFDGKKNQVTFV 238
Rep3 239 KRVCLKDLTEEIKVEAKESKPKRKRITEYEAGQLARPGEEWPDLLKRIGSEYHVIFDQNS 298
A911 239 QKYKL------------------------------------------------------- 243
ATCC_19377 240 PKNGRAGSMAQIRDLLKKPAQTKKKIT--------------------------------- 266
SH04 239 KRVCLKDLTEEIKVEAKEHRPKRKRITEYEAGQLARPGEEWPDLLKRIGSEYHVIFDQNL 298
Rep3 299 ERQ
A911 244 --V
ATCC_19377 267 KQA
SH04 299 -ER
Fig. 8. Porównanie sekwencji aminokwasowych Rep3 pOK1 i białek pokrewnych. Sekwencje porównywane z Rep3 (Rep3) pochodzą kolejno z Comensalibacter intestini A911 (GenBank:
AGFR01000020.1) (A911), Acidithiobacillus thiooxidans ATCC 19377 (GenBank: AFOH01000158.1)
(ATCC_19377) oraz Wohlfahrtiimonas chitiniclastica SH04 (GenBank: ELV07223.1). Na niebiesko zaznaczono
aminokwasy identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich.
W regionie międzygenowym zlokalizowanym powyżej rep3 znajduje się prawdopodobne
miejsce oriV, w którym wyróżniono region bogaty w pary G+C (GCR; 140-180 bp, zawartość
par G+C - 37,2%) oraz poprzedzający go region bogaty w pary A+T (ATR; ok. 150-160 bp,
G+C - 26,2%). Na Fig. 9. przedstawiono organizację omawianego regionu. W regionie GCR
występują 4 proste, bezpośrednio następujące po sobie 23-nukleotydowe powtórzenia sekwencji,
(IT1-IT4) - potencjalne iterony. Trzy z nich są identyczne (IT1-IT3), natomiast czwarte jest
mniej konserwowane (pierwszy nukleotyd IT4 jest jednocześnie ostatnim IT3). W regionie GCR
wyróżniono ponadto sekwencje potencjalnego promotora genu rep3 5’-
TTGACA(N15)AATAGC-3’ oraz miejsce wiązania rybosomu 5’-AGGA-3’.W regionie ATR
wyróżniono natomiast 12-nukleotydowy palindrom oraz potencjalne miejsce wiązania białka
DnaA o sekwencji 5’-TAATACACA-3’ (Fig. 9).
42
Fig. 9. Organizacja genetyczna oriV REP3 plazmidu pOK1.
W górnym panelu przedstawiono profil zawartości par G+C w sekwencji modułu (Artemis, okno 120 nt),
zaznaczono położenie regionów bogatych w pary G+C (GCR) i A+T (ATR) względem genu rep3. Barwa paska
poniżej sekwencji nukleotydowej obrazuje średnią zawartość par G+C (duża zawartość – bordowa). W sekwencji
wyróżniono iterony (IT), sekwencje palindromu (Pd), sekwencje -10 i -35 oraz miejsce rbs. Gwiazdką zaznaczono
zmiany nukleotydowe w ostatnim iteronie. Zaznaczono prawdopodobne miejsce wiązania białka DnaA. Zieloną
strzałką zaznaczono początek genu rep3.
2.2. Systemy odpowiedzialne za stabilne utrzymywanie plazmidu w komórce
Podczas podziału komórek bakterii, obecne w nich plazmidy ulegają segregacji do komórek
potomnych. Plazmidy małe (do kilku tysięcy par zasad) są trwale dziedziczone dzięki
występowaniu w komórce w dużej liczbie kopii. W tym przypadku plazmidy segregowane są w
sposób losowy, bowiem prawdopodobieństwo, że dany plazmid nie znajdzie się w komórce
potomnej jest bardzo małe. Jeśli w komórce, która ulega podziałowi występuje n cząsteczek
plazmidowych to prawdopodobieństwo, że żadna z kopii plazmidu nie trafi do komórki
potomnej wynosi (0,5)n. Podczas każdego podziału powstają dwie komórki potomne, zatem
prawdopodobieństwo, że którakolwiek z nich nie będzie zawierać plazmidu wynosi: P = 2(0,5)n
= 2(1-n)
(Nordström i Austin 1989).
W naturze, plazmidy występujące w niskiej liczbie kopii są również trwale utrzymywane
w populacjach bakterii, niezależnie od obecności presji selekcyjnej. Dzieje się tak dzięki
istnieniu specyficznych mechanizmów skutecznie przeciwdziałających utracie plazmidu podczas
43
podziału. Wyróżniono trzy grupy tego typu systemów. Do pierwszej należą systemy miejscowo-
specyficznej rekombinacji (MRS), które działają przed podziałem komórki (Fig. 10A). Dzięki
nim formy oligomeryczne plazmidów (powstałe m.in. w skutek rekombinacji pomiędzy
cząsteczkami plazmidów) są rozdzielane do samodzielnych monomerów. Z kolei wzrost liczby
monomerów w komórce optymalizuje ich losową segregację do komórek potomnych. Drugą
grupę stanowią systemy aktywnego rozdziału plazmidów (partycji; PAR) do komórek
potomnych (Fig. 10B). Działają one w trakcie podziału komórki. Trzecia grupa to systemy
addykcyjne (TA), których działanie polega na "uzależnieniu" komórek gospodarza od
występującego w nich plazmidu (Fig. 10C). Powodują one eliminację komórek
bezplazmidowych, ich działanie jest zatem widoczne na poziomie populacji. Systemy należące
do drugiej i trzeciej grupy zapewniają dziedziczenie lepsze niż losowe.
Fig. 10. Mechanizmy stabilnego dziedziczenia plazmidów.
(A) Miejscowo-specyficzna rekombinacja; ciemne kółka na plazmidach oznaczają miejsca res; litera x pomiędzy
plazmidami lub wewnątrz dimeru plazmidowego oznacza zachodzenie rekombinacji. (B) Partycja; jasne prostokąty
oznaczają tzw. miejsca centromerowe. (C) Mechanizm addykcyjny czyli posegregacyjna eliminacja komórek
bezplazmidowych; kontury narysowane przerywaną linią oznaczają śmierć komórki na skutek utraty plazmidu
(Zielenkiewicz i Cegłowski, 2002).
W przypadku plazmidów występujących w 1-2 kopiach w przeliczeniu na chromosom
gospodarza, występują często wszystkie trzy opisane wyżej rodzaje mechanizmów
stabilizujących. W kolejnych podrozdziałach przedstawiono opis systemów tego typu
zidentyfikowanych w genomie plazmidu pOK1.
2.2.1. System partycyjny
Systemy aktywnego rozdziału (PAR), nazywane partycyjnymi, to typowe komponenty
plazmidów niskokopiowych. Warunkują one początkowo odpowiednie umiejscowienie
cząsteczek plazmidów w komórce . Do prawidłowego przebiegu tego procesu niezbędna jest
obecność dwóch białek partycyjnych oraz sekwencji centromeropodobnej, specyficznej dla
44
danego systemu PAR. Homologi plazmidowych białek partycyjnych kodowane są również w
chromosomach bakterii, i prawdopodobnie uczestniczą w ich rozdziale. Mechanizm aktywnej
partycji jest zatem bardzo pierwotny, z ewolucyjnego punktu widzenia (Gerdes i wsp., 2000).
Niektóre z systemów PAR funkcjonują w różnych gospodarzach, niekiedy nawet po
przeniesieniu z bakterii gramujemnych do gramdodatnich (Yamaichi i Niki, 2000).
W sekwencji plazmidu pOK1 wyróżniono 5 ORF (orf11, orf12, orf16, orf33 oraz orf34;
Fig. 1) wykazujących podobieństwo sekwencji do ORF białek partycyjnych. Należy podkreślić,
że orf16 jest niekompletna i koduje jedynie 43 aminokwasy identyczne z N-końcową częścią
orf11. Brak pozostałej części sekwencji orf16 może wynikać z wbudowania się w obrębie tej
ramki sekwencji insercyjnej, zawierającej orf17 i orf18 (Fig. 1). Sekwencja aminokwasowa
Orf11 wykazuje na 99% podobieństwo z sekwencją ORF Wohlfahrtiimonas chitiniclastica
SH04, opisanej jako inhibitor inicjacji sporulacji Soj. Na podstawie analiz porównawczych in
silico sekwencji Orf11, białko to można zaliczyć do rodziny CbiA – białek typu
CopQ/CopB/MinD/ParA wiążących się z DNA (Pfam: PF01656). Inne białka pokrewne Orf11
(podobieństwo 70-78%) zostały opisane jako białka partycyjne ParA plazmidów i pochodziły z
różnych gatunków bakterii. W N-końcowej części tych białek zidentyfikowano zmieniony
motyw Walkera A: 5’ – KGG(S/A)GKT – 3’, tworzący tzw. pętlę P, odpowiadającą za wiązanie
ATP (Lutkenhaus i Sundaramoorthy, 2003) oraz aminokwasy zaangażowane w wiązanie jonów
magnezu (NCBI Conserved Domain Search) (Fig. 11).
Potencjalne białko Orf12 wykazuje identyczność sekwencji na poziomie 47-53% do
białek partycyjnych ParB. We wszystkich tych białkach obecna jest charakterystyczna domena
typu ParG (Pfam: PF09274). Podobnej domeny nie udało się zidentyfikować w sekwencji
wyróżnionej w plazmidzie pOK1. W tej domenie występuje motyw wstęga-helisa-helisa
warunkujący wiązanie się z DNA (Golovanov i wsp., 2003). Motyw ten jest obecny w sekwencji
Orf12 (analiza przy użyciu programu InterProScan), co może wskazywać na funkcjonalność tego
białka.
Na podstawie przedstawionych wyżej wyników analiz porównawczych wydaje się, że
produkty orf11 i orf12 kodują, odpowiednio, potencjalne białka typu ParA i ParB. Analiza
sekwencji aminokwasowych tych białek pozwala określić je jako składniki systemu
partycyjnego typu Ib (Ebersbach i Gerdes, 2005). Wskazuje na to: (i) typowa wielkość białek
(192-308 aa dla ParA, 46-131 aa dla ParB), (ii) obecność zmienionego motywu Walkera w N-
końcowej części białka ParA oraz brak motywu HTH, (iii) słabe konserwowanie sekwencji
aminokwasowej białka ParB. orf11 i orf12 znajdują się w tej samej orientacji transkrypcyjnej,
odległość między nimi wynosi 61 pz. Możliwe jest, że tworzą one operon, co jest cechą
45
charakterystyczną systemów PAR. W systemach partycyjnych typu Ib sekwencja
centromeropodobna (parS), rozpoznawana przez białko ParB, znajduje się zazwyczaj powyżej
operonu. Składa się ona z kolejno ułożonych prostych powtórzeń sekwencji (Ebersbach i Gerdes,
2005). W sekwencji plazmidu pOK1 nie zidentyfikowano sekwencji o takiej strukturze -
zarówno poniżej, jak i powyżej genów operonu.
pOK1 1 MKVISVLNQKGGSGKTTIATHLARCIHNAGSSVLLVDSDPQGSARDWSAVNEENPITVIG 60
SH04 1 MKVISVLNQKGGSGKTTIATHLARCIHNAGSSILLVDSDPQGSARDWSAVNEENPITVIG 60
axonopodis 1 MKVIAVLNQKGGSGKTTIATHLARALQLAGADVLLVDSDPQGSARDWAAVREDQPLTVVG 60
oboediens 1 MKVIAVLNQKGGSGKTTIATHLARALQIGGADVLLVDSDPQGSARDWAAVREEQPVTVVG 60
pOK1 61 IDRPTIDRDLKAISNKDFIVIDGAPQTADLAISAIKASDFILIPVQPSPYDIWATSDLVD 120
SH04 61 IDRPTIDRDLKAISNKDFIVIDGAPQTADLAISAIKASDFILIPVQPSPYDIWATSDLVD 120
axonopodis 61 IDRPTIDRDVKAIGRRDFVVIDGAPQAADLAVSAIKAADFVLIPVQPSPYDIWATADLVE 120
oboediens 61 IDRPTIERDLKNIARKDFVVIDGAPQAADLAVSAIKASDFVLIPVQPSPYDIWATSDLVD 120
pOK1 121 LVKQRIEMTDGKLKVAFVVSRAITGTKIGHEIHEALEGYELPILTTRITQRISYPSSAAL 180
SH04 121 LVKQRIEMTDGKLKVAFVVSRAITGTKIGHEIHEALEGYELPILTTRITQRISYPSSAAL 180
axonopodis 121 LVKQRIEVTDGRLQAAFVVSRAIKGTRIGGEVAEALAGYELPILESRITQRVSYPGTAAA 180
oboediens 121 LVKQRIEVTDGKLQAAFVVSRAIKGTRIGAEITEALKGYGLPILESRITQRVSYPGTAAG 180
pOK1 181 GKTVFDIEPKGEASKEILNLYNEIMDEYLSK 211
SH04 181 GKT---------------------------V 184
axonopodis 181 GTTVLESEPEGDAAREVQALAAEIKSKL--I 209
oboediens 181 GSTVMDVEPGSDASKEILSLSNEIKRKL--I 209
Fig. 11. Porównanie sekwencji aminokwasowych Orf11 i białek pokrewnych.
Sekwencje porównywane z sekwencją wyróżnioną w plazmidzie pOK1 pochodzą kolejno z Wohlfahrtiimonas
chitiniclastica SH04 (GenBank: WP_008316972.1) (SH04), Xanthomonas axonopodis (GenBank:
WP_017154884.1) (axonopodis) oraz Gluconacetobacter oboediens (GenBank: WP_010516180.1) (obodiens). Na
niebiesko zaznaczono aminokwasy identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich.
Kolorowymi ramkami zaznaczono przewidywaną strukturę drugorzędowa opisywanego białka. Obramowaniem
zaznaczono aminokwasy tworzące zmieniony motyw Walkera. Żółta czcionką zaznaczono aminokwasy
zaangażowane w wiązanie jonów magnezu.
Potencjalny produkt białkowy orf33 również wykazuje podobieństwo sekwencji aa do
białek partycyjnych. Najbliższym homologiem (podobieństwo sekwencji 57%) jest białko
pochodzące z Nitrosomonas eutropha C91, opisane jako białko partycyjne C (GenBank:
YP_743797.1), o długości identycznej z Orf33. Zarówno w sekwencji Orf33, jak i jego
homologów, nie wyróżniono żadnych konserwowanych domen białkowych ani motywów
sekwencji (analiza porównawcza programami: Pfam, NCBI Conserved Domain Search,
InterProScan). Kolejna ORF (orf34) koduje potencjalne białko, wykazujące podobieństwo
sekwencji (99%) do białka ParA plazmidu pAb5S9 Aeromonas bestiarum (GenBank:
46
YP_001220602.1). Inne pokrewne białka również zostały opisane jako białka o aktywności
ATPaz, zaangażowane w partycje plazmidów lub chromosomów.
W sekwencji Orf34 oraz w sekwencjach pokrewnych białek możliwe jest wyróżnienie
zmienionego motywu Walkera oraz miejsc odpowiedzialnych za wiązanie jonów magnezu (tak
jak w przypadku orf11). Również w tym przypadku analiza porównawcza pozwoliła zaliczyć
Orf34 do rodziny CbiA – białek typu CopQ/CopB/MinD/ParA wiążących się z DNA (Pfam:
PF01656) (Fig. 12).
pOK1 1 MIIGVLNQKGGVGKTTLSVNIAAALAHSGARVLLIDADPQGSSLDWSAAREGDPIFSVVG 60
bestiarum 1 MIIGVLNQKGGVGKTTLSVNIAAALAHSGARVLLIDADPQGSSLDWSAAREGDPIFSVVG 60
savastanoi 1 MIIGVLNQKGGVGKTTLSVNIAAALAQGGARVLLIDADPQGSSLDWSAAREGEPLFSVVG 60
variicoloris 1 MIVGLLNQKGGVGKTTLSVNLAASLARTGARVLLIDADPQGSALDWAAAREGEPLFSVVG 60
pOK1 61 LPRASVHKEIGQVGQGYDHIIIDGPPRVTDLARSAIMASDLVLIPVQPSPYDVWAADEVV 120
bestiarum 61 LPRASVHKEIGQVGQGYDHIIIDGPPRVTDLARSAIMASDLVLIPVQPSPYDVWAADEVV 120
savastanoi 61 LPRPSIHKEISQVGKGYDHIIIDGPPRVTDLARSAIMASDVVLIPVQPSPYDIWAADEVV 120
variicoloris 61 LPRPTVHKEIGQIGHGYDHIIIDGPPRVTDLARSAIMAADVVLIPVQPSPYDIWAADEVV 120
pOK1 121 KLIQEATVYKENLKSAFVVNRKIANTAIGRDVGEALAAYEMPILTSTVTQRVIYAEAAAQ 180
bestiarum 121 KLIQEATVYKENLKSAFVVNRKIANTAIGRDVGEALAAYEMPILTSTVTQRVIYAEAAAQ 180
savastanoi 121 KLVQEATVYKEKLKYAFVVNRKIANTAIGRDVGDALAAYPVPVLSSTITQRVIYAEAAAQ 180
variicoloris 121 KLIEEARVYKENLKSAFVVNRKIANTAIGRDVGEALAAYPVPALVASITQRVVFAEAAAQ 180
pOK1 181 GKAVFEIDTVGPAAAEIAALVAEILEFAK 209
bestiarum 181 GKAVFEIDTAGPAAAEIAALVAEILEFAK 209
savastanoi 181 GKAIFEIAAEGPATAEIQTLVAELLEFGK 209
variicoloris 181 GRAVHEIDGQGPAAAEIEAMRAELMEFAR 209
Fig. 12. Porównanie sekwencji aminokwasowych Orf34 białek pokrewnych.
Sekwencje porównywane z sekwencją wyróżnioną w plazmidzie pOK1 pochodzą kolejno z Aeromonas bestiarum
(GenBank: YP_001220602.1) (bestiarum), Pseudomonas savastanoi (GenBank: WP_004661920.1) (savastanoi)
oraz Singularimonas variicoloris (GenBank: WP_020651362.1) (variicoloris). Na niebiesko zaznaczono
aminokwasy identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Kolorowymi ramkami
zaznaczono przewidywaną strukturę drugorzędowa Orf34. Obramowaniem zaznaczono aminokwasy tworzące
zmieniony motyw Walkera. Żółta czcionką zaznaczono aminokwasy zaangażowane w wiązanie jonów magnezu.
Analiza porównawcza wskazuje, że produkt białkowy Orf34 to składnik systemu
partycyjnego Ib, o czym świadczą: typowa wielkość białka (209aa), obecność zmienionego
motywu Walkera w części N-końcowej oraz brak motywu HTH. Ponieważ w sekwencji pOK1
nie wyróżniono w pobliżu orf34 potencjalnego genu kodującego białko ParB możliwe jest, że
jest to system defektywny. Jest mało prawdopodobne, aby opisywana wcześniej orf33 mogła
kodować białko typu ParB. Oba potencjalne geny znajdują się w znacznej odległości od siebie –
47
315 pz. Zarówno powyżej, jak i poniżej opisywanych ORF, nie zidentyfikowano potencjalnej
sekwencji centromeropodobnej.
2.2.2. Systemy toksyna-antytoksyna
Komórki pozbawione plazmidów pojawiają się w populacji z niską częstością, co jest, między
innymi, wynikiem działania systemów toksyna-antytoksyna (TA), warunkujących
posegregacyjną eliminację komórek bezplazmidowych.
Podstawą funkcjonowania systemów TA jest kodowanie dwóch czynników - jednego
wywołującego efekt toksyczny (toksyna), oraz drugiego - nietrwałej antytoksyny (odtrutki),
przeciwdziałającej działaniu toksyny. Stężenie antytoksyny w komórce jest zazwyczaj większe
niż toksyny. Toksyną zawsze jest białko, a antytoksyną może być białko lub antysensowny
RNA. W komórce plazmidowej zachodzi ciągła synteza antytoksyny, która tworzy stabilny
kompleks z toksyną, co zapobiega ekspresji efektu toksycznego. Z chwilą utraty plazmidu, ilość
antytoksyny szybko ulega zmniejszeniu (degradacja przez proteazy komórkowe Lon lub Clp), co
powoduje uwolnienie toksyny z kompleksu lub rozpoczęcie jej syntezy. Komórka
bezplazmidowa jest eliminowana, a w populacji pozostają jedynie komórki posiadające plazmid.
Zazwyczaj białko antytoksyny zawiera dwie domeny: (i) odpowiedzialną za wiązanie DNA oraz
(ii) za interakcje z toksyną (Brown i wsp., 2009).
Systemy TA występują także powszechnie, często w wielu kopiach, w chromosomach
bakteryjnych (Gerdes, 2000). Wykazano zaangażowanie tych systemów w odpowiedzi ścisłej na
warunki stresowe. Funkcją chromosomowych systemów TA jest dostosowanie poziomu syntezy
makromolekuł (białek, DNA) do ilości dostępnych składników odżywczych. Ich aktywacja, w
zależności od rodzaju systemu, może obniżyć poziom replikacji lub translacji, co prowadzi do
zmniejszenia tempa metabolizmu (Gerdes i wsp., 2005). Wykazano, że chromosomowe
homologi genów systemów TA, po przeniesieniu do plazmidów zwiększają ich stabilność
(Aizenman i wsp., 1996).
W sekwencji plazmidu pOK1 wyróżniono trzy systemy TA. Wszystkie wykazują
największą identyczność sekwencji aa, na poziomie 95-100%, z systemami zidentyfikowanymi
w genomie szczepu Wohlfahrtiimonas chitiniclastica SH04. Dwa systemy są identyczne.
Wszystkie zidentyfikowane loci to dwugenowe układy, w których gen antytoksyny poprzedza
gen toksyny. Na Fig. 13 przedstawiono schemat organizacji omawianych systemów TA.
48
Fig
Fig. 13. Schemat organizacji genetycznej systemów TA wyróżnionych w genomie plazmidu pOK1.
Kolorowymi strzałkami zaznaczono ORF systemów TA (ant – gen antytoksyny, tox – gen toksyny) oraz sekwencji
inercyjnych (IS), wbudowanych w jeden z układów. Kolorową czcionką zaznaczono potencjalne sekwencje
promotorów.
Analizowane systemy wykazują wyraźne podobieństwo do systemów, w których
zarówno toksyna jak i antytoksyna są białkami. Systemy te należą zatem do II typu systemów
TA (Yamaguchi i Inouye, 2009). Kompleks toksyny i antytoksyny lub sama antytoksyna działa
jako represor transkrypcji operonu TA, poprzez wiązanie się do palindromowej sekwencji
znajdującej się w regionie promotorowym operonu. Wiązanie to jest możliwe dzięki domenie
obecnej w antytoksynie, o strukturze wstążki-helisy-helisy lub HTH (Brown i wsp., 2009). W
większości przypadków gen antytoksyny poprzedza gen toksyny. Przewidywane białkowe
produkty orf14 i orf15 pOK1 (Pfam: PF02604, PF06769) wykazują 100% podobieństwo
sekwencji do białek toksyny YoeB i antytoksyny YefM (system yoeB-yefM) (Zhang i Inouye,
2009). Antytoksyna YefM jest wysoce niestabilna, co wynika z jej degradacji przez proteazę Lon
oraz ATP-zależne proteazy serynowe. Wykazano, że białko to w czystej formie istnieje w
postaci zdenaturowanej, bez struktury drugorzędowej. Gdy YefM podlega ekspresji wraz z
toksyną YoeB, dimer YefM tworzy stabilny kompleks z cząsteczką YoeB (Cherny i Gazit,
2004). YoeB łączy się z podjednostką 50S rybosomu, specyficznie blokując tworzenie
49
kompleksu inicjatorowego. Oczyszczona toksyna YoeB wykazuje aktywność endorybonukleazy
(Zhang i Inouye, 2009). Na Fig. 14 i Fig. 15 przedstawiono porównanie sekwencji
aminokwasowych omawianych białek z ich najbliższymi homologami.
ant\SH04 1 MHVFTYTDARNNLKSVLDKVVDDADVAFITRKEGGHAVVMGQDHYNSLMETLYLLSSPNN 60
ANC 1 MHVFTYTDARNNLKSVLDKVIDDADVAFITRKEGGHAVVMGQDHYDSLMETLYLLSSPNN 60
CIP 1 MHVFTYTDARNNLKSVLDKVIDDVDVAFITRKEGGHAVVMGQDHYDSLMETLYLLSSPNN 60
Naval-82 1 MHVFTYTDARNNLKSVLDKVIDDADVAFITRKEGGHAVVMGQDHYDSLMETLYLLSSPNN 60
ant\SH04 61 TNRLNESIAQLRSGQVTIRELIED--E 85
ANC 61 TTRLNESIAQLRAGKTKQRELIIDDES 87
CIP 61 ASRLNESIAQLRAGKTKHRELIEDDES 87
Naval-82 61 TTRLNESIAQLRAGKTKQRELIKDDES 87
Fig. 14. Porównanie sekwencji aminokwasowych białka antytoksyny Orf15 i białek pokrewnych.
Sekwencje porównywane z sekwencją antytoksyny (identyczna z sekwencją pochodzącą z Wohlfahrtiimonas
chitiniclastica SH04) (ant\SH04) pochodzą kolejno z Acinetobacter indicus 4215 (GenBank: EPF73072.1) (ANC),
Acinetobacter sp. CIP 70.18 (GenBank: WP_000557944.1) (CIP) oraz Acinetobacter baumannii (GenBank:
WP_000557943.1) (Naval-82). Na niebiesko zaznaczono aminokwasy identyczne we wszystkich sekwencjach, na
szaro – identyczne w trzech z nich. Za pomocą kolorowych ramek zaznaczono przewidywaną strukturę
drugorzędowa opisywanego białka antytoksyny (YefM).
tox\SH04 1 --MNSRNIEWTSNSWDEYIYWQTQDKKILKRINSLIKECQRTPFEGTGKPEPLKANLSGF 58
AYE 1 MRMTNRNVEWTDNAWDEYIYWQTQDKKILKRINTLIKECQRTPFEGTGKPEPLKANLSGF 60
CIP 1 --MTSRNVEWTENAWDEYIYWQTQDKKILKRINTLIRECQRTPFEGTGKPEPLKANLSGF 58
baumannii 1 --MTSRNVEWTENAWDEYIYWQTQDKKILKRINTLIRECQRTPFEGTGKPEPLKANLSGF 58
tox\SH04 59 WSRRIDEKHRLVYEVTDEKISIVQCRFHY 87
AYE 61 WSRRIDEKHRLVYEVTDERISIIQCRFHY 89
CIP 59 WSRRIDEKHRLVYEVTDERISIVQCRFHY 87
baumannii 59 WSRRIDEKHRLVYEVTDERISIIQCRFHY 87
Fig. 15. Porównanie sekwencji aminokwasowych białka toksyny Orf14 i białek pokrewnych.
Sekwencje porównywane z sekwencją toksyny (identyczna z sekwencją pochodzącą z Wohlfahrtiimonas
chitiniclastica SH04) (tox\SH04) pochodzą kolejno z Acinetobacter baumannii AYE (GenBank: YP_001708683.1)
(AYE), Acinetobacter junii CIP 107470 (GenBank: ENV52222.1) (CIP) oraz Acinetobacter baumannii (GenBank:
WP_000203952.1) (baumanii). Na niebiesko zaznaczono aminokwasy identyczne we wszystkich sekwencjach, na
szaro – identyczne w trzech z nich. Za pomocą kolorowych ramek zaznaczono przewidywaną strukturę
drugorzędowa opisywanego białka toksyny (YoeB).
W systemie orf14-orf15 pOK1 gen antytoksyny (o długości 258 pz) nakłada się (8
nukleotydów) na gen toksyny (264 pz). Przed operonem zidentyfikowano potencjalny promotor
(Fig. 13), nie występuje tam jednak sekwencja palindromowa, konserwowana w innych
systemach TA, (warunkująca oddziaływania z represorem).
Kolejny system TA pOK1 tworzą orf20 i orf23. Ich produkty białkowe wykazują
największe podobieństwo do hipotetycznych białek kodowanych w genomie Wohlfahrtiimonas
chitiniclastica. Pokrewne białka (50-70% identyczności sekwencji) to antytoksyny i toksyny z
50
rodziny RelB-RelE. Na Fig. 16 i Fig. 17 przedstawiono porównanie omawianych sekwencji z
białkami im pokrewnymi.
W genomie pOK1 gen antytoksyny i toksyny zostały rozdzielone w wyniki transpozycji
dwóch sekwencji insercyjnych, co spowodowało rozerwanie ciągłości genu antytoksyny
(przewidywane skrócenie białka z 73 do 68 aminokwasów). Prawdopodobnie system ten nie jest
funkcjonalny. Identyczny moduł TA występuje również w innej lokalizacji pOK1 (orf47 i orf48)
(Fig. 1 i Fig. 13), nie jest on jednak zinaktywowany przez IS.
ant 1 MSIISIRLNDYEANLFKEYAAFHGESLSSLFKASLLEKMEDELDLKLLEEAIIYNEKHPE 60
9401234 1 MT-ISVRLSERDAKLFKTYADINGISMSELIRSSVLERIEDEYDIKIYEEAMKEYLSDPE 59
SH04 1 MSIVSIRLNDHEANLFKEYAEFHGASLSSLFKASLLEKMEDELDIKLLEEAIIYNKKHPE 60
ureolytica 1 MSIISVRLNATEERLFTEYAEFHGKSLSTLLKESLAEKMEEELDAKLLVEAKEYNKKNPE 60
ant 61 TYTHDEVKKALGL 74
9401234 60 TYSMDEVEKELGL 73
SH04 61 TYTHDEVRKVLGL 74
ureolytica 61 TYTHQQVKEKLGL 74
Fig. 16. Porównanie sekwencji aminokwasowych białka antytoksyny Orf20 i białek pokrewnych.
Sekwencje porównywane z sekwencją antytoksyny pOK1 (ant) pochodzą kolejno z Clostridiales bacterium
9401234 (GenBank: WP_019214504.1) (9401234), Wohlfahrtiimonas chitiniclastica SH04 (GenBank:
ELV07245.1) (SH04) oraz Oligella ureolitica (GenBank: WP_018574598.1) (ureolitica). Na niebiesko zaznaczono
aminokwasy identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Kolorowymi ramkami
zaznaczono przewidywaną strukturę drugorzędowa opisywanego białka antytoksyny.
tox 1 M-YQVIYTAKAVKSLKKIDKTQAKLILSWIEKNLIGCSDPRIKGKEIKGDL-ADWRYRVG 58 MJ3 1 MSYQVVYTKKAIKSLKKVDKAQQRLIIAWIEKHLINAKDPRALGKALKEDLKAYWRYRVG 60
SH04 1 M-YQVIYTAKALKSLKKIDKTQAHLILNWIEKNLIGCSDPRIKGKEIKGNL-ADWRYRVG 58
ureolytica 1 M-FQVIYTAKALKSLSKLDKTQARLIVAWIEKNLVNSSNPRFTGKNIKGDL-ADWRYRVG 58
tox 59 DYRLLCNILDEEIIIEVINVGHRKDIYK 86
MJ3 61 DYRILADINDNEIKIIVFNIGHRKDIYE 88
SH04 59 DYRLLCNISDEEITIEVINVGHRKDIYK 86
ureolytica 59 NYRILCHIIDQTITIEVVNIGHRKDIYK 86
Fig. 17. Porównanie sekwencji aminokwasowych białka toksyny Orf23 i białek pokrewnych.
Sekwencje porównywane z sekwencją toksyny pOK1 (tox) pochodzą kolejno z Salimicrobium sp. MJ3 (GenBank:
WP_008587660.1) (MJ3), Wohlfahrtiimonas chitiniclastica SH04 (GenBank: ELV07244.1) (SH04) oraz Oligella
ureolitica (GenBank: WP_018574597.1) (ureolytica). Na niebiesko zaznaczono aminokwasy identyczne we
wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Kolorowymi ramkami zaznaczono przewidywaną
strukturę drugorzędowa opisywanego białka toksyny.
System relBE jest jednym z najlepiej poznanych systemów TA. Toksyna (RelE)
oddziałuje z miejscem A rybosomu, powodując przecięcie mRNA pomiędzy drugim a trzecim
nukleotydem kodonu stop, co prowadzi do zahamowania translacji (Pedersen i wsp., 2003).
Wykazano, że RelE przecina mRNA na początku regionu kodującego (pierwsze sto kodonów)
51
(Hurley i wsp,. 2011). Sama toksyna RelE nie ma aktywności endorybonukleolitycznej, uważa
się jednak że jest czynnikiem oddziałującym z rybosomem, stymulującym jego endogenną
aktywność rybonukleolityczną (Pedersen i wsp., 2003). Białka RelE i RelB tworzą
tetrameryczny kompleks, w którym cząsteczka RelB okala cząsteczkę RelE. W pełni
funkcjonalne homologi systemu relBE są znajdowane w szczepach bakteryjnych oraz u
archeonów, zarówno w chromosomach, jak i w plazmidach.
W sekwencji antytoksyny pOK1 nie znaleziono żadnej konserwowanej domeny. W
sekwencji toksyny znajduje się domena charakterystyczna dla białek systemów stabilizujących
plazmid (Pfam: PF05016). Do tej rodziny należą białka systemów parDE oraz relBE.
2.2.3 System restrykcji-modyfikacji
Systemy restrykcji modyfikacji (R-M) występują powszechnie u Procaryota. Geny tych
systemów identyfikuje się zarówno w chromosomach, jak i w plazmidach. Systemy R-M
składają się zazwyczaj jedynie z genów kodujących dwa enzymy: (i) endonukleazę (REaza),
rozpoznającą specyficzną sekwencję w DNA oraz (ii) metylotranferazę (MTaza), która poprzez
metylację tej sekwencji, zabezpiecza ją przed przecięciem przez endonukleazę. Uważa się, że
obecność tego typu systemu zabezpiecza komórkę przed inwazją obcego DNA. Udowodniono,
że obecność genów systemów R-M (np. EcoRI lub PaeR7) w plazmidzie zwiększa jego
stabilność segregacyjną (Naito i wsp., 1995). Systemy te, podobnie jak systemy TA, funkcjonują
na zasadzie posegregacyjnego zabijania komórek bezplazmidowych. W tym wypadku obydwa
enzymy - endonukleaza (odpowiednik toksyny) i metylotransferaza (odpowiednik antytoksyny)
są stabilnymi białkami. Efekt toksyczny objawiający się w komórkach bezplazmidowych
(pozbawionych systemu R-M) polega, w tym przypadku, na stopniowym rozcieńczaniu białek
endonukleaz i metylotransferazy w kolejnych podziałach komórkowych. W rezultacie nie
wszystkie sekwencje genomu są metylowane, a wówczas nawet śladowa aktywność
endonukleazy wystarcza do przecięcia sekwencji i rozerwania ciągłości genomu. W sekwencji
plazmidu pOK1 wyróżniono dwie ORF systemu R-M: (i) orf05 – kodująca MTazę i orf07 -
kodująca REazę. Obie ORF ułożone są w tej samej orientacji transkrypcyjnej (Fig. 1).
ORF kodująca potencjalną metylotransferazę wykazuje największą identyczność
sekwencji aa (58%) do metylotransferazy N-4/N-6 pochodzącej z Acinetobacter sp. HA
(GenBank: WP_008305575.1), opisanej jako adenino-zależna metylotransferaza Mod. Inne
białka homologiczne Orf5 pOK1 pochodzą z różnych szczepów Acinetobacter spp., a także z
innych bakterii reprezentujących różne klasy taksonomiczne. Białka te opisywane są jako
52
metylotransferazy systemów restrykcyjnych typu III. Na Fig. 18 przedstawiono porównanie
sekwencji aminokwasowych omawianego białka oraz białek pokrewnych.
pOK1 1 MSIQFLALVAKLKEIFQINRPDLDFGVYRILNARSKEIEEFLNQRLKKKVEISLQESAQS 60 HA 1 MSTQFSALVSKLKEIFQINRPDLDFGVYRILNSRSDEIAEFLDKRLKTKVEQYLGEAKSS 60
MTCC 1 MSTQFSALVSKLKEIFQINRPDLDFGVYRILNARSTEIAEFLDKRLKTKVEQYLGEAKSS 60
aquimarina 1 MS-KYNELVKKLKEIFQIDKPELDFGIYRILNAKADEINNYLENTLKKKISDALASAGNA 59
pOK1 61 LDQNALKDLEDELRDEYGKRAFDEFGELVDTEALNSRVGKKYLALKNSGANQYADESQVY 120
HA 61 LDENAIKELEAELKAEFGKRAFNEQGELIDAEAIESALGQKYIALTQADAHEMTDQSQVY 120
MTCC 61 LDENVLKELEAELKAEFGKRAFNEQGELIDQEAIESALGQKYIALTQADAHEMTDQSQVY 120
aquimarina 60 NKEELERQLAEAIKNAEGA-GFNPD----DSPKVKDLRAQ--ITASSQGANE--HENAVF 110
pOK1 121 NHLLTFFSRYYDEGDFISQRRYKGDTYAIPYSGEEVMLHWANKDQYYTKSGEMFSNYRFK 180
HA 121 SHLLTFFSRYYDEGDFISQRRYKGDTYAIPYSGEEVMLHWANKDQYYTKSGEMFSNYRFK 180
MTCC 121 SHLLTFFSRYYDDGDFISQRRYKGDTYAIPYSGEEVMLHWANKDQYYTKSGEMFSNYRFK 180
aquimarina 111 THLLTFFSRYYDSGDFVSKRRYKGDTYAIPYAGEEVMLHWANKDQYYIKSGENFSNYSFK 170
pOK1 181 LANGKSVLFKLLSADTARENRKDNDKNRCFNLVTEVRTIVKYDEDGEEYEEVIQPFEI-- 238
HA 181 LNDERSVLFRLVSADTARENRKDNDKDRRFIIVTEPKTFTRIDEDGEEFEETIVPFSI-- 238
MTCC 181 LNDERSVLFRLVSADTARENRKDNDKDRRFIIVTEPKTFTRIDEDGEEFEETIVPFSI-- 238
aquimarina 171 LDDGRKVTFKLLAADTAKDNRKDNDADRRFVLV-EQHTRIKYDDEGLDYEDEVLPIVVDS 229
pOK1 239 --IDNELVCLFEYVSFPTTTKQSALNTKALDFIVGSNLISTEWKDELLTLAPTEKDNKRT 296
HA 239 --QNNELTILFEYATLPKGSKQETLNIESYNKIVSAKVLTTDWLNDLAQPAPTEKEPKRT 296
MTCC 239 --QNNELTILFEYATLPKGSKQETLNIESYNKIVSAEVLTTDWLNDLAQPAPTEKEPKRT 296
aquimarina 230 SGEQDELVIQFEYKVVKKGTKQEALVSQALDAILSNSNIQSDWV-DVTKREPTEKNPNRT 288
pOK1 297 ELQKHLDIYTQKNTADYFIHKDLGKFLRHELDFYIKNEVMHLDNVISSDDFTQIERQLTI 356
HA 297 VLQKHLSTYTQKNTADYFIHKDLGKFLRHELDFYIKNEVMHLDDVVSTDQFIQIERQLSI 356
MTCC 297 VLHKHLSTYTQKNTADYFIHKDLGKFLRHELDFYIKNEVMHLDDVVSTDQFIQIERQLSI 356
aquimarina 289 LLEKHLTTYTQRNTADYFIHKDLGGFLSNELDFYIKNEVMNLDNVQNAEVFSDIEKQLRM 348
pOK1 357 IKCLRQVGLEIIDFLASLEDFQKKLWLKKKFVVSSHYCITLDRIDENFYPAIVANDKQWN 416
HA 357 IKCLRQIGLEIISFLASLEDFQKKLWLKKKFVVSAEYCITLDRVDESLYAEIAENTAQWQ 416
MTCC 357 IKCLRQIGLEIISFLASLEDFQKKLWLKKKFVVSAEYCITLDRVDDSLYAEIAENTSQWQ 416
aquimarina 349 IQCLRSISKDIVSFLAQLENFQKKLWEKIKFSWGVNYYISLCKIDTLTLSQLDISEQQIQ 408
pOK1 417 EWESLGFKEKTPNWQTLEYLQAHPYMMVNTALFDLLFKSKLLNSIEDIDEQTNGLIIHSD 476
HA 417 QWEDLGFKGTDAGWGTADYLKQHQALMVDTSLFSLEFKVELLKRIDDLDAQTDGLIIHSD 476
MTCC 417 QWEDLGFKGTDAGWGTIDYLKQHQALMVDTSLFSIEFKARLLKTIDDLDAQTDGLIIHSD 476
aquimarina 409 EWKFLYDLDLESQISITSLADAFPNLMLNTEFMSIESRLKVLSVIEGLDDQLTGTVINSD 468
53
pOK1 477 NFQAISLLENKYKNNIDTVYIDPPYNAKTSEILYKNTFKHASWLSFMDSRLEKTLPLLAK 536
HA 477 NFQALNLIKDKYDSNIQSIYIDPPYNTNASEIIYKNGFKHSSWLSLLDSRFDLTKKLMNK 536
MTCC 477 NFQALRLIEKKYNNTVQSIYIDPPYNTSASEILYKNSFKHSSWATLIENRIEESTSLLKK 536
aquimarina 469 NFQGLQFLKSRYNDKIDCIYIDPPYNATSSEILYKNNFKHSAWLSFIESRLIVAKKLMHP 528
pOK1 537 RSAMCIAIDENEQEYLGMLLGNAYPQYRKHCVALV-HNKKGIQG-KDFSYCHEYAYFLLS 594
HA 537 DSLICVTIDDVEKDKLKMLMDYSFGYENSMGTIVIRNNPSGRSTTKGVSIAHEYGLLYSK 598
MTCC 537 QGLLCVTIDDLELYNLKMILDQQFGAENFLANVLIRNNPSGRSTLKGFSVNHEYGLFYSK 598
aquimarina 529 EATIIIAIDENEQERLGLLIDNLFPNHDKFCISII-HNPAGVQG-INFSSSHEYAYFVFP 586
pOK1 595 EDHMG-----------SNDYILPE--KDWEWSNLRKWGSESTRDTAANCFYPIFIK-D-D 639
HA 597 SE-SAVVGRLPRNEKQDSRYKEVDEVGKFEWVNFRKHGGM--KSDAPSMYYPIFIS-G-D 651
MTCC 597 GELENGVGRLPHDEAQRSRYSLKDNKGFFEWENLRRNGPDSRKEDRPKQYYPIKYNKVEK 656
aquimarina 587 KG-GNYIGQTEREEPL--------------ISNFRDWGGTSARKLAKTCFYPIKVK-D-N 629
pOK1 640 RIIGFGDVCPNDFHPES-NNIE-CGDGS-IAVYPIDQSGIERKWRYERGTVEGILSLLRV 696
HA 652 TL-RIPDMEFNEISKEWLL-KEEPRGNE-VVIYPIDEHGLDRRWKWGIDRFKNELKNCKV 708
MTCC 657 SI-ALLPMEWDERKKTWSHSINSINENE-IILWPHHPKGELKVWRYSKEHIENEPERFQV 714
aquimarina 630 KIVGFGDVCDEDFHPIS-SN---VQDGEITLVYPIDSKGVERKWVFSKSTAERDSDQLFV 685
pOK1 697 NRSK-NELQIQKAKND----LKFKTIWDKNTYIAGDYGTRIVTDIGINTGNNLFPKSIYT 751
HA 709 SNDKSGKKAVYIKARMNEEGVLPMTWWDQKEYSATAYGTNLLKTFFKSLDSFSYPKALNA 768
MTCC 715 IEKD-GLFEVYRKKYINSEGILPRTWWEKPGYSARDNGTRALIEFFGQVAQFDFPKAKDA 773
aquimarina 686 VEDK-GEISIKRKKTT----RSHRTVWDSKKYYANIYGSKVITSMFGE-QPFSFPKSIHT 739
pOK1 752 VKDSIYAISQ---MNDTVLDYFGGSGTTAHATIELNREDNGNRKYILVEQGEYFDTVIKP 808
HA 769 VKDMLKVLSNK-NSNDIVLDYFGGSGTTAHATIALNREDHGNRKYILVEQGEYFDTVIKP 827
MTCC 774 VKDCFKVLK-L-NSKDIALDYFGGSGTSAHAVIDLNREDKGTRKYILMEQGEYFNTVLKP 831
aquimarina 740 VEDCLKALSRFRKKNGIVMDFFAGSGTTGHAAINLNRQDGGTRKFILVEQGDYCKKVTIP 799
pOK1 809 RIQKVVYSKDWKDGKPINTDTGISHCLKVMKLESYEDTLNNLELKRSGDQERLFNGLKD- 867
HA 828 RIQKVIYSADWKEGKPTNPESGISHCLKVVKLESYEDTLNNLELVRKGTQQTLLAEQQTS 887
MTCC 832 RIQKVVYSADWKGGKPTNPESGISHCLKVVKLESYEDTLNNLELVRKGAQQTLLAEQQTS 891
aquimarina 800 RVLKAMYSSRWKSGSPELNDS-ISGIVKVLSIESYEDSLNNLELRKSQATGDLFDSMPE- 857
pOK1 868 ------KQKDDYLMHYMLNIESKGSLLSINDFRKPFDYQMNITTDSAGAYEKQKVDLVET 921
HA 888 AKPEDQNAYSDYLMHYMLELESKDSLLNVKDFLKPFSYQMNITTDSAGAFERKNIDLVET 947
MTCC 892 TKPEDQNAYSDYLMHYMLELESKDSLLNVKDFLKPFSYQMNITTDSAGAFERKNIDLVET 951
aquimarina 858 ------QAKSDYLLNYMLETESKGSLLSTDDFKKPFDYKMKIAVDSAGAFEERNIDLVET 911
pOK1 922 FNYLIGLEVQYIDSQLERGYIQVTGKLRNGDKATILWRDCEKIGYEELTELLDKKLKISA 981 HA 948 FNYLIGMNVQEVDYQLDKGYAQITGKLRTGEYTTVLWRDCEKIGYAELDQLLS-KLKINP 1006
MTCC 952 FNYLIGMNVREADYQLDKGYVQITGQLRTGEYTTVLWRDCDKIGYAELDQLLA-KLKINP 1010
aquimarina 912 FNYLVGLHVNTVESNIERGYVRVEGNLPSGEKALILWRDCEKIGYDDFTKFAN-RFDLFA 970
54
pOK1 982 SDSEYDVIYINGDHTINNRLITDGEQGGKNLKIRSVEQEFLTRMFE---GE 1029 HA 1007 NDGEYQLIYINGDHNVASKYTTKEGE-EKQLKVRSIEQTFLKNMFE----E 1052
MTCC 1011 NDGEYQLIYINGDHNVASKYTTKEGE-EKQLKVRSIEQTFLKNMFE----E 1056
aquimarina 971 KEKTFDVIYVNGDHNLPTAFTSDEGEVTRTLKLRQIEPEFLELMFAPDELA 1021
Fig. 18. Porównanie sekwencji aminokwasowych metylotransferazy Orf5 pOK1 i białek pokrewnych. Sekwencje porównywane z metylotransferazą pOK1 (pOK1) pochodzą kolejno z Acinetobacter sp. HA (GenBank:
WP_008305575.1) (HA), Acinetobacter junii (GenBank: EPR86960.1) (MTCC) oraz Kangiella aquaimarina
(GenBank: WP_018624524.1) (aimarina). Na niebiesko zaznaczono aminokwasy identyczne we wszystkich
sekwencjach, na szaro – identyczne w trzech z nich. Obramowaniem zaznaczono domenę charakterystyczną dla
adenino – specyficznych metylotransferaz DNA Mod. Rzymskimi cyframi zaznaczono sekwencje motywów
charakterystycznych dla metylotransferaz. Żółta czcionka oznacza silnie konserwowane w motywie aminokwasy.
Kolorowymi ramkami zaznaczono przewidywaną strukturę drugorzędowa zidentyfikowanej metylotransferazy.
Sekwencje rozpoznawane przez metylotransferazy typu III są asymetryczne.
Podjednostka układu odpowiadająca z specyficzność – metylotransferaza „Mod” – jest stale
aktywna, natomiast podjednostka odpowiedzialna za aktywność endonukleolityczną „Res” jest
aktywna tylko w kompleksie z Mod, aktywność restrykcyjna jest stymulowana przez S-
adenozylometioninę (AdoMet).
Wykorzystując program Conserved Domains Search zlokalizowano w Orf5 pOK1
domenę charakterystyczną dla adenino-specyficznych metylotransferaz DNA Mod (COG2189).
W jej obrębie wyróżniono dwa fragmenty domeny charakterystycznej dla rodziny N-4/N-6
metylotransferaz (Pfam: PF01555). Jest to rodzina, do której należą metylotransferazy DNA N-4
cytozyno-specyficzne oraz N-6 adenino-specyficzne.
Metylotransferazy N-6 adenino-specyficzna to enzymy, które przenoszą grupę metylową
na grupę aminową w pozycji C-6 adeniny w nici DNA. Są to enzymy znajdowane w trzech
istniejących typach bakteryjnych systemów R-M (w typie III metylotransferaza jest produktem
genu mod). Enzymy te zawierają w N-końcowej części konserwowany motyw Asp/Asn-Pro-Pro-
Tyr/Phe, który może brać udział w wiązaniu substratu lub determinować aktywność katalityczną
(Timinskas i wsp., 1995). AdoMet-zależne metylotransferazy mają konserwowaną domenę
katalityczną, o czym świadczy obecność we wszystkich grupach charakterystycznych motywów
(Malone i wsp., 1995). Motywy te zostały również zidentyfikowane w opisywanej sekwencji
pochodzącej z plazmidu pOK1 (Fig. 18). Funkcja poszczególnych motywów nie została
sprecyzowana, wiadomo jednak, że motywy I, III i X odpowiadają za wiązanie AdoMet, a
motywy IV, VI i VIII są zaangażowane w aktywność katalityczną, dzięki tworzeniu aktywnej
struktury z motywami V i VII (Schluckebier i wsp., 1995).
Otwarte ramki odczytu oznaczone jako orf06 i orf07 kodują potencjalną endonukleazę
restrykcyjną (odpowiednio jego N- i C- końcową część). Wyróżnione ORF nachodzą na siebie
(ponad 90 pz), zaś w obszarze wspólnym prawdopodobnie dochodzi do programowanej zmiany
55
ramki odczytu, co mogłoby prowadzić do powstania białka fuzyjnego. Alternatywnie gen ten
został zmutowany poprzez wprowadzenie mutacji, która zmieniła jego ramkę odczytu.
Potencjalne białko Orf6 wykazuje podobieństwo sekwencji (na poziomie 53-70%) do
endonukleaz restrykcyjnych typu III, pochodzących z różnych szczepów. Orf06 wykazuje
podobieństwo sekwencji do endonukleazy restrykcyjnej E. coli DEC1C (GenBank:
EHU17630.1). Enzym E. coli ma długości 991aa, a podobieństwo Orf6 obejmuje aminokwasy
od 1 do 787. Z kolei Orf07 wykazuje podobieństwo do tego samego białka E. coli - od 785
aminokwasu do końca polipeptydu. Na Fig. 19 i Fig. 20 przedstawiono porównanie sekwencji aa
wyróżnionych składowych systemu R-M pOK1 oraz białek pokrewnych.
pOK1 1 MAKKPIA----KKSKAVKVSFHNQLILTKWLWSHLNPSMLEKMRDQLDKPDYEGIETTGD 56
DEC1C 1 MAKKPTTGKAVKKETNSKLSFHKQLVLNRFMFHFFKDGTLQGLKNRLGEDRFEGIHED-- 58
HA 1 MAKAPKA----K-TKAVKVNFHEQLILNKWLWSKFNPNRLEGMKQQLDHPQFEGIEHEGD 55
baumannii 1 MAKAPKA----K-TKALKVNFHEQLILNKWLWSKFNPNRLEGMKQQLDHQQFEGIEHEGD 55
pOK1 57 NIGQTKFFTVLTSSLFNKHLIDSDTLRRYDLNIAQYWQQITEQRNEKEGHILNLKYFQYL 116
DEC1C 59 --GQSLFFHELSNYLFEVDLIDLDELRRYDLNIVQHWQQITEHRNRKEDTVLNMKYFQYL 116
HA 56 NTGQTKFFSVISNTLFNKQVIDIDVLRRYDLNIVKHWQKITEKRNEIEGHVLNLKYFQYL 115
baumannii 56 NAGQTKFFSVISNTLFNKQVVDIDVLRRYDLNIVKHWQKITEKRNEIEGHVLNLKYFQYL 115
pOK1 117 SLLFTEIYLDHYFNRQSEMIDALDIEIDKYNESQ----K-ELDTFQSYIAEDLNKVSFWN 171
DEC1C 117 SLLFTEIYLDWYFNRKQQLLDGLNNELAAYNAENDKTAKDRANQFKSYVLDDLNKLAYWN 176
HA 116 SLLFTELYLDQYFNHQADMLNELNVELEQYNDDQ----KIDADQFQQYLPEDLNKIGYWN 171
baumannii 116 SLLFTELYLDQYFHHQADMLNELNVELEQYNDDQ----KIDADQFQQYLPEDLNKIGYWN 171
pOK1 172 ATGSGKTLLMHVNILQYLHYFHQKYGVDKNPDQIILLTPNEGLSHQHFHDFELSGI-SAT 230
DEC1C 177 ATGSGKTLLLHVNILQYLHYFQNGN-SHHYPDKIILLTPDERLSKQHLDELENSGFTQYQ 235
HA 172 ATGSGKTLLMHVNILQYLDYFQHQNGDSTYPDQIILLTPNEGLSEQHLQELTDSGF-QAT 230
baumannii 172 ATGSGKTLLMHVNILQYLDYFQHQNGDSTYPDQIILLTPNEGLSEQHLQELTDSGF-QAT 230
pOK1 231 IFDKNRSRDSLLKDEIQIIDINKLSDRDGDKTVATSSLEGQNLVLIDEGHRGTS-SAGIW 289
DEC1C 236 LFDKSKS--APFKGTIEVIDINKLDDKMGDKTVAVEAFEGNNLVLIDEGHKGTGSAAGAW 293
HA 231 LFDKQKSRNSLYRDEIQIIDMNKLSDTDGDKTVATMSLEGKNLVLIDEGHRGTSSTAGAW 290
baumannii 231 LFDKQKSRNSLYRDEIQIIDMNKLSDTDGDKTVATMSLEGRNLVLIDEGHRGTSSSAGAW 290
pOK1 290 MERRDILTRNGFSFEYSATFGQAVNKASNVHKSYEDAKKAKSKMLYNTTALKNLTEEQVS 349
DEC1C 294 MRRRDKLTRDGFAFEYSATFGQAVAGGNNVEAVETEIQKKKAKLLFETTALGKLSEEELA 353
HA 291 MERRDILTKDGFSFEYSATFGQAVSKADNVYKRFEDAKKQKAKMLYG-VAINKLTEEQKK 349
baumannii 291 MERRDILTKDGFSFEYSATFGQAVSKADNVYKRFEDAKKQKAKMLYG-MAINKLTEEQKK 349
pOK1 350 AIQLDDLEKLKCRREALREAYAKNILFDYSYKYFYQDGYGKEVNILNMKEY--SEEQDRD 407
DEC1C 354 QIALTSEEQRDARIQATREVYGKSILFDYSYKFFYEDGYGKESLILNLNPQDDKKDERRY 413
HA 350 NIQLDDLEQQKYRREALREVYAKSILFDYSYKYFYADGYGKEVNILNMKEY--HEDDERN 407
56
baumannii 350 NIQLDELEQQKYRREALREVYAKSILFDYSYKYFYADGYGKEVNILNMKEY--HEDDERN 407
pOK1 408 LYLTACLLAFYQQQYLFKKNEERLVQFNIENPLWVFVGNKVNDDDSDILTIIQFLSRFLD 467
DEC1C 414 EYFTACLLSFYQQQYLFNKNKEKLNEFNIEKPLWVFVGNSVSGEDSDIHAVLRFLAWFLN 473
HA 408 LYLTACLLSFYQQQYLFKKNQVKLAKFNIEKPLWVFVGNKVNDDDSDILAIVKFLADFLD 467
baumannii 408 LYLTACLLSFYQQQYLFKKNQAKLAKFNIEKPLWVFVGNKVNDDDSDILAIVKFLADFLD 467
pOK1 468 PQYKAQNIEWLQDLVTNKSRLVDNSGVNIFTNRFAALHGQVASKLYEDILLRFFNAS-TN 526
DEC1C 474 HETQAK--AWINDLIKNKARILDTKERNIFENRFTALMNA-PEDIYADILSRLFNTTHSG 530
HA 468 ASRKSKVISWLHDLITNTSRLVDPKGNNIFANRFAPLYGQNATELYQDILKSFFNAT-TN 526
baumannii 468 ASRKSKVISWLHDLITNTSRLVDPKGNNIFANRFAPLHGQNATDLYQDILKSFFNAT-TN 526
pOK1 527 QRLNVVRVAANTGELKLQVGENNPFALINVGDEAGLYKLCETLSLDNYFDVRNDDFSPSL 586
DEC1C 531 QRLRVLNLIGSKGELALQVGEAEPFGLINIGDAPSLYKMCEEDTT---FDYQRDDFAKSL 587
HA 527 QRLNVVRITANKGELRLQVGENTPFAVINVGDEKGLYDNCENSSQTHYINARTDDFAESL 586
baumannii 527 QRLNVVRITANKGELRLQVGENTPFAVINVGDEKGLYDNCDESSKTHYLNARTDDFAESL 586
pOK1 587 FGTLNNKDCSINLLIGSKKFTEGWSSWRVSTMGLLNMGTGEGSQIIQLFGRGVRLKGEDF 646
DEC1C 588 FHTLNDKDSRLHILIGSRKFTEGWSSWRVSTMGLLNMGRGEGSQIIQLFGRGVRLKGRNY 647
HA 587 FPTLNNDDSETHLLIGSRKFTEGWSSWRVSTMGLLNMGSGEGAQIIQLFGRGVRLKGENF 646
baumannii 587 FPTLNNDDSETHLLIGSRKFTEGWSSWRVSTMGLLNMGSGEGAQIIQLFGRGVRLKGENF 646
pOK1 647 SLKRT-PREIYTQANYKDLYLDFLQTLNIFGLKANYMEAFREYLNDEGIVLNQDLVTLDF 705
DEC1C 648 SLKRSTPGE-----RPKGLHLEKLETLNVFGVRADYMATFKQYLEDEGITPSDEILELNF 702
HA 647 SLKRT-PREIYSKAEYKGLHLDLMQTINIFGLRADYMEKFRDYLNDEGIILNQDLVTLDF 705
baumannii 647 SLKRT-PREIYSKAEFKGLHLDLMQTINIFGLRADYMEKFRDYLNDEGIILNQDLVTLDF 705
pOK1 706 KTNTIKPSTKLKTLVLKDGYKDNQANGFKAKIKPWVFTQVLDLDWLRQSENSANLEKKIK 765
DEC1C 703 ETRPNMPATRLKTLKLKDGYKDNQRLGFKRVYFPELYE------------VPADFQGKIK 750
HA 706 PTNKIQ-APRLKTLTLKDGYKDNQANGFKAQLKLSMFK------------IPKQYEGKIK 752
baumannii 706 PTNKIQ-APRLKTLTLKDGYKDNQANGFKAQLKLSMFK------------IPKQYEGKIK 752
pOK1 766 KPFVVLDLYPRLQSFHTDRSKEIIE-QDKRQNNIISQDLMCFLI---------------- 808
DEC1C 751 QPHIKLDLYPKLESIDTSRKGENTP-VNVRNEAKLDYKIISAFDFDRLYLAIQNYKLQRG 809
HA 753 KPFVVLDLYPRLQAFHTDKSKRQMDVKDKRQEHEISPKIMCMFDFDEIYLQLQQYKFQRG 812
baumannii 753 KPFVVLDLYPRLQAFHTDKSKRQTDVKDKRQEHEISPKIMCMFDFDEIYLQLQQYKFQRG 812
pOK1 809 ------------------------------------------------------------ 809
DEC1C 810 WSNLRVDKQRLIDFCTGKTKIG-NSWYTLLIPASELEIKQYADIAKQEDIMLRLLTDYTD 868
HA 813 YSNLQLNVDDLQEFCLRNIKSSTEDWYKLLVDGSELS-NDVGGIKKQQAILTELLQSYMD 871
baumannii 813 YSNLQLNVDDLQEFCFRDIKSSTEDWYKLLVDSSELT-NDVSGIKKQQAILTELLQSYMD 871
pOK1 809 ------------------------------------------------------------ 809
DEC1C 869 RFYNTLKNAYEGQFYEVTQVKEDDPGM----IKMYHFEIEET--DDGLAYASRLEQLQQL 922
HA 872 KFYHAIKNAYEGQFYEVTEFSLDDKDLPVQICEQYTLTAKDGQNNEAQEVFDRLETLKDL 931
baumannii 872 KFYHAIKNAYEGQFYEVTEFSLDDKDLPVQICEQYTLTAKDGQNNEAQEVFDRLETLKDL 931
pOK1 809 ------------------------------------------------------------ 809
DEC1C 923 VIDGEIGKAKSWSASGM-VAITFDKHLYYPLLSIEKNANIPLKMRPAAL-----GASSEI 976
HA 932 VAKGDVEKLAPWKEDGSFRAITFDRHLFYPLLD-KKDESLPFTWSPMLFDYTSHTQSSEV 990
baumannii 932 VAKGDVEKLAPWKEDGSFRAITFDRHLFYPLLD-KKDESLPFTWSPMLFDYTSHTQSSEV 990
pOK1 809 ------------------------------------------------------------ 809
DEC1C 977 TFVHDLQSFVDST----------------------------------------------- 990
57
HA 991 KFVLDLQSYINTPAADDLLKDYELYLLRNADNKYRGLGFALAGNFYPDFLLWLVNKQTGQ 1050
baumannii 991 KFVLDLQSYINTPDADALLKGYELYLLRNADNKYRGLGFALAGNFYPDFLLWLVNKQTGQ 1050
pOK1 809 ----------------------------------------LMQFIWSCCST--------- 819
DEC1C 990 ------------------------------------------------------------ 990
HA 1051 QYLTLVDPKGIRNMNHDDAKIELYKEIKNIEAKLEHPDLILSSFILSITPMKDILNNSLS 1110
baumannii 1051 QYLTLVDPKGIRNMNHDDAKIELYKEIKNIEAKLEHPDLILSSFILSITPMKDILNNSLS 1110
pOK1 820 ----------------------RHREVIAI 827
DEC1C 990 ----------------------------KG 991
HA 1111 EEEFAEKNVLFMVGNGTAYLGKMLEKILQL 1140
baumannii 1111 EEEFAEKNVLFMVGNGTAYLEKMLEKILQP 1140
Fig. 19. Porównanie sekwencji aminokwasowych endonukleazy Orf06 i białek pokrewnych.
Sekwencje porównywane z potencjalną endonukleazą pOK1 (pOK1) pochodzą kolejno z E. coli DEC1C (GenBank:
EHU17630.1) (DEC1C), Acinetobacter sp. HA (GenBank: WP_008305576.1) (HA) oraz Acinetobacter baumannii
(GenBank: WP_002116724.1) (baumanii). Na niebiesko zaznaczono aminokwasy identyczne we wszystkich
sekwencjach, na szaro – identyczne w trzech z nich. Obramowaniem zaznaczono aminokwasy tworzące domenę
charakterystyczną dla podjednostki res enzymów restrykcyjnych typu III. Czerwoną czcionką zaznaczono
aminokwasy zaangażowane w wiązanie ATP, żółtą – wiążące jony wapnia.
pOK1 1 Y----------------------------------------------------------- 1
DEC2A 1 ------------------------------------------------------------ 1
HA 1 MAKAPKAKTKAVKVNFHEQLILNKWLWSKFNPNRLEGMKQQLDHPQFEGIEHEGDNTGQT 60
baumannii 1 MAKAPKAKTKALKVNFHEQLILNKWLWSKFNPNRLEGMKQQLDHQQFEGIEHEGDNAGQT 60
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 61 KFFSVISNTLFNKQVIDIDVLRRYDLNIVKHWQKITEKRNEIEGHVLNLKYFQYLSLLFT 120
baumannii 61 KFFSVISNTLFNKQVVDIDVLRRYDLNIVKHWQKITEKRNEIEGHVLNLKYFQYLSLLFT 120
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 121 ELYLDQYFNHQADMLNELNVELEQYNDDQKIDADQFQQYLPEDLNKIGYWNATGSGKTLL 180
baumannii 121 ELYLDQYFHHQADMLNELNVELEQYNDDQKIDADQFQQYLPEDLNKIGYWNATGSGKTLL 180
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 181 MHVNILQYLDYFQHQNGDSTYPDQIILLTPNEGLSEQHLQELTDSGFQATLFDKQKSRNS 240
baumannii 181 MHVNILQYLDYFQHQNGDSTYPDQIILLTPNEGLSEQHLQELTDSGFQATLFDKQKSRNS 240
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 241 LYRDEIQIIDMNKLSDTDGDKTVATMSLEGKNLVLIDEGHRGTSSTAGAWMERRDILTKD 300
baumannii 241 LYRDEIQIIDMNKLSDTDGDKTVATMSLEGRNLVLIDEGHRGTSSSAGAWMERRDILTKD 300
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 301 GFSFEYSATFGQAVSKADNVYKRFEDAKKQKAKMLYGVAINKLTEEQKKNIQLDDLEQQK 360
baumannii 301 GFSFEYSATFGQAVSKADNVYKRFEDAKKQKAKMLYGMAINKLTEEQKKNIQLDELEQQK 360
pOK1 2 ------------------------------------------------------------ 2
DEC2A 1 ------------------------------------------------------------ 1
HA 361 YRREALREVYAKSILFDYSYKYFYADGYGKEVNILNMKEYHEDDERNLYLTACLLSFYQQ 420
baumannii 361 YRREALREVYAKSILFDYSYKYFYADGYGKEVNILNMKEYHEDDERNLYLTACLLSFYQQ 420
pOK1 2 ---------------------------------------NF------------------- 3
58
DEC2A 1 --------------------------------------MRFLAWFLNHETQAK--AWIND 20
HA 421 QYLFKKNQVKLAKFNIEKPLWVFVGNKVNDDDSDILAIVKFLADFLDASRKSKVISWLHD 420
baumannii 421 QYLFKKNQAKLAKFNIEKPLWVFVGNKVNDDDSDILAIVKFLADFLDASRKSKVISWLHD 420
pOK1 4 ------------------------------------------------------------ 4
DEC2A 21 LIKNKARILDTKERNIFENRFTALMNA-PEDIYADILSRLFNTTHSGQRLRVLNLIGSKG 79
HA 481 LITNTSRLVDPKGNNIFANRFAPLYGQNATELYQDILKSFFNAT-TNQRLNVVRITANKG 539
baumannii 481 LITNTSRLVDPKGNNIFANRFAPLHGQNATDLYQDILKSFFNAT-TNQRLNVVRITANKG 539
pOK1 4 -------------------------------------S---------------------- 4
DEC2A 80 ELALQVGEAEPFGLINIGDAPSLYKMCEEDTTFDY---QRDDFAKSLFHTLNDKDSRLHI 136
HA 540 ELRLQVGENTPFAVINVGDEKGLYDNCENSSQTHYINARTDDFAESLFPTLNNDDSETHL 599
baumannii 540 ELRLQVGENTPFAVINVGDEKGLYDNCDESSKTHYLNARTDDFAESLFPTLNNDDSETHL 599
pOK1 5 ------------------------------------------------------------ 5
DEC2A 137 LIGSRKFTEGWSSWRVSTMGLLNMGRGEGSQIIQLFGRGVRLKGRNYSLKRSTPGE---- 192
HA 600 LIGSRKFTEGWSSWRVSTMGLLNMGSGEGAQIIQLFGRGVRLKGENFSLKRT-PREIYSK 658
baumannii 600 LIGSRKFTEGWSSWRVSTMGLLNMGSGEGAQIIQLFGRGVRLKGENFSLKRT-PREIYSK 658
pOK1 5 ------------------------------------------------------------ 5
DEC2A 193 –RPKGLHLEKLETLNVFGVRADYMATFKQYLEDEGITPSDEILELNFETRPNMPATRLKT 251
HA 659 AEYKGLHLDLMQTINIFGLRADYMEKFRDYLNDEGIILNQDLVTLDFPTN-KIQAPRLKT 717
baumannii 659 AEFKGLHLDLMQTINIFGLRADYMEKFRDYLNDEGIILNQDLVTLDFPTN-KIQAPRLKT 717
pOK1 5 ------------------------------------------------------------ 5
DEC2A 252 LKLKDGYKDNQRLGFKRVYFPELYEVPADFQGKIKQPHIKLDLYPKLESIDTSRKGENTP 311
HA 718 LTLKDGYKDNQANGFKAQLKLSMFKIPKQYEGKIKKPFVVLDLYPRLQAFHTDKSKRQMD 777
baumannii 718 LTLKDGYKDNQANGFKAQLKLSMFKIPKQYEGKIKKPFVVLDLYPRLQAFHTDKSKRQTD 777
pOK1 5 ------------RFDVFFDFDAIYLELLQYKAQRGYSNLKITQDNIVDFCCNK---DPND 49
DEC2A 312 V-NVRNEAKLDYKIISAFDFDRLYLAIQNYKLQRGWSNLRVDKQRLIDFCTGKTK-IGNS 369
HA 778 VKDKRQEHEISPKIMCMFDFDEIYLQLQQYKFQRGYSNLQLNVDDLQEFCLRNIKSSTED 837
baumannii 778 VKDKRQEHEISPKIMCMFDFDEIYLQLQQYKFQRGYSNLQLNVDDLQEFCFRDIKSSTED 837
pOK1 50 WYKLLIDRSELM-NTVAGIIKQQWILIELLKAYMDKIYSTFKNAYEGQYYTVQEFDLANS 108
DEC2A 370 WYTLLIPASELEIKQYADIAKQEDIMLRLLTDYTDRFYNTLKNAYEGQFYEVTQVKEDDP 429
HA 838 WYKLLVDGSELS-NDVGGIKKQQAILTELLQSYMDKFYHAIKNAYEGQFYEVTEFSLDDK 896
baumannii 838 WYKLLVDSSELT-NDVSGIKKQQAILTELLQSYMDKFYHAIKNAYEGQFYEVTEFSLDDK 896
pOK1 109 MLDDLPIDICQQYTLTAKEDQNSEASDYFERIKNLQALVENGTVDELAPWQQDGSFRAIT 168
DEC2A 430 ---G----MIKMYHFEIEETD--DGLAYASRLEQLQQLVIDGEIGKAKSWSASGM-VAIT 479
HA 897 ---DLPVQICEQYTLTAKDGQNNEAQEVFDRLETLKDLVAKGDVEKLAPWKEDGSFRAIT 953
baumannii 897 ---DLPVQICEQYTLTAKDGQNNEAQEVFDRLETLKDLVAKGDVEKLAPWKEDGSFRAIT 953
pOK1 169 FDRHLYYPLFD-KTDDNLPFTWSPALFDYSKNGQSSEVQFVTDLQEYVNSDIGKEILDGY 227
DEC2A 480 FDKHLYYPLLSIEKNANIPLKMRPAAL-----GASSEITFVHDLQSFVDSTKGQKIIGDK 534
HA 954 FDRHLFYPLLD-KKDESLPFTWSPMLFDYTSHTQSSEVKFVLDLQSYINTPAADDLLKDY 1012
baumannii 954 FDRHLFYPLLD-KKDESLPFTWSPMLFDYTSHTQSSEVKFVLDLQSYINTPDADALLKGY 1012
pOK1 228 QLYLFRNPDNKYRGLGFALAGNFYPDFLMWLVHKESGKQFLTLVDPKGIRNMDSDDAKIE 287
DEC2A 535 SLYLLRNADSKNRGLGFATAGNFYPDFLLWLVDDKSGKQWLSLIDPKGIRNLNLDDPKFG 594
HA 1013 ELYLLRNADNKYRGLGFALAGNFYPDFLLWLVNKQTGQQYLTLVDPKGIRNMNHDDAKIE 1072
baumannii 1013 ELYLLRNADNKYRGLGFALAGNFYPDFLLWLVNKQTGQQYLTLVDPKGIRNMNHDDAKIE 1072
pOK1 288 FYKEIKIIESDIADEKLILNSFILSITSIQDLINCKLTEKEFVDKNVLFMNKGKAYYLGQ 347
DEC2A 595 LYKEIKNLEHKLSDDNLSLSAFIVSETCYVDLVNVPDSKENLEARNVLFIEDTGPLYLEK 654
HA 1073 LYKEIKNIEAKLEHPDLILSSFILSITPMKDILNNSLSEEEFAEKNVLFMVGNGTAYLGK 1132
baumannii 1073 LYKEIKNIEAKLEHPDLILSSFILSITPMKDILNNSLSEEEFAEKNVLFMVGNGTAYLEK 1132
59
pOK1 348 MFQRILFA 355
DEC2A 655 LFSKMVSE 662
HA 1133 MLEKILQL 1140
baumannii 1133 MLEKILQP 1140
Fig. 20. Porównanie sekwencji aminokwasowychj endonukleazy Orf07 i białek pokrewnych. Sekwencje porównywane z potencjalną endonukleazą Orf7 (pOK1) pochodzą kolejno z E. coli DEC2A (GenBank:
EHU33772.1) (DEC2A), Acinetobacter sp. HA (GenBank: WP_008305576.1) (HA) oraz Acinetobacter baumannii
(GenBank: WP_002116724.1) (baumanii). Na niebiesko zaznaczono aminokwasy identyczne we wszystkich
sekwencjach, na szaro – identyczne w trzech z nich.
Dzięki aplikacji Conserved Domain Search i analizie w bazie Pfam w sekwencji Orf06
zlokalizowano domenę charakterystyczną dla podjednostki Res endonukleaz restrykcyjnych typu
III (rodzina resIII, Pfam: PF04851). Baza CDD opisuje tę domenę jako typową dla rodziny
helikaz DEAD (cd00046). Do tej rodziny należą różnego typu białka zaangażowane w ATP-
zależne rozwijanie DNA lub RNA. Domena ta zawiera region odpowiedzialny za wiązanie ATP
(zaznaczony na Fig. 19). Zlokalizowano również region białka prawdopodobnie zaangażowany
w wiązanie jonów wapnia. W sekwencji Orf07 możliwe było wyróżnienie jedynie domeny o
nieznanej funkcji (Pfam: PF14302).
2.3. Analiza potencjalnego systemu mobilizacji do transferu koniugacyjnego
Potencjalny produkt białkowy kodowany przez orf25 prawdopodobnie jest zaangażowany w
mobilizację plazmidu do transferu koniugacyjnego (MOB). Białko to wykazuje największe
podobieństwo sekwencji (95% identyczności) do hipotetycznego białka Wohlfahrtiimonas
chitiniclastica SH04, opisanego przez deponujących sekwencję jako endonukleaza VirD1.
Pokrewne białka (36-47% identyczności) również zostały opisane w bazach danych jako
składniki relaksosomu. Na Fig. 21 przedstawiono porównanie sekwencji aminokwasowych
Orf25 i białek mu pokrewnych.
Poszukiwanie konserwowanych domen wykazało obecność domeny charakterystycznej
dla endonukleazy VirD1 (CDD: cl17530) lub bakteryjnych białek mobilizujących (MobC)
(Pfam: PF05713). Domeny tego typu są zaangażowane w mobilizację plazmidu do transferu
koniugacyjnego. Białko to prawdopodobnie bierze udział w nacięciu DNA w miejscu oriT.
Apisiridej i wsp. (1997) wykazali, że białka pokrewne MobC zawierają motyw sekwencji
L/FxxxG/SxNxNQxAxxxN (znak x oznacza brak konserwowanego aminokwasu w danym
miejscu). Motyw ten jest również obecny w wyróżnionej w sekwencji plazmidu pOK1
(zaznaczony na Fig. 21).
60
pOK1 1 LKK-QNRSIQVGIRFTEEEFAPYKSAAEKLGLSNAELLRAVLLNNFDPKIHDKKTRKDIK 59
ATCC 1 MTK-ENRSIPVSFRLTEREFAPYKLIMDEANISRTEFFRAIFLSKQY--TFTKNQKNEVG 57
Java 1 MRDSKGKSRVITLRLKEDEYARFEQILCDTGISKSDFFRLLILGKFDPNKHNKIAQNNHR 60
SH04 1 MKK-QNRSIQVGIRFTEEEFAPYKYAAEKLGLSNAELLRTVLLNNFNPKIHDRKTRKDIE 59
pOK1 60 KLLFYFNKASNNINQLAKVINTQAKTSNIDTKKLIQFYSKLNRIYDSFENGIEHAKKSSD 119
ATCC 58 KILFAFNKTSNNINQIAKRLNTDNKKGIISQRSYNLAINELISIQSQLQRLIE------- 110
Java 61 KLLFYFNKASNNINQIAKRLNQDHRNGIVSETTYKRILNVLVNVRDTFSNGVD------- 113
SH04 60 KLLFYFNKASNNINQLAKVINTQAKTSNIDTKKLIQFYSKLNRIYDSFENGIEHAKKSSD 119
pOK1 120 PR
ATCC 111 KC
Java 114 KC
SH04 120 PR
Fig. 21. Porównanie sekwencji aminokwasowych Orf25 pOK1 i białek pokrewnych.
Sekwencje porównywane z sekwencją Orf25 (pOK1) pochodzą kolejno z Vibrio ichthyoenteri ATCC 700023
(GenBank: EGU31302.1) (ATCC), Yersinia pestis Java 9 (GenBank: YP_004221720.1) (Java) oraz
Wohlfahrtiimonas chitiniclastica SH04 (GenBank: ELV07177.1) (SH04). Na niebiesko zaznaczono aminokwasy
identyczne we wszystkich sekwencjach, na szaro – identyczne w trzech z nich. Kolorowymi ramkami zaznaczono
przewidywaną strukturę drugorzędowa zidentyfikowanego białka. Obramowaniem zaznaczono konserwowany
motyw charakterystyczny dla białek MobC. Żółta czcionką zaznaczono konserwowane aminokwasy.
2.4. Inne elementy genetyczne zintegrowane z genomem plazmidu
W analizowanej sekwencji wyróżniono kilka ruchomych elementów genetycznych
zintegrowanych z genomem pOK1. Są to elementy transpozycyjne (orf17-orf18, orf19, orf21,
orf22, orf43, orf49) oraz kasety genowe integronu (orf39-orf41). W kolejnych podrozdziałach
zamieszczono szczegółowy opis tych struktur.
2.4.1. Elementy transpozycyjne
Elementy transpozycyjne (TE, ang. transposable elements) stanowią najliczniejszą grupę
ruchomych elementów genetycznych. Są one zdolne do przemieszczania się z jednego miejsca
genomu w inne (w obrębie jednego lub między różnymi replikonami) w wyniku transpozycji,
czyli rekombinacji nieuprawnionej. Jest to proces katalizowany przez transpozazy (Tnpazy),
enzymy kodowane w obrębie TE. Ze względu na stopień złożoności struktury genetycznej,
wśród TE wyróżniamy: sekwencje inercyjne (IS, ang. insertion sequence) oraz transpozony (Tn).
IS są najprostszymi TE, kodują bowiem jedynie informację genetyczną niezbędną do własnej
transpozycji. Na ich końcach występują identyczne lub prawie identyczne odwrócone
powtórzenia sekwencji (IR, ang. inverted repeats). Transpozony są to elementu większe, które
mogą również zawierać geny determinujące fenotyp gospodarza. Wśród transpozonów
61
wyróżniamy transpozony złożone, posiadające na obu końcach IS, oraz transpozony niezłożone,
nie zawierające terminalnie ułożonych IS.
Otwarte ramki odczytu orf17 i orf18 pOK1 kodują potencjalne białka wykazujące
podobieństwo sekwencyjni (68%) do transpozazy Vibrio cholerae TM 11079-80, odpowiednio
do podjednostki A i B (GenBank: EEO05192.1, EEO07032.1). Obydwa białka pOK1 są krótsze
niż te opisane w bazie danych. Sekwencje obu podjednostek wykazują podobieństwo do innych
transpozaz występujących w bakteriach z rodzaju Vibrio, kodowanych przez elementy z rodziny
IS3. Obie ORF pOK1 zachodzą na siebie o 15pz, co może sugerować generowanie fuzyjnej
Tnpzazy w wyniku programowanej zmiany ramki odczytu.
Poszukiwanie konserwowanych domen białkowych w sekwencjach obu podjednostek
(Pfam, Conserved Domains Serach) pozwoliło na zidentyfikowanie charakterystycznej domeny
transpozaz. Podjednostka A zawiera domenę typową dla nadrodziny HTH_Tnp_1 (Pfam:
PF01527), odpowiadającą za aktywność transpozazy i wiązanie z DNA. Pokrewne białka są
kodowane przez wiele elementów insercyjnych oraz transpozaz, w tym przez IS grupy IS3 z
rodziny IS3. Domena ta składa się z motywu HTH (na N-końcu) oraz zamka leucynowego. W
obrębie podjednostki B znajduje się domena należąca do rodziny Rve (Pfam: PF00665). Jest to
domena odpowiadająca za katalityczne właściwości integrazy. Pośredniczy ona w integracji
DNA w miejscu docelowym. Analizy przeprowadzone w bazie danych ISfinder pozwoliły
zaklasyfikować opisywaną IS do rodziny IS3.
Analiza porównawcza wykazała, że Orf19 wykazuje najwyższe podobieństwo sekwencji
(81% identyczność) z Tnpazą IS431mec, pochodzącą z Wohlfahrtiimonas chitiniclastica SH04
(GenBank: WP_008316919.1). Sekwencja Orf19 jest krótsza od tej zdeponowanej w bazie o 93
aminokwasy. Może być to wynikiem wbudowania się w jej obrębie sekwencji insercyjnej,
zawierającej orf17 i orf18 (Fig. 1). W sekwencji Orf19 zidentyfikowano domenę, typową dla
transpozaz (COG3316).
Do Tnpazy IS431mec najwyższe podobieństwo wykazują również orf43 i orf49 pOK1
(identyczność sekwencji aa - 96%). Poszukiwanie konserwowanych domen (Conserved Domains
Serach) pozwoliło wyróżnić w sekwencji obu ORF domenę transpozaz i inaktywowanych
pochodnych (COG3316) oraz domenę Rve (opisaną wcześniej). Analiza porównawcza
wykazała, ze opisywany element wykazuje największe podobieństwo do sekwencji insercyjnych
należących do rodziny IS6.
W sekwencji pOK1 wyróżniono jeszcze jedną IS wykazującą podobieństwo do sekwencji
pochodzącej z Wohlfahrtiimonas chitiniclastica SH04 (GenBank: ZP_21241722.1). Element ten
koduje transpozazę Orf22, wykazująca 55% identyczność sekwencji aa z Tnpazą IS407.
62
Transpozaza ta zawiera domenę Rve oraz domenę HTH_21 (Pfam: PF13276), odpowiadającą za
oddziaływanie z DNA. W wyniku analiz porównawczych przeprowadzonych w bazie ISfinder,
element niosący orf22 zakwalifikowano do grupy IS407 rodziny IS3.
Kolejny TE pOK1 zawiera orf21. Białko Orf21 wykazuje 70% podobieństwo sekwencji
aa do transpozazy z grupy IS407 rodziny IS3, pochodzącej z Vibrio cholerae RC385 (GenBank:
WP_001884878.1). W wyróżnionej sekwencji obecna jest domena należąca do nadrodziny
HTH_Tnp_1 (Pfam: PF01527).
Ponieważ elementy wyróżnione w sekwencji plazmidu pOK1 zostały zaklasyfikowane do
rodzin IS3 i IS6, w tabeli 5 przedstawiono podstawowe informacje charakteryzujące te rodziny.
Tabela 5. Podstawowe informacje o rodzinach IS3 i IS6 (ISfinder).
rodzina podgrupa typowa
wielkość (pz)
generowane
DR końce IR
liczba
ORF
motyw
katalityczny
IS3
IS150 1200-1600 3-4 TG
obecne 2 motyw DDE
IS407 1100-1400 4 TG
IS51 1000-1400 3-4 TG
IS3 1150-1750 3-4 TGa/g
IS2 1300-1400 5 TG
IS6 - 700-900 8 GG obecne 1 motyw DDE
DR, ang. direct repeats, proste powtórzenia sekwencji generowane w miejscu wbudowania elementu. IR, ang.
inverted repeats, odwrócone powtórzone sekwencje obecne na końcach elementu. Kolumna „końce” określa
nukleotydy konserwowane na końcu sekwencji. Duże litery oznaczają silnie konserwowane nukleotydy. Małe litery
oddzielone ukośnikiem oznaczają możliwe zasady (ISfinder).
W sekwencjach po obu stronach orf43 i orf49 zidentyfikowano jednakowe, 21-
nukleotydowe odwrócone powtórzenia. Taka sama sekwencja została znaleziona również
poniżej orf19. W tym przypadku brakuje drugiej sekwencji IR, podobnie i jak części genu
transpozazy. Sekwencje te zostały prawdopodobnie zinaktywowane przez wbudowanie się
elementu insercyjnego niosącego orf17-orf18. Obecność dwóch identycznych sekwencji
insercyjnych (zaznaczonych na Fig. 22) stwarza możliwość przenoszenia zawartego między nimi
fragmentu DNA, w postaci transpozonu złożonego. Możliwe jest również, że z pewną częstością
może dochodzić do delecji fragmentu DNA pomiędzy tymi dwoma sekwencjami, w wyniku
rekombinacji homologicznej.
IS należące do rodziny IS6 zazwyczaj generują w miejscu integracji 8 – nukleotydowe
DR, które w genomie pOK1 nie występują. Nie można jednak wykluczyć, że elementy pOK1,
podobnie jak ISS1W z Lactococcus lactis (Haandrikman, 1990), nie generują DR.
63
Fig. 22. Schemat organizacji potencjalnego nieautonomicznego transpozonu złożonego pOK1. Na schemacie kolorowymi strzałkami zaznaczono ORF znajdujące się w obrębie potencjalnego transpozonu (IS –
sekwencja inercyjna, tetR – koduje białko regulujące ekspresję genów oporności na tetracyklinę, tetH –nadająca
komórce oporność na tetracyklinę, rep – kodująca gen białka inicjującego replikację, TA – system TA).
Powiększono regiony, w których znajdują się odwrócone powtórzenia, oznaczone IRR i IRL (powtórzenie prawe i
lewe).
Na uwagę zasługuje fakt, że powtórzenie IRL sekwencji insercyjnej niosącej orf43,
znajduje się w obszarze defektywnej ORF warunkującej oporność na czwartorzędowe związki
amoniowe i bromek etydyny. W przypadku pozostałych sekwencji insercyjnych nie udało się
wyznaczyć sekwencji IR ani sekwencji DR. Zarówno dla transpozaz sekwencji insercyjnych z
rodzin z IS3, jak i IS6, w części aktywnej enzymu znajduje się motyw DDE. Jest to tak zwana
katalityczna triada utworzona z trzech kwaśnych aminokwasów: dwóch asparaginianów i
glutaminianu. Ich obecność warunkuje aktywność enzymatyczną transpozaz (Nesmelova i
Hackett, 2010). Na Fig. 23 przedstawiono porównanie sekwencji konsensusowych motywów
DDE z sekwencjami niektórych opisywanych transpozaz pOK1.
Motywy DDE transpozaz kodowanych przez pOK1 są zbliżone do sekwencji
konsensusowych. Warto zauważyć, że w przypadku wyróżnionych motywów skróceniu uległy
sekwencje oddzielające aminokwasy tworzące katalityczną triadę. Różnice są szczególnie
widoczne dla sekwencji oddzielających drugi asparaginian od glutaminianu (Fig. 23).
Dla pozostałych potencjalnych transpozaz (Orf17-Orf18, Orf19, Orf21) nie udało się
zidentyfikować motywów DDE. W przypadku Orf19 jest to wynikiem braku dużej części genu
transpozazy. Z podobną sytuacją mamy do czynienia w przypadku transpozazy Orf21.
Transpozazy te, choć prawdopodobnie defektywne, zawierają domeny odpowiedzialne za
oddziaływanie z DNA. Brak motywu DDE powoduje, że transpozazy te są niezdolne do
transpozycji. W przypadku transpozazy Orf17-Orf18, w sekwencji podjednostki B można
wyróżnić jedynie fragment konserwowanej sekwencji motywu DDE, ale zlokalizowanie całego
motywu nie jest możliwe.
64
Fig. 23. Porównanie sekwencji konsensusowych motywów DDE sekwencji insercyjnych należących do rodzin
IS3 i IS6 z motywami DDE wyróżnionymi w sekwencjach insercyjnych wyróżnionych w plazmidzie pOK1. Aminokwasy tworzące część konserwowanego motywu są przedstawione za pomocą dużych, pogrubionych liter.
Wielkie litery oznaczają aminokwasy zachowane w rodzinie IS, a małe wskazują, że dany aminokwas jest
dominujący. Liczby w nawiasach wskazują na liczbę aminokwasów znajdujących się pomiędzy konserwowanymi
rejonami.
2.4.2. Integron
Otwarte ramki odczytu orf38-orf42 stanowią elementy integronu opornościowego (Fig. 24).
Integrony to elementy genetyczne zdolne do włączania kaset genowych w wyniku rekombinacji
specyficznej wobec miejsca (ang. site specific recombination) (Wolinowska i wsp., 2002).
Mobilne integrony zawierają kilka (do 9) kaset genowych, które warunkują oporność na wiele
antybiotyków (Partridge i wsp., 2009). Istnieją też integrony zerowe, nie zawierające żadnej
kasety. Włączanie kaset umożliwia integraza (Int), enzym kodowany w obrębie integronu. Na
podstawie podobieństw sekwencji aminokwasowych integraz wyróżniono 5 grup tych
elementów genetycznych. Białko Orf38 wykazuje największe podobieństwo sekwencji aa do
integraz integronów klasy I (sekwencje te są niemal identyczne).
Integrony klasy I charakteryzują się konserwowanym 5’końcem, kodującym integrazę,
oraz 3’końcem zawierającym ORF kodujące: syntazę dihydropterynianową, defektywne białko
warunkujące oporność na czwartorzędowe związki amoniowe (składnik środków
dezynfekujących i antyseptycznych) i bromek etydyny (gen qacΔE) (w genie tym obecna jest
niewielka delecja, która powoduje, że kodowane białko nadaje komórce nieznaczną oporność,
mimo że posiada własny promotor; Wolinowska i współaut. 2002) (Fig. 24). Przypuszcza się, że
geny te pierwotnie stanowiły części kaset włączonych w strukturę integronu, które utraciły
zdolność do mobilizacji poprzez utratę miejsca rekombinacji (Brown i wsp., 1996).
65
W przypadku integronu pOK1, na końcu 3’ występuje jedynie defektywny gen qacΔE.
Podobne struktury były już opisywane wcześniej (Brown i wsp., 1996). Region 3’ nie jest
niezbędny do funkcjonowania integronu. Poznano integrony klasy I pozbawione części lub
całego tego regionu (Brown i wsp., 1996). orf26, poprzedzająca integron (Fig. 24), koduje
syntazę dihydropterynianową. Gen ten nadaje komórce oporność na sulfonamidy poprzez
syntezę enzymu mogącego zastąpić enzym, będący celem tej klasy leków. Otwarte ramki
odczytu położone poniżej genu int kodują białka warunkujące odporność na: sulfonamidy
(orf39), aminoglikozydy (orf40) i β-laktamy (orf41).
Integrony zawierają zwykle dwa promotory - jeden odpowiedzialny za ekspresję genu
integrazy - Pint, oraz promotor odpowiedzialny za transkrypcję włączanych kaset genowych – Pc
(Fig. 24). Za sprawą integrazy dochodzi rekombinacji pomiędzy miejscem integracji – attI
integronu i obszarem 59-be (ang. 59-base element) znajdującym się w kasecie genowej. Kaseta
genowa w integronach klasy I jest specyficznie włączana między G i TT siedmionukleotydowej
sekwencji, znajdującej się w tzw. miejscu prostym, do którego wiąże się integraza. Powyżej
miejsca prostego znajdują się jeszcze dwa miejsca wiązania integrazy, które działają jako
„wzmacniacze”. Sekwencje wiązania Int to krótkie nieidentyczne sekwencje powtórzone (Gravel
i wsp., 1998). Na Fig. 24 zaznaczono sekwencje miejsca attI oraz inne sekwencje mogące
odgrywać rolę w wiązaniu integrazy.
Sekwencja miejsca attI zmienia się po włączeniu do integronu kasety. 6 ostatnich zasad
pochodzi z kasety. Pomiędzy dwoma włączonymi kasetami powstaje sekwencja oznaczana jako
attC (zaznaczona na rysunku), będąca hybrydą elementów 59-be tych kaset. Kaseta może być
wycięta z dowolnego miejsca w szyku integronu poprzez rekombinacje pomiędzy miejscami
attC kontrolowanym przez integrazę. Powstająca przejściowa forma kolista może być później
włączona przez ten sam enzym w miejsce attI, co umożliwia ekspresję tej kasety z promotora
znajdującego się w obszarze genu integrazy.
Kasety genowe zazwyczaj kodują jedną otwartą ramkę odczytu, ale znane są również
takie, w których można wyróżnić dwie otwarte ramki odczytu. W takich przypadkach jedna z
nich może warunkować oporności na antybiotyk, a druga często koduje białko o nieznanej
funkcji (Wolinowska i wsp., 2002). Prawdopodobnie podobną sytuację obserwujemy w
opisywanym w tej pracy integronie. Wydaje się, że gen kodujący reduktazę dihydrofolianową
oraz gen kodujący acetylotransferazę aminoglikozydową są częścią jednej kasety, bowiem nie
można pomiędzy nimi wyznaczyć miejsca attC. Nie występuje też między nimi region
międzygenowy.
66
Fig. 24. Organizacja genetyczna integronu pOK1.
Na schemacie kolorowymi strzałkami zaznaczono ORF znajdujące się w integronie (intI1 – koduje integrazę, dhfr,
AAC (6’)-Ib, bla, qacΔE – kodują, odpowiednio, reduktazę dihydrofolianową, acetylotransferazę
aminoglikozydową, β-laktamazę oraz białko warunkujące oporność na czwartorzędowe związki amoniowe i bromek
etydyny. Powiększono region międzygenowy, w którym znajduje się miejsce attI oraz regiony, w których znajdują
się miejsca attC. Strzałkami zaznaczono zaproponowane sekwencje powtórzone oraz ich odwrócenia rozpoznawane
przez integrazę. Pionową strzałką zaznaczono miejsce włączania kasety. Pogrubioną czcionką oznaczono promotory
Pc, Pint oraz PqacΔE. Zaznaczono również miejsce oddziaływania z represorem transkrypcji podczas indukcji
odpowiedzi SOS.
Wykazano wcześniej (Guerin i wsp., 2009), że odpowiedź SOS kontroluje ekspresję
integrazy superintegronu V. cholerae oraz integronów klasy I poprzez wiązanie białka
represorowego LexA do miejsca docelowego znajdującego się w obszarze promotora genu
integrazy (MAZEL i wsp., 2011). Na Fig. 24 zaznaczono potencjalne miejsce oddziaływania z
represorem transkrypcji. W celu wyznaczenia tego miejsca wykorzystano sekwencje
konsensusowe ustalone przez Mazela i współpracowników (Mazel i wsp., 2011) (Fig. 25).
67
Fig. 25. Reprezentatywne przykłady miejsc wiązania białka LexA zidentyfikowane powyżej różnych genów
integrazy mobilnych integronów z zaznaczeniem klasy integrazy (1-5). Zaprezentowane sekwencje pochodzą z: E.
coli pSa (GenBank: AAA92752), Providencia stuartii ABR23a (GenBank: ABG21674), Serratia marcescens
AK9373 (GenBank: BAA08929) oraz Vibrio salmonicida VS224 pRVS1 (GenBank: CAC35342).
Na prawym panelu zaprezentowano logo (Crooks i wsp., 2004) profilu użytego do szukania miejsca wiązania
represora LexA w β/γ – Proteobacteria.
Regulon SOS jest globalną siecią regulacyjną, zaangażowaną głównie w naprawę
uszkodzeń DNA, która jest kontrolowana przez białko represorowe LexA (Walker, 1984). Do
represji genów regulonu dochodzi w wyniku wiązaniu białka LexA do specyficznych sekwencji
obecnych w ich regionach promotorowych. U większości β i γ – Proteobacteria miejsce to
stanowi 16-nukleotydowa, sekwencja o strukturze paindromu (CTGTatatatatACAG) (Walker,
1984). Odpowiedź SOS jest indukowana obecnością jednoniciowego DNA, który wiąże się
niespecyficznie do białka rekombinacyjnego RecA, umożliwiając katalityczna inaktywację
białka LexA (Littre, 1991), a tym samym indukcję odpowiedzi SOS. Wykazano, że ekspresja
ponad 40 genów u E. coli jest regulowanych przez represor LexA. Są to geny zaangażowane w
stabilizację widełek replikacyjnych, naprawę DNA oraz podział komórki (Fernandez de
Henestrosa, 2000). Wykazano również, że niektóre powszechnie stosowane antybiotyki i związki
antybakteryjne, takie jak: fluorochinolony, trimetoprim i β-laktamy, mogą wywoływać
odpowiedź SOS, a więc mogą również indukować ekspresję genu integrazy. Presja antybiotyku
może zatem przyczyniać się do rozpowszechniania genów oporności poprzez stymulowanie
wycinania i wbudowywania kaset opornościowych w integronach.
Potencjalny produkt białkowy orf37 pOK1 wykazuje podobieństwo sekwencji
aminokwasowej (98%) do TnpM - modulatora transpozonu Tn21. W genomie pOK1 nie
występują jednak inne geny pochodzące z Tn21.
Wiele transpozonów niosących determinanty oporności należy do podgrupy Tn21 z
rodziny Tn3 (Grinsted i wsp., 1990). Transpozony te spotyka się często w dużych plazmidach
koniugacyjnych o szerokim zakresie gospodarzy. Tn21 niesie geny zaangażowane w proces
transpozycji oraz operon warunkujący oporność na jony rtęci (mer). Tn21 wykorzystuje
mechanizm transpozycji replikacyjnej i ulega insercji w dość przypadkowe miejsca genomu
(Liebert i wsp., 1999). Transpozon ten opisano po raz pierwszy jako składnik plazmidu NR1
68
(R100), wyizolowanego z szczepu Shigella flexneri (Nakaya i wsp., 1960). Liebert i
współpracownicy przedstawili organizację genetyczną elementu Tn21 (Liebert i wsp., 1999),
którą przedstawiono na Fig. 26.
Fig. 26. Schemat organizacji genetycznej Tn21 (wg Liebert i wsp., 1999; zmodyfikowano).
Region transpozycyjny składa się z genów transpozazy (tnpA), resolwazy (tnpR), potencjalnego regulatora
transpozycji (tnpM) oraz miejsca res. Kaseta aadA1 koduje transferazę aminoglikozydów oraz zawiera miejsce 59-
be. Strzałki oznaczają kierunek transkrypcji. Moduł tni odpowiada za transpozycję integronu, w Tn21 uległ
częściowej delecji. Operon mer składa się z genów regulatorowych merD i merR oraz genów struktury merT, merP,
merC i merA. Zaznaczono również dwie otwarte ramki odczytu o nieznanej funkcji ufr1 (merE) i urf2. urf2M jest
hipotetyczną ramką odczytu, która mogła istnieć przed wbudowaniem integronu. Pionowe ramki oznaczają
odwrócone (IR) powtórzenia transpozonu oraz sekwencji inercyjnych.
TE z rodziny Tn3 są zazwyczaj otoczone odwróconymi powtórzonymi sekwencjami (IR)
o długości 38 pz (Sherratt, 1989). Transpozycja transpozonu Tn21 generuje 5 pz duplikacje
miejsca docelowego, w obrębie bogatej w pary AT sekwencji docelowej (Plasterk, 1995). W
sekwencji plazmidu pOK1 wyróżniono 22-nukleotydowe odwrócone powtórzenia flankujące
duży fragment DNA, zawierający gen tnpM oraz integron. Sekwencje te są podobne do
odwróconych powtórzeń elementu inercyjnego należącego do rodziny IS6 (powtórzenia
wyróżnione w sekwencji plazmidu pOK1 są jednak dłuższe). Wbudowanie elementu z tej
rodziny zazwyczaj powoduje stworzenie 8-nukleotydowych prostych powtórzeń. Na Fig. 27
przedstawiono organizację genetyczną fragmentu pOK1 zawierającego wspomniane IR.
69
Fig. 27. Organizacja genetyczna potencjalnego transpozonu plazmidu pOK1.
Pionowymi kreskami zaznaczono odwrócone powtórzenia (IRL i IRR, ang. inverted repeats). Powiększono regiony
międzygenowe zawierające powtórzenia, które zaznaczono na pomarańczowo. W górnym panelu przedstawiono
profil zawartości par G+C (Artemis, okno 120 nt).
Jak widać na schemacie, obszar oflankowany sekwencjami IR charakteryzuje się wyższą
zawartością par GC niż pozostała część plazmidu, co sugeruje nabycie tego elementu DNA
drogą HGT. Ponieważ w opisywanym fragmencie nie wyróżniono genów odpowiedzialnych za
transpozycję, można przypuszczać, że ten potencjalny element może być mobilizowany in trans,
w obecności kompatybilnej transpozazy, kodowanej przez autonomiczne TE.
2.5. Determinanty oporności
W genomie plazmidu pOK1 wyróżniono 8 potencjalnych determinantów oporności na różne
antybiotyki lub środki dezynfekujące. Cztery z nich znajdują się w obrębie integronu. W
kolejnych podrozdziałach przedstawiono ich charakterystykę.
2.5.1. Fosfotransferaza streptomycyny
Otwarta ramka odczytu oznaczona jako orf26 koduje potencjalne białko wykazujące 98-100%
identyczność sekwencji aa z fosfotransferazą streptomycyny A, pochodzącą z różnych
przedstawicieli Gammaproteobacteria. Analiza porównawcza, przeprowadzona za pomocą
programu BLAST, wykazała, że gen fosfatazy streptomycyny A (strA) jest często usytuowany w
różnych plazmidach, w pobliżu genu strB. W sekwencji plazmidu pOK1 wyróżniono jedynie gen
70
strA. Fosfotransferaza streptomycyny A nadaje komórce oporność na streptomycynę.
Streptomycyna jest pierwszym odkrytym antybiotykiem z grupy aminoglikozydów. Antybiotyki
aminoglikozydowe działają bakteriobójczo przede wszystkim na bakterie gramujemne.
Aminoglikozydy łączą się z rybosomami, co prowadzi do zaburzenia translacji. Innym lub
dodatkowym efektem działania jest zmiana integracji błony komórkowej komórki bakteryjnej
(Vakulenko i Mobashery, 2003).
Poznano kilka mechanizmów oporności na leki tej grupy: (i) pompy aktywnie usuwające
antybiotyk (Moore i wsp., 1999), (ii) zmniejszona przepuszczalność (Hancock, 1981), (iii)
modyfikacja rybosomów (Poehlsgaard i Doughtwaite, 2005) oraz (iv) inaktywacja antybiotyku
poprzez jego modyfikację (Shaw i wsp., 1993). Mechanizm oporności uzyskany dzięki nabyciu
przez komórkę genu strA polega na modyfikacji antybiotyku. Kodowana fosfotransferaza
przeprowadza reakcję fosforylacji streptomycyny zachodzącej przy węglu 3’, w wyniku czego
powstaje fosforan streptomycyny nie wykazujący działania antybakteryjnego. Wiele plazmidów
z grupy IncP-1 wyizolowanych z oczyszczalni ścieków posiada gen oporności na streptomycynę
(Schluter, 2007).
Poszukiwanie konserwowanych domen białkowych pozwoliło zakwalifikować Orf26 do
podrodziny 3’-fosfotransferaz aminoglikozydów-APH (kod cdd: cd05120). Członkowie tej
rodziny katalizują przeniesienie grupy γ-fosforanowej z ATP na antybiotyk glikozydowy, przede
wszystkim na: kanamycynę, streptomycynę, neomycynę oraz genamycynę. Gen APH
znajdowany jest w obrębie transpozonów i plazmidów. Uważa się że pierwotnie stanowił on
mechanizm obronny dla szczepów produkujących antybiotyk. Domena charakterystyczna dla
rodziny strA znajduje się między 22 a 280 aminokwasem. W sekwencji opisywanej
fosfotransferazy wyróżniono również miejsca aktywne oraz miejsca wiązania ATP i antybiotyku
(Fig. 28).
1 KKPQEFVIRKLKEPPLNRTNIFFGESHSDWLPVRGGESGDFVFRRGDGHAFAKIAPASRRGELAG 65
66 ERDRLIWLKGRGVACPEVINWQEEQEGACLVITAIPGVPAADLSGADLLKAWPSMGQQLGAVHSL130
131 SVDQCPFERRLSRMFGRAVDVVSRNAVNPDFLPDEDKSTPQLDLLARVERELPVRLDQERTDMVV 195
196 CHGDPCMPNFMVDPKTLQCTGLIDLGRLGTADRYADLALMIANAEENWAAPDEAERAFAVLFNVL 260
261 GIEAPDRERLAFYLRLDPLTWG 282
Fig. 28. Sekwencja aminokwasowa fosfotransferazy streptomycyny kodowanej w obrębie pOK1 .
Obramowaniem zaznaczono konserwowaną domenę charakterystyczną dla 3’fosfataz aminoglikozydów. Kolorem
żółtym oznaczono miejsca aktywne. Kolorowymi literami aminokwasy zaangażowane w wiązanie ATP – niebieskie
oraz wiązanie antybiotyku – czerwone.
71
2.5.2. Syntaza dihydroptrynianowa
Potencjalny produkt białkowy orf27 pOK1 wykazuje podobieństwo sekwencji aa (99-100%) do
syntaz dihydropterynianowych pochodzących z różnych szczepów bakterii. Geny
odpowiedzialne za powstawanie tego enzymu zlokalizowane są w plazmidach, najczęściej w
plazmidach niosących liczne determinanty oporności.
Syntaza dihydropterynianowa nadaje komórce oporność na sulfonamidy. Antybiotyki tej
grupy działają bakteriostatycznie poprzez zaburzenie syntezy kwasu foliowego. Sulfonamid
zastępuje kwas p-aminobenzoesowy i uniemożliwia syntezę kwasu foliowego, co prowadzi do
zahamowania syntezy nukleotydów i uniemożliwia namnażanie się bakterii.
Plazmidowe geny nadające komórce oporność na sulfonamidy to: sul1, sul2 oraz sul3 (Swedberg
i Sköld, 1983; Perreten i Berlin, 2003). Mechanizm oporności związany z obecnością genu sul2,
który zidentyfikowano w pOK1, polega na wytwarzaniu enzymu – syntazy
dihydropterynianowej, katalizującej reakcję kondensacji kwasu p-aminobenzoesowego w
biosyntezie kwasu foliowego (kod cdd: cd00739). Dodatkowa ilość enzymu umożliwia
biosyntezę kwasu foliowego w obecności sulfonamidu.
2.5.3. Białka warunkujące odporność na tetracyklinę
Otwarte ramki orf44 i orf45 zostały zdefiniowane, odpowiednio, jako geny tetR i tetH.
Sekwencje aminokwasowe kodowanych przez nie białek wykazują podobieństwo (100%) do
białek pochodzących z różnych przedstawicieli Gammaprotobacteria, które warunkują oporność
na tetracyklinę. Analiza porównawcza, przeprowadzona ze pomocą programu BLAST,
wykazała, że geny te są często zlokalizowane, z zachowaniem syntenii, w obrębie plazmidów i
transpozonów (Kehrenberg i wsp., 1998).
Tetracyklina i większość jej pochodnych wykazuje działanie antybakteryjne poprzez
zahamowanie wzrostu bakterii. Po wniknięciu do komórki, oddziałuje z rybosomami, co
prowadzi do zablokowania syntezy białek (uniemożliwiają wiązanie się z aminoacylo-tRNA). Są
to antybiotyki dość uniwersalne, dlatego też działają na wiele bakterii - zarówno gramujemnych,
jak i gramdodatnich (Roberts, 2005). Możliwy jest również inny mechanizm, bowiem niektóre
pochodne tetracykliny wiążą się z rybosomem słabo lub wcale, natomiast oddziałują z błoną
komórkową (Rasmussen i wsp., 1991).
Zidentyfikowano różne mechanizmy oporności na antybiotyki tej grupy: (i) pompy
aktywnie usuwające tetracykliny, (ii) wytwarzanie białek chroniących rybosom, czy (iii)
enzymatyczna inaktywacja (van Hoek i wsp., 2011). Poznano dotąd ponad 40 różnych
determinantów oporności. Geny kodujące pompy i białka chroniące rybosom są identyfikowane
72
u gramdodatnich i gramujemnych bakterii, zarówno tlenowych jak i beztlenowych, natomiast
enzymatyczna inaktywacja antybiotyku została opisana tylko dla bakterii gramujemnych. Gen
tetR koduje represor transkrypcji. Białka z tej rodziny regulatorów są zaangażowane w kontrolę
transkrypcji genów kodujących pompy aktywnie usuwające antybiotyki, szlaków biosyntezy
antybiotyków, odpowiedzi na stres osmotyczny i substancje toksyczne, kontrolę szlaków
katabolicznych oraz procesów różnicowania i patogenności (Ramos i wsp., 2005). Białka TetR
mogą działać na dwa sposoby: mogą się wiązać bezpośrednio do operatora np. TetR wiąże się z
genem tetA i hamuje jego transkrypcję przy braku tetracykliny, alternatywnie mogą być
zaangażowane w regulacyjną kaskadę, w której białko TetR może być modulowane przez inny
regulator, lub TetR może wywoływać odpowiedź komórkową.
Analiza w bazie Pfam pozwoliły wyróżnić w sekwencji TetR pOK1 charakterystyczne
domeny - N-końcową (PF00440) i C-końcową (PF02909). Domena N-końcowa warunkuje
wiązanie DNA poprzez motyw HTH. Liczne regulatory transkrypcji charakteryzują się
podobnymi domenami. Na podstawie podobieństwa sekwencji, produkt genu tetR jest zaliczany
do podrodziny białek grupujących represory kontrolujące poziom wrażliwości na hydrofobowe
antybiotyki i detergenty. Domena C-końcowa odpowiada za wiązanie się z genem tetA (nie
wyróżniony w sekwencji plazmidu pOK1) i hamuje jego ekspresję pod nieobecność tetracykliny
(Fig. 29).
1 MAKLDKEQVIDNALILLNEVGIEGLTTRKLAQKIGVEQPTLYWHVKNKRALLDALAETIL 60
61 QKHHHHVLPLPNETWQDFLRNNAKSFRQALLMYRDGGKIHAGTRPSESQFETSEQQLQFL 120
121 CDAGFSLSQAVYALSSIAHFTLGSVLETQEHQESQKEREKVETDTVAYPPLLTQAVAIMD 180
181 SDNGDAAFLFVLDVMISGLETVLKSAK 207
Fig. 29. Sekwencja aminokwasowa białka TetR kodowanego w obrębie pOK1.
Obramowaniem zaznaczono konserwowane domeny na niebiesko N-końcową, na żółto C-końcową. Czerwoną
czcionka zaznaczono motyw HTH.
Produkt genu tetH to pompa usuwająca antybiotyk klasy H. Dzięki analizom w bazach
Pfam i Conserved Domain Database w sekwencji Orf45 zidentyfikowano domenę typową dla
rodziny białek MFS (ang. major facilitator superfamily; PF07690), nazywanej również rodziną
uniporter-symporter-antyporter. Białka tej rodziny ułatwiają transport różnych substratów
(jonów, leków, neurotransmitierów, nukleozydów, aminokwasów i peptydów) z cytoplazmy do
błony wewnętrznej:. Białka zaliczane do tej grupy maja zazwyczaj długość od 400 do 600
73
aminokwasów i zawierają 12 helis transbłonowych. W sekwencji Orf45, długości 400 aa,
wyróżniono aż 11 helis transbłonowych (program TMHMM Server v. 2.0) (Fig. 30).
1 MNKSIIIILLITVLDAIGIGLIMPVLPTLLNEFVSENSLATHYGVLLALYATMQVIFAPI 60
61 LGRLSDKYGRKPILLFSLLGAALDYLLMAFSTTLWMLYIGRIIAGITGATGAVCASAMSD 120
121 VTPAKNRTRYFGFLGGAFGVGLIIGPMLGGLLGDISAHMPFIFAAISHSILLILSLLFFR 180
181 ETQKREALVANRTPENQTASNTVTVFFKKSLYFWLATYFIIQLIGQIPATIWVLFTQYRF 240
241 DWNTTSIGMSLAVLGVLHIFFQAIVAGKLAQKWGEKTTIMISMSIDMMGCLLLAWIGHVW 300
301 VILPALICLAAGGMGQPALQGYLSKSVDDNAQGKLQGTLVSLTNITGIIGPLLFAFIYSY 360
361 SVAYWDGLLWLMGAILYAMLLITAYFHQRKTTPKAVISTP 400
Fig. 30. Sekwencja aminokwasowa białka TetH kodowanego w obrębie pOK1.
Obramowaniem zaznaczono konserwowaną domenę. Czerwoną czcionka zaznaczono aminokwasy potencjalnie
tworzące pory. Zielonym tłem zaznaczono aminokwasy prawdopodobnie tworzące helisy transbłonowe.
2.5.4. Reduktaza dihydrofolianowa, acetylotransferaza aminoglikozydowa, β-laktamaza,
białko warunkujące oporność na czwartorzędowe związki amoniowe
Otwarte ramki odczytu orf39-orf42 warunkują oporność na różne antybiotyki i substancje
toksyczne. Geny te znajdują się w obrębie potencjalnego integronu (patrz podrozdział: 2.4.2.
Integron).
Analiza porównawcza wykonana za pomocą programu BLAST wykazała podobieństwo
sekwencji aa Orf39, na poziomie 99–100%, do reduktaz dihydrofolianowych typu I,
spotykanych u różnych przedstawicieli Gammaproteobacteria. Enzym ten nadaje komórce
oporność na trimetoprim.
Trimetoprim jest syntetycznym chemioterapeutykiem, którego działanie polega na
hamowaniu aktywności reduktazy dihydrofolianowej, w wyniku zablokowania jej miejsca
aktywnego. Enzym ten jest częścią szlaku biosyntezy kwasu foliowego (katalizuje zależną od
NADP redukcję kwasu foliowego), a jego zablokowanie powoduje zatrzymanie syntezy
nukleotydów. Mechanizm oporności jest związany z obecnością genu kodującego reduktazę
dihydrofolianową, która jest niewrażliwa na antybiotyk i przejmuje funkcje reduktazy
kodowanej chromosomowo (wrażliwej na trimetoprim) (Fleming i wsp., 1972).
Poszukiwanie konserwowanych domen białkowych umożliwiło wyróżnienie w sekwencji
opisywanego enzymu domeny charakterystycznej dla reduktazy dihydrofolianowej oraz
potencjalnych miejsc wiązania kwasu foliowego i NADP (Fig. 31).
74
1 VKLSLMVAISKNGVIGNGPDIPWSAKGEQLLFKAITYNQWLLVGRKTFESMGALPNRKYA 60
61 VVTRSSFTSDNENVLIFPSIKDALTNLKKITDHVIVSGGGEIYKSLIDQADTLHISTIDI 120
121 EPEGDVYFPEIPSNFRPVFTQDFASNINYSYQIWQKG 157
Fig. 31. Sekwencja aminokwasowa reduktazy dihydrofolianowej kodowanej w obrębie pOK1.
Obramowaniem zaznaczono konserwowaną domenę. Czerwoną czcionka zaznaczono aminokwasy potencjalnie
wiążące kwas foliowy. Zieloną zaznaczono aminokwasy wiążące NADP.
Analiza porównawcza wykazała, że Orf40 pOK1 wykazuje największe podobieństwo do
6’-N-acetylotransferaz aminoglikozydowych typu Ib (98% identyczności sekwencji
aminokwasowych). Enzym ten warunkuje oporność na antybiotyki aminoglikozydowe, uzyskaną
dzięki modyfikacji antybiotyku. Białka te są również opisywane jako 6’-N-acetylotransferaza
acetylująca fluorochinolony, co może sugerować, że enzym ten nadaje komórce oporność na
antybiotyki tej grupy.
Stosując program Conserved Domain Search stwierdzono, że w sekwencji enzymu
występują domeny charakterystyczne dla acetylotransferaz, tj. domena typowa dla nadrodziny
AlcB oraz domena typowa dla nadrodziny N-acetylotransferaz (Fig. 32). Domena AlcB
odpowiada za katalizowanie reakcji N-acylowania grup hydroksyloaminowych w N-
hydroksybutano - 1, 4 diaminie z sukcynylo-CoA i aktywowanie tioestrowej pochodnej kwasu
bursztynowego (produktu pośredniego cyklu Krebsa).
1 LPNLAKGLTSGSNDSVTLRLMTEHDLAMLYEWLNRSHIVEWWGGEEARPTLADVQEQYLP 60
61 SVLAQESVTPYIAMLNGEPIGYAQSYVALGSGDGRWEEETDPGVRGIDQLLANASQLGKG 120
121 LGTKLVRALVELLFNDPEVTKIQTDPSPSNLRAIRCYEKAGFERQGTVTTPYGPAVYMVQ 180
181 TRQAFERTRSDA 192
Fig. 32. Sekwencja aminokwasowa acetylotransferazy aminoglikozydowej kodowanej w obrębie pOK1.
Obramowaniem zaznaczono konserwowane domeny na różowo domenę AlcB, na niebiesko – domenę
charakterystyczną dla acetylotransferaz GNAT.
Otwarta ramka odczytu orf41 została zidentyfikowana jako gen kodujący β-laktamazę
klasy D - enzym nadający komórce oporność na antybiotyki β-laktamowe. Działanie
antybiotyków tej grupy polega na zahamowaniu syntezy ściany komórkowej poprzez wiązanie
do tzw. białek wiążących penicylinę (ang. penicillin binding proteins, PBPs.) i oddziaływanie z
peptydoglikanami obecnymi w ścianie, co skutkuje jej osłabieniem prowadzi do śmierci
komórki.
75
Najważniejszym i najbardziej powszechnym mechanizmem oporności polega na
hydrolizie w cząsteczce antybiotyku wiązania β-laktamowego, niezbędnego do jego działania.
Biorąc pod uwagę funkcjonalność i charakterystykę molekularną β – laktamaz, wyróżniono kilka
klas tych enzymów. Oprócz wytwarzania enzymu możliwy jest inny mechanizm oporności,
polegający na modyfikacji białek wiążących penicylinę. Wówczas, ich wiązanie z antybiotykiem
staje się niemożliwe i ściana komórkowa nie ulega zniszczeniu (Bradford, 2001).
W sekwencji Orf41 zidentyfikowano sekwencję charakterystyczną dla transpeptydaz
(Pfam: PF00905), do których należą białka wiążące penicylinę. Transpeptydazy to enzymy
uczestniczące w budowie ściany komórkowej, odpowiadają za tworzenie mostków łączących
podjednostki peptydoglikanu.
Z kolei Orf42 kodowane w obrębie pOK1 wykazuje znaczące podobieństwo do genu
oznaczanego jako qacΔE1. Jest to defektywny gen nadający komórce częściową oporność na
czwartorzędowe związki amoniowe i bromek etydyny, który jest charakterystyczny dla
konserwowanej części 3’ integronów klasy I. Czwartorzędowe związki amoniowe to
amfoteryczne surfaktanty, często używane jako środki antyseptyczne i dezynfekcyjne. Ich
stosowane przyczynia się do selekcji fenotypów wieloopornych, determinowanych przez
integrony (Gaze i wsp., 2005).
Oporność na te związki wynika głownie z obecności genu qac kodującego białka
tworzące pompę usuwającą szkodliwe związki z komórki. W sekwencji Orf42 występuje
domena typowa dla nadrodziny białek oporności wielolekowej (Pfam: PF00893). Liczne białka z
tej rodziny zaangażowane są w proces usuwania z komórki toksycznych związków, któremu
towarzyszy napływ do komórki protonów.
2.6. Dodatkowy ładunek genetyczny plazmidu pOK1
Moduły genetyczne wyróżnione w sekwencji pOK1, które opisano w poprzednich rozdziałach,
zajmują większą część genomu plazmidu. W niniejszym rozdziale przedstawiono analizę 13
ORF leżących poza ww. modułami. Dziewięć z nich koduje hipotetyczne białka o nieznanej
funkcji, a blisko połowa wykazuje podobieństwo sekwencji do białek kodowanych w genomie
Wohlfahrtiimonas chitiniclastica SH04.
2.6.1. Transferaza adenozynofosforanu SoFic
Otwarta ramka odczytu orf03 koduje potencjalne białko wykazujące największe podobieństwo
sekwencji aa (96%) do transferazy adenozynofosforanu Wohlfahrtiimonas chitiniclastica SH04
(GenBank: WP_008315219.1). Białka pokrewne (podobieństwo sekwencji rzędu 66-67%)
76
zostały przypisane w bazach danych do rodziny Fic/DOC (PF02661). Rodzina ta składa się z
białek zaangażowanych w filamentację indukowaną przez cAMP (Fic) oraz eliminację komórek
pozbawionych profaga P1 (Doc). Białka Fic są zaangażowane w podział komórki i mogą
odgrywać rolę w syntezie kwasu p-aminobenzoesowego oraz kwasu foliowego. Są to enzymy
zmieniające inne białka poprzez dołączenie grupy adenozyno monofosforanu. Większość
członków tej rodziny zawiera konserwowany motyw HPFXXGNG. Motyw ten został również
znaleziony w sekwencji Orf03, w obrębie domeny charakterystycznej dla białek z rodziny
Fic/DOC (Fig. 33). W opisywanej sekwencji znajduję się również domena charakterystyczna dla
N-końcowej części białek z tej samej rodziny (Fic_N, PF:13784).
Fig. 33. Struktura domenowa białka Orf03 plazmidu pOK1.
Zaznaczono zasięg konserwowanej domeny Fic\DOC oraz sekwencję charakterystycznego dla niej motywu.
2.6.2. Białko z rodziny SNF
Białko pokrewne Orf04 (61-74% identyczności sekwencji aminokwasowej) mają aktywność
helikaz (GenBank: WP_002116862.1, WP_007933579.1). W sekwencji Orf04 wyróżniono
domenę charakterystyczna dla białek zaangażowanych w ATP-zależne rozwijanie RNA lub
DNA (DEXDc, Cdd: cd00046) oraz domenę często spotykaną w helikazach (HELICc, Cdd:
cd00079) (Fig. 34).
Fig. 34. Struktura domenowa białka Orf04 plazmidu pOK1.
Zaznaczono zasięg konserwowanych domen oraz miejsca wiązania ATP, nukleotydów oraz potencjalne miejsce
wiązania jonów magnezu.
2.6.3. Inwertaza DNA
Potencjalny produkt białkowy orf10 wykazuje 99% identyczność sekwencji aminokwasowej z
białkiem Wohlfahrtiimonas chitiniclastica SH04, opisanym jako inwertaza DNA (GenBank:
77
ELV07188.1). Należy podkreślić, że kolejne najbardziej podobne białko (90% identyczności)
również pochodzi z Wohlfahrtiimonas chitiniclastica SH04 i zostało opisane przez deponujących
jako inwertaza DNA lambdoidalnego profaga e14 (GenBank: ELV07232.1). Inne pokrewne
białka są definiowane jako inwertazy DNA lub resolwazy.
Za pomocą programu Conserved Domain Search (NCBI) zidentyfikowano w sekwencji
Orf10 domenę katalityczną charakterystyczną dla rekombinaz serynowych (SR_ResInv, Cdd:
cd03768), do których należą resolwazy, inwertazy, integrazy oraz transpozazy (Fig. 35).
Fig. 35. Struktura molekularna białka Orf10 plazmidu pOK1.
Zaznaczono zasięg konserwowanych domen oraz aminokwasy zaangażowane w aktywność białka.
2.6.4. Resolwaza
Sekwencja aminokwasowa Orf35 wykazuje 100% identyczność z sekwencją resolwazy
kodowanej w plazmidzie pAb5S9 Aeromonas bestiarium (GenBank: YP_001220603.1). orf35
jest zlokalizowana w obszarze pOK1 wykazującym duże podobieństwo do sekwencji plazmidu
pAb5S9 (patrz rozdział: Systemy replikacyjne) (nie stwierdzono, aby we wspomnianym
plazmidzie ww. ORF znajdowała się w obrębie transpozonu). Inne białka pokrewne Orf35
(identyczność sekwencji aminokwasowej 82-88%) są określane jako potencjalne resolwazy, i
występują u różnych przedstawicieli Gammaproteobacteria (GenBank: WP_017154886.1,
AAP22618.1, WP_002804317.1). W przypadku Pseudomonas areuginosa sekwencja pokrewna
orf35 (GenBank: AAP22618.1) znajduje się w obrębie wyspy genomowej (Klockgether i wsp.,
2004). Należy zauważyć, że sekwencje aa wszystkie białek pokrewnych Orf35 są o około 90 aa
dłuższe. Wyjątek stanowi sekwencja pochodząca z plazmidu pAb5S9 o takiej samej długości.
Na Fig. 36 przedstawiono schematycznie strukturę molekularną Orf35. W sekwencji
wyróżniono domenę katalityczna charakterystyczną dla rekombinaz serynowych (SR_ResInv,
Cdd: cd03768), do których należą resolwazy, inwertazy, integrazy oraz transpozazy, a także
domenę HTH , charakterystyczną dla białek Hin i im pokrewnych (HTH_Hin, Cdd: cd00569). W
rekombinazie Hin wyróżnia się domenę wiążącą DNA (HTH_Hin) oraz domenę katalitycznej.
Rozdział kointegratu przez resolwazę transposonów z rodziny Tn3 wymaga utworzenia
78
synaptosomu z trzech dimerów resolwazy związanych z dwoma miejscami res. W sekwencji
opisywanej potencjalnej resolwazy znalezione zostały aminokwasy prawdopodobnie biorące
udział w tworzeniu synaptosomu.
Fig. 36. Struktura molekularna białka Orf35 plazmidu pOK1.
Zaznaczono zasięg konserwowanych domen oraz aminokwasy zaangażowane w aktywność białka.
2.6.5. Hipotetyczne białka o nieznanej funkcji
Dziewięć ORF plazmidu pOK1 koduje hipotetyczne białka o nieznanej funkcji. Jedna z nich,
orf01, koduje białko konserwowane w genomie Wohlfahrtiimonas chitiniclastica SH04
(GenBank: ELV07224.1). W sekwencji tej nie stwierdzono występowania konserwowanych
domen i motywów.
Również białko Orf13 oraz Orf24 kodują białka konserwowane w W. chitiniclastica
SH04 - GenBank, odpowiednio: ELV07179.1 (76% identyczności sekwencji aa) oraz
ELV07178.1 (96% identyczności).
Pozostałe białka pOK1 wykazujące duże podobieństwo z białkami ww. bakterii to: Orf08
(GenBank: ELV07186.1) i Orf09 (GenBank: ELV07187.1) - w obu przypadkach 99%
identyczności sekwencji. Para orf08-orf09 konserwowana jest również w genomie Legionella
shakespearei (odpowiednio, 62% podobieństwa, GenBank: WP_018576134.1 i 56% i
WP_018576135.1).
Poszukiwanie konserwowanych domen białkowych ujawniło w sekwencji Orf08
obecność domeny charakterystycznej dla konserwowanych białek o nieznanej funkcji DUF1778
(Pfam: 08681). Domena ta obejmuje prawie całą długość wyróżnionej sekwencji. W sekwencji
Orf09 wyróżniono natomiast domenę występującą u acetylotransferaz z rodziny GNAT (Pfam:
PF13508).
Otwarta ramka odczytu orf28 koduje białko wykazujące 97% identyczność sekwencji aa
z hipotetycznym białkiem Salmonella enterica subsp. enterica serovar Typhimurium str. SL1344
(GenBank: YP_006203625.1). Zdeponowana w bazie danych sekwencja polipeptydu o długości
74 aa (równa długości Orf28) została opisana jako białko niekompletne. Pokrewne białka o
79
wysokiej identyczności sekwencji (96-98%) są długości 60aa (Photobacterium damselae subsp.
Piscicida, GenBank: YP_908617.1, Acinetobacter nosocomialis, GenBank: WP_001985034.1).
Wyjątek stanowi hipotetyczne białko z E. coli (GenBank: WP_001513485.1) - o długości 102
aa.
Kolejnym hipotetycznym białkiem jest Orf29. Pokrewne białko (96% identyczności
sekwencji), o długości Orf29, kodowane jest w genomie E. coli (GenBank: WP_001340320.1).
Należy zwrócić uwagę na wysokie podobieństwo (97%) sekwencji Orf29 z sekwencjami białek
opisanych jako białka replikacyjne RepC z różnych plazmidów przedstawicieli
Gammaproteobacteria (S. enterica subsp. enterica serovar Typhimurium str. T000240,
GenBank: YP_005250562.1 i E. coli, GenBank: WP_000240537.1).
Orf31 i Orf36 kodują hipotetyczne białka wykazujące największe podobieństwo
sekwencji do białek kodowanych w plazmidzie pAb5S9 Aeromonas bestiarium (GenBank,
odpowiednio: ABR10074.1 - 96 % identyczność sekwencji aa, i NP_899667.1 - 88 %
identyczność sekwencji). Stanowią one część większego segmentu plazmidu pOK1,
konserwowanego w plazmidzie pAb5S9. Tuż powyżej orf36 znajduje się gen modulatora
transpozonu Tn21 (otwarte ramki odczytu Orf36 i TnpM nachodzą na siebie na obszarze
kodującym 14 aminokwasów), co sugeruje, iż orf39 nie jest kompletna, i zapewne jej ciągłość
została przerwana w wyniku zamierzchłych zdarzeń transpozycyjnych.
3. Analiza funkcjonalna wybranych modułów genetycznych
plazmidu pOK1
W wyniku przedstawionej w tej pracy analizy bioinformatycznej sekwencji genomu plazmidu
pOK1 wyróżniono różne moduły genetyczne. W niniejszym rozdziale przedstawiono wyniki
analiz funkcjonalnych wybranych modułów.
3.1. Moduł replikacyjny.
W genomie pOK1 wyróżniono trzy potencjalne systemy replikacyjne (oznaczone jako REP1,
REP2 i REP3) (Fig. 1).
3.1.1. Analiza funkcjonalna systemów replikacyjnych.
W pierwszym etapie analizy sprawdzono, który z obecnych systemów REP jest funkcjonalny w
E. coli TG1. W tym celu przygotowano konstrukty obejmujące fragmenty plazmidu pOK1,
zawierające, odpowiednio, REP1, REP2, REP3 oraz REP1+REP3. W każdym przypadku
80
plazmid pOK1 poddano trawieniu odpowiednimi enzymami restrykcyjnymi. Następnie uzyskane
fragmenty poddano ligacji (cyrkularyzacja fragmentów).
Fig. 37. Schematy fragmentów restrykcyjnych wykorzystywanych do sprawdzenia funkcjonalności systemów
replikacyjnych.
Za pomocą strzałek zaznaczono zasięg i orientację transkrypcyjną potencjalnych ORF. Kolorami wyróżniono
podstawowe moduły genetyczne: na zielono moduły odpowiedzialne za replikację plazmidu, na pomarańczowo –
systemy odpowiedzialne za stabilne utrzymywanie plazmidu w komórce (systemy partycyjne, restrykcji-
modyfikacji oraz toksyna-antytoksyna), na niebiesko – ruchome elementy genetyczne zintegrowane z genomem
plazmidu, na fioletowo – determinanty oporności. Zaznaczono systemy replikacyjne REP1, REP2 i REP3 oraz
fenotypy opornościowe: Tcr – oporność na tetracyklinę, Ap
r – oporność na antybiotyki β-laktamowe, Am
r –
opornośc na aminoglikozydy, Trr – oporność na trimetoprim, Su
r – oporność na sulfonamidy, Sm
r – oporność na
streptomycynę.
81
Mieszaninę ligacyjną wprowadzano metodą transformacji do komórek E. coli TG1, które
wysiewano na odpowiednie podłoża selekcyjne: (i) REP1 – LB ze streptomycyną (15 μg/ml), (ii)
REP2 – LB z kanamycyną (50 μg/ml) oraz LB z trimetoprimem (50 μg/ml), (iii) REP3 – LB z
tetracykliną (20 μg/ml), (iv) REP1+REP3 – LB z tetracykliną 20 μg/ml. Z otrzymanych
transformantów izolowano plazmidowy DNA metodą lizy alkalicznej, a następnie poddawano go
analizie restrykcyjnej i elektroforetycznej. Otrzymane wyniki pozwoliły stwierdzić, że w
komórkach E. coli replikacja zachodzi jedynie z wykorzystaniem systemu REP2 (autoligacja po
trawieniu HindIII).
3.1.2. Określenie zakresu gospodarzy systemów replikacyjnych pOK1
Ponieważ stwierdzono, że w komórkach E. coli TG1 replikacja zachodzi jedynie z
wykorzystaniem REP2, podjęto badania mające na celu poszukiwanie potencjalnych gospodarzy,
w których funkcjonalne są systemy REP1 i REP3.
Podjęto zatem próbę ustalenia zakresu gospodarzy poszczególnych systemów
replikacyjnych. W tym celu sklonowano fragmenty sekwencji plazmidu pOK1 w wektorze
pABW1, otrzymując wektory wahadłowe pOK1a i pOK1b (Fig. 38). Klonowane fragmenty
pOK1 zawierały REP1 bądź REP1+REP3.
Preparat plazmidu pOK1 trawiono enzymami EcoRI i SacI lub SacI i KpnI, a następnie
ligowano z kompatybilnymi końcami liniowej formy wektora pABW1. Następnie mieszaniny
ligacyjne wprowadzano do komórek E. coli TG1 metodą transformacji. Z wyselekcjonowanej
puli transformantów izolowano plazmidowy DNA, który poddawano analizie restrykcyjnej.
Otrzymane transformaty niosące plazmidy wahadłowe, wykorzystano jako dawców w koniugacji
trójrodzicielskiej. Plazmidy wprowadzano do szczepów opornych na ryfampicynę: Paracoccus
aminovorans JCM 7685R, Agrobacterium tumefaciens LBA 288R (oba należące do
Alphaproteobacteria), Alcaligenes sp. LM16R (Betaproteobacteria), Stenotrophomonas sp.
LM24R, Pseudomonas sp. LM12R (oba należące do Gammaproteobacteria), Vogesella sp. 93R
(Betaproteobacteria), Klebsiella pneumoniae, Yersinia enterocoltica Ye0:9R, Aeromonas sp.
82R (trzy należące do Gammaproteobacteria). Jako szczep pomocniczy w koniugacji
wykorzystano szczep E. coli DH5α plazmidem pRK2013. Plazmidy otrzymanych
transkoniugantów analizowano elektroforetycznie.
82
Fig. 38. Organizacja genetyczna wektora pABW1 (a) oraz fragmentów pOK1 zawierajacych systemy REP2
(b), oraz REP1 i REP3 (c).
W pABW1 zaznaczono system replikacyjny (ori ColE1), moduł mobilizacyjny (mob), gen lacZ, gen oporności na
kanamycynę (Km) oraz MCS (ang. multi-cloning site), w obrębie którego znajdują się miejsca cięcia enzymami
EcoRI i SacI, KpnI i SacI. Pod spodem podano nazwy skonstruowanych plazmidów wahadłowych zawierających
sklonowane fragmenty pOK1.
Autonomiczne formy plazmidu stwierdzono jedynie w przypadku plazmidu
zawierającego system REP2. Nie znaleziono gospodarza, w którym replikacji ulegałby konstrukt
niosący potencjalne systemy replikacyjne REP1 i REP3. Wykazano, że plazmid pOK1a ulega
replikacji w szczepach: Paracoccus aminovorans JCM7685R, Agrobacterium tumefaciens LBA
288R, Pseudomonas sp. LM12R, Aeromonas sp. 82R oraz Vogesella sp. 93R. W szczepach
Alcaligenes sp. LM16R i Stenotrophomonas sp. LM24R nie stwierdzono autonomicznej formy
plazmidu. Koniugacja z wykorzystaniem jako biorca szczepu Yersinia enterocoltica Ye0:9R dała
wynik niepowtarzalny. W przypadku koniugacji ze szczepem Klebsiella pneumoniae
prawdopodobnie replikacji ulega system z pABW1.
Podsumowując, otrzymane wyniki system replikacyjny REP2 jest funkcjonalny w
przedstawicielach Alpha-, Beta- i Gammaproteobacteria, co świadczy o jego szerokim zakresie
gospodarzy, natomiast systemy REP1 i REP3 nie są prawdopodobnie funkcjonalne, co wymaga
jeszcze dodatkowej weryfikacji.
83
3.2. Badanie mobilizacji plazmidu pOK1 do transferu koniugacyjnego
W sekwencji opisywanego plazmidu wyróżniono część potencjalnego systemu mobilizacji do
transferu koniugacyjnego (MOB). Analiza funkcjonalna objęła również sprawdzenie tego
modułu. W tym celu wykonano koniugację wykorzystując system transferu pRK2013 (RK2). W
przeprowadzonych testach plazmid pOK1 był niezdolny do transferu koniugacyjnego.
84
Wnioski
Plazmid pOK1 jest ciekawym przykładem replikonu o mozaikowej strukturze. W jego genomie
można wyodrębnić segmenty DNA wykazujące wysokie podobieństwo (na poziomie sekwencji
nukleotydowej) do plazmidów pMS260 z Actinobacillus pleuropneumoniae oraz pAb5S9
Aeromonas bestiarium. Na uwagę zasługuje również fakt, że duża część otwartych ramek
odczytu wyróżnionych w sekwencji pOK1 wykazuje największe podobieństwo do potencjalnych
białek Wohlfahrtiimonas chitiniclastica (w Zakładzie Genetyki Bakterii Uniwersytetu
Warszawskiego wykazano, że bakteria ta zawiera plazmid). Struktura pOK1 została zatem
ukształtowana w głównej mierze w wyniku zdarzeń rekombinacyjnych, do których dochodziło
między trzema ww. plazmidami lub ich pochodnymi. Dzięki zaobserwowanym podobieństwom
możliwe jest zaproponowanie potencjalnych, pierwotnych gospodarzy tego plazmidu, których
nie znamy, bowiem plazmid ten wyizolowano metodą egzogenną.
Występowanie kilku systemów replikacyjnych w genomie pOK1 nie jest zjawiskiem
unikatowym. Przykładem jest kryptyczny plazmid F, który zawiera w swojej strukturze trzy
systemy replikacyjne, z których jeden został zinaktywowany w wyniku transpozycji Tn1000.
Genom plazmidu pOK1 ilustruje jednak inne ważne zjawisko, a mianowicie akumulację w
replikonach złożonych determinantów oporności, które, dzięki szerokiemu zakresowi
gospodarzy jednego z systemów replikacyjnych, mogą być dalej przekazywane w
horyzontalnym transferze genów.
85
Bibliografia
AIZENMAN E, ENGELBERG – KUKLA H, GLASER E, 1996. An Escherichia coli chromosomal “addiction
module” regulated by guanosine 3’,5’ – bispyrophosphate: a model for programmed bacterial cell death. Proc.
Natl. Acad. Sci. USA 93, 6059-6063.
American Academy of Microbiology, 2009. Antibiotic resistance: an ecological perspective on an old problem.
AL-AHMAD A, DASCHNER FD, KÜMMERER K, 1999. Biodegradability of cefotiam, ciprofloxacin,
meropenem, penicillin G, and sulfamethoxazole and inhibition of waste water bacteria. Arch. Environ. Con. Tox.
37, 158- 63.
ALLEN HK, DONATO J, WANG HH, CLOUD-HANSEN KA, DAVIES J, HANDELSMAN J, 2010. Call of the
wild: antibiotic resistance genes in natural environments. Nat. Rev. Microbiol. 8, 251-259
ALONSO A., SANCHEZ P., MARTINEZ J. L., 2001. Environ. Microbiol. 3, 1.
APISIRIDEJ S, LEELAPORN A, SCARAMUZZI C D, SKURRAY R A, FIRTH N, 1997. Molecular analysis of a
mobilizable theta-mode trimethoprim resistance plasmid from coagulase-negative Staphylococci. Plasmid 38, 13-24.
BAHL MI, BURMOLLE M, MEISNER A, HANSEN LH, SORENSEN SJ, 2009. All IncP-1 plasmid subgroups,
including the novel epsilon subgroup, are prevalent in the influent of a Danish wastewater treatment plant. Plasmid
62, 134-139.
BARTOSIK D, WŁODARCZYK M, THOMAS CM, 1997. complete nucleotide sequence of the replicator region
of Paracoccus (Thiobacillus) versutus pTAV1 plasmid and its correlation to several plasmids of Agrobacterium and
Rhizobium species. Plasmid 38, 53-59.
BERTINI A, POIREL L, MUGNIER PD, VILLA L, NORDMANN P, CARATOLLI A, 2010. Characterization and
PCR-based replicon typing of resistance plasmids in Acinetobacter baumannii. Antimicrob. Agents Chemother. 54,
4168-4177.
BENNETT PM., 2008. Plasmid encoded antibiotic resistance: acquisition and transfer of antibiotic resistance
genes in bacteria. Brit. J. pharmacol. 153, 347-357.
BIRNBOIM HC, DOLY J, 1979. A rapid alkaline extraction procedure for screening recombination plasmid DNA.
Nucleic Acids Res. 7, 1513-1519.
BRADFORD PA, 2001. Extended spectrum β-lactamase in the 21st century: characterization, epidemiology, and
detection of this important resistance threat. Clin. Microbiol. Rev. 14, 933-951
BROWN HJ, STIKES HW, HALL RM, 1996. The integrons In0, In2 and In5 are defective transposon derivatives.
J. Bacteriol. 178, 4429-4437.
CHEE_SANFORD JC, MACKIE RI, KOIKE S, KRAPAC IG, LIN YF, YANNARELL AC, MAXWELL S,
AMINOV RI, 2009. Fate and transport of antibiotic residues and antibiotic resistance genes following land
application of manure waste. J. Environ. Q. 38, 1086-1108.
CROOKS GE, HON G, CHANDONIA JM, BRENNER SE, 2004. WebLogo: a sequence logo generator. Genome
Res. 14, 1188-1190.
D' COSTA VM, McGRANN KM, HUGHES DW, WRIGHT GD, 2006. Sampling the antibiotic resistome. Science
311, 374-377.
DIAZ-OREJAS R, DEL SOLAR G, GIRALDO R, RUIZ-ECHEVARRIA M J, ESPINOSA M, 1998. Replication
and control of circular bacterial plasmids. Microbiol Mol Biol Rev. 62, 434-464.
DIONISIO F, MATIC I, RADMAN M, RODRIGUES OR, TADDEI F, 2002. Plasmids spread very fast in
heterogeneous bacterial communities. Genetics 162, 1525-1532.
86
DITTA G, STANFIELD S, CORBIN D, HELINSKI DR, 1980. Broad host range DNA cloning system for gram-
negative bacteria: construction of a gene bank of Rhizobium meliloti. Proc. Natl. Acad. Sci. USA 77, 7347-7351.
EBERSBACH G, GERDES K, 2005. Plasmid segregation mechanisms. Annu. Rev. Genet. 39, 453-479.
FERNANDEZ DE HENESTROSA AR, OGI T, AOYAGI S, CHAFIN D, HAYES JJ, OHMORI H, WOODGATE
R, 2000. Identification of additional genes belonging to the LexA regulon in Escherichia coli. Mol. Microbiol. 35,
1560-1572.
FLEMING MP, DATTA N, GRÜNEBERG RN, 1972. Trimethoprim resistance determined by R factors. Br. Med.
J. 1, 726-728.
GANDARA A. MOTA LC, FLORES C, PEREZ HR, GREEN CF, GIBBS SG, 2006. Isolation of Staphyloccocus
aureus and antibiotic-resistant Staphylococcus aureus from residential indoor bioaerosols. Environ. Health
Perspect. 114, 1859-1864.
GAZE WH, ABDOUSLAM N, HAWKEY PM, WELLINGTON EM, 2005. Incidence of class 1 integrons in
quaternary ammonium compound-polluted environment. Antimicrob. Agents Chemother. 49, 1802-1807.
GERDES K, 2000. Toxin-antitoxin modules may regulate synthesis of macromolecules during nutritional stress. J.
Bacteriol. 182, 561-572.
GERDES K, CHRISTENSEN S. K., LOBNER-OLESEN A, 2005. Prokaryotic toxin–antitoxin stress response loci.
Nat. Rev. Microbiol. 3, 371-382.
GERDES K, MOLLER-JENSEN J, BUGGE JENSEN R, 2000. Plasmid and chromosome partitioning: surprises
from phylogeny. Mol. Microbiol. 37, 455-466.
GIBSON TJ, 1984. Studies on the Epstein-Barr virus genome. Praca doktorska. Cambridge University, Anglia.
GIRALDO R, FERNANDES-TRESGUERRES ME. 2004. Twenty years of the pPS10 replicon: insights on the
molecular mechanism for the activation of DNA replication in iteron-containing bacterial plasmids. Plasmid 52, 69-
83.
GOLOVANOV AP, BARILLA D, GOLOVANOVAM, HAYES F, LIAN LY, 2003. ParG, a protein required for
active partition of bacterial plasmids, has a dimeric ribbon-helix-helix structure. Mol. Microbiol. 50, 1141-53.
GOULD IM, 1999. A review of the role of antibiotic policies in the control of antibiotic resistance. J. Antimicrob.
Chemother. 43, 459-465.
GRAVEL A, FOURNIER B, ROY PH, 1998. DNA complexes obtained with the integronintegrase IntI1 at the attI1
site. Nucleic Acids Research, 26, 4347-4355.
GRINSTED J, DE LA CRUZ F, SCHMITT R, 1990. The Tn21 subgrup of bacterial transposable elements. Plasmid
24, 163-189.
GUERIN E, CAMBRAY G, SANCHEZ-ALBEROLA N, CAMOPOY S, ERILL I, DA RE S, GONZALES-ZORN
B, BARBE J, PLOY M-C, MAZEL D, 2009. The SOS Response Controls Integron Recombination. Science 324-
1034.
HARLEY CB, REYNOLDS RP, 1987. Analysis of E. coli promoter sequences. Nucleic Acids Res. 15, 2343-2361.
HANCOCK REW, 1981. Aminoglycoside uptake and mode of action with special reference to streptomycin and
gentamicin. J. Antimicrob. Chemother. 8, 249-276.
HEINEMANN JA, SPRAGUE GF Jr, 1989. Bacterial conjugative plasmids mobilize DNA transfer between
bacteria and yeast. Nature 340, 205-209.
HERMANSON M, JONES GW, KJELLEBERG S, 1987. Frequency of antibiotic and heavy metal resistance,
pigmentation, and plasmids in bacteria of the marine air-water interface. Apll. Environ. Microbiol. 53, 2338-2342.
87
KEHRENBERG C, WERCKENTHIN C, SCHWARTZ S, 1998. Tn5706, a transposon-like element from
Pasteurella multocida mediating tetracycline resistance. Antimicrob. Agents Chemother. 42, 2116-2118.
KLOCKGETHER J, REVA O, LARBIG K, TÜMMLER B, 2004. Sequence analysis of the mobile genome island
pKLC102 of Pseudomonas aeruginosa. C. J. Bacteriol. 186, 518-534.
KREPS S, FERINO F, MOSARIN C, GERITS J, MERGEAY M, THURIAUX P, 1990. Conjugative transfer and
autonomous replication of a promiscuous IncQ plasmid in the cyanobacterium Synechocystis Pcc-6803. Mol. Gen.
Genet. 221, 129-133.
KUSHNER SR, 1978. An improved method for transformation of E. coli with ColE1 derived plasmids, str. 17-23.
W: Boyer, HB, Nicosia S (red.), Genetic engineering. Elsevier/North Holland, Amsterdam, Holandia.
KÜMMERER K., 2004. Resistance in the environment. J. Antimicrob. Chemother. 54, 311-320.
LIEBERT CA, HALL RM, SUMMERS AO, 1999. Transposon Tn21 Flagship of the Floating Genome. Microbiol.
Mol. Biol. Rev. 63, 507-522.
LITTLE JW, 1991. Mechanism of specific LexA cleavage: autodigestion and the role of RecA coprotease.
Biochimie 73, 411-421.
LIU B, POP M., 2009. ARDB – Antibiotic Resistance Genes Database. Nucleic Acids Res. 37, 443-447.
LUTKENHAUS J, SUNDARAMOORTHY M, 2003. MinD and role of the deviant Walker A motif, dimerization
and membrane binding in oscillation. Mol. Microbiol. 48, 295-303.
MARTINEZ JL 2009. Environmental pollution by antibiotics and by antibiotic resistance determinants. Environ.
Pollut. 157, 2893-2902.
MALONE T, BLUMENTHAL RM, CHENG X, 1995. Structure-guided analysis reveals nine sequence motifs
conserved among DNA amino-methyltransferases, and suggests a catalytic mechanism for these enzymes. J. Mol.
Biol. 253, 618-632.
MAZEL D, 2006. Integrons: agents of bacterial evolution. Nat. Rev. Microbiol. 4, 608-620.
MAZEL D, ERILL I, CAMBRAY G, SANCHEZ-ALBEROLA N, CAMPOY S, GUERIN E, DA RE S,
GONZALES-ZORN B, PLOY M, BARBE J, 2011. Prevalence of SOS-mediated control of integron integrase
expression as an adaptive trait of chromosomal and mobile integrons. Mobile DNA 2, 6-10.
MAZODIER P, PETTER R, THOMPSON C, 1989. Intergeneric conjugation between Escherichia
coli and Streptomyces species. J. Bacteriol. 171, 3583-3585.
MOORE RA, DESHAZER D, RECKSEIDLER S, WEISSMANN A, WOODS DE, 1999. Efflux-mediated
aminoglycoside and macrolide resistance in Burkholderia pseusomallei. Antimicrob. Agents Chemother. 43, 465-
470.
MUÑOZ BELLIDO JL, YAGÜEGUIRAO G, GUITÉRREZ ZUFIAURRE N, MANZANARES AA, 2002. Efflux-
mediated antibiotic resistance in Gram-positive bacteria. Rev. Med. Microbiol. 13, 1-13.
NAITO T, KUSANO K, KOBAYASHI I, 1995. Selfish behavior of restriction-modification systems. Science 267,
897-899.
NAKAYA R, NAKAMURA A, MURATA Y, 1960. Resistance transfer agents in Shigella. Biochem. Biophys. Res.
Commun. 3, 654-659.
88
NESMELOVA IV, HACKETT PB, 2010. DDE Transposases: structural similarity and diversity. Adv. Drug. Deliv.
Rev. 62, 1187-1195.
NORDSTRÖM K, AUSTIN SJ, 1989. Mechanisms that contribute to the stable segregation of plasmids. Annu.
Rev. Genet. 23, 37-69.
PARTRIDGE SR, TSAFNAT G, COIERA E, IREDELL JR, 2009. Gene cassettes and cassette arrays in mobile
resistance integrons. FEMS Microbiol. Rev. 33, 757-784.
PERRETEN V, BOERLIN P, 2003. A new sulfonamide resistance gene (sul3) in Escherichia coli is widespread in
the pig population of Switzerland. Anitimicrob. Agents Chemother. 47, 1169-1172.
PIDDOCK LJ, 2006. Multidrug-resistance efflux pumps not just for resistance. Nat. Rev. Microbiol. 4, 629-636.
PLASTERK RH, 1995. Mechanisms of DNA transposition. In: Sherratt D J, editor. Mobile genetic elements. New
York, N.Y: Oxford University Press, 18–32.
POEHLSGAARD J, DOUGHTWAITE S, 2005. The bacterial ribosome as a target for antibiotics. Nat. Rev.
Microbiol. 3, 870-881.
POOLE K., 2002. Mechanisms of bacterial biocide and antibiotic resistance. J. Applied Microbiol. 92, 55S-64S.
ROBERTS MC, 2005. Update of acquired tetracycline resistance genes. FEMS Microbiol. Lett. 245, 195-203.
RAMOS JL, MARTINEZ-BUENO M, MOLINA-HENARES AJ, TERAN W, WATANABE K, ZHANG X,
GALLEGOS MT, BRENNAN R, TOBES R, 2005. The TetR family of transcriptional repressors. Microbiol. Mol.
Biol. Rev. 69, 326-56.
RASMUSSEN B, NOLLER HF, DAUBRESSE G, OLIVA B, MISULOVIN Z, ROTHSTEIN DM, ELLESTARD
GA, GLUZMAN Y, TALLY FP, CHOPRA I, 1991. Molecular basic of tetracycline action: identification of
analogs whose primary targets is not the bacterial ribosome. Antimicrob. Agents Chemother. 35, 2306-2311.
ROSAS I, SALINAS E, MARTÍNEZ L, CALVA E, CRAVIOTO A, ESLAVA C, AMÁBILE-CUEVAS CF, 2006.
Urban dust fecal pollution in Mexico City: antibiotic resistance and virulence factors of Escherichia coli. Int. J.
Hyg. Environ. Health 209, 461-470.
SAKAIH, KOMANO T, 1996. DNA replication of the IncQ broad-host-range plasmids in gram-negative bacteria.
Biosci. Biotechnol. Biochem. 60, 377-382.
SAMBROOK J, RUSSELL DW, 2001. Molecular cloning: A laboratory manual. Cold Spring Harbor Laboratory
Press, New York.
SARMAH AK., MEYER MT, BOXALL AB, 2006. A global perspective on the use, sales, exposure pathways,
occurrence, fate and effects of veterinary antibiotics (VAs) in the environment. Chemosphere 65, 725-759.
SCHAEFER Ch, MESSER W, 1991. DnaA protein/DNA interaction. Modulation of the recognition sequence. Mol.
Gen. Genet. 226, 34-40.
SCHLUCKEBIER G, O’GARA M, SAENGER W, CHENG X, 1995. Universal catalytic domain structure of
AdoMet-dependent methyltransferases. J. Mol. Biol. 247, 16-20.
SCHLUTER A, SZCZEPANOWSKI R, PUHLER A, TOP EM, 2007. Genomics of IncP-1 antibiotic resistance
plasmids isolated from wastewater treatment plants provides evidence for a widely accessible drug resistance gene
pool. FEMS Microbiol. Rev. 31, 449-477.
SÉVENO NA, KALLIFADAS D, SMALLA K, VAN ELSAS JD, COLLARD JM, KARAGOUNI AD,
WELLINGTON EMH, 2002. Occurence and reservoirs of antibiotic resistance genes in the environment. Rev.
Med. Microbiol. 13, 15-27.
89
SHAW KJ, RATHER PN, HARE RS, MILLER GH, 1993. Molecular genetics of aminoglycoside resistance genes
and familiar relationships of the aminoglycoside-modifying enzymes. Microbiol. Rev. 57, 138-163.
SHERRATT D, 1989. Tn3 and other related transposable elements: Site-specific recombination and transposition.
In: Berg D E, Howe M M, editors. Mobile DNA. American Society for Microbiology, 163-184.
SLATER FR, BAILEY MJ, TETT AJ, TURNER SL, 2008. Progress towards understanding the fate of plasmids in
bacterial communities. Fems Microbiol. Ecol. 66, 3-13.
SORENSEN SJ, BAILEY M, HANSEN LH, KROER N, WUERTZ S, 2005. Studying plasmid horizontal transfer
in situ: A critical review. Nat. Rev. Microbiol. 3, 700-710.
SZCZEPANOWSKI R, LINKE B, KRAHN I, GARTEMANN KH, GUTZKOV T, EICHLER W, PUHLER A,
SCHLUTER A, 2009. Detection of 140 clinically relevant antibiotic-resistance genes in the plasmid metagenome of
wastewater treatment plant bacteria showing reduced susceptibility to selected antibiotics. Microbiology-Sgm, 155,
2306-2319.
SWEDBERG G, SKÖLD O, 1983. Plazmid-borne sulfonamide resistance determinants studiem by restriction
enzyme analysis. J. Bacteriol. 153, 1228-1237.
VAKULENKO SB, MOBASHERY S, 2003. Versality of aminoglycosides and prospects for their future. Clin.
Microbiol. Rev. 16, 430-450.
VAN HOEK AH, MEVIUS D, GUERRA B, MULLANY P, ROBERTS AP, AARTS HJ, 2011. Acquired antibiotic
resistance genes: an overview. Front. Microbiol. 2, 203.
VETTER N, HAVER E, 2002. Hospital-acquired pneumoniae: a complex killer. Clin. Microbiol. Infect. 8 (Suppl.
1), 38.
WALKER GC, 1984. Mutagenesis and inducible responses to deoxyribonucleic acid damage in Escherichia coli.
Microbiol. Rev. 48, 60-93.
WGNER M, LOY A, 2002. Bacterial community composition and function In sewage treatment systems. Cur. Opin.
Biotechnol. 13, 218-227.
WITTE W, 1999. Antibiotic resistance in Gram-positive bacteria: epidemiological aspects. J. Antimicrob.
Chemother. 44, 1-9.
WOLINOWSKA R, MASNY A, PŁUCIENNICZAK A, 2002. Integrony. Kosmos. 51, 353-364.
YAMAICHI Y, NIKI H, 2000. Active segregation by the bacillus subtilis partitioning system in Escherichia coli.
Proc. Natl. Acad. Sci. USA 97, 14656-14661.
ZHANG XX, ZHANG T, FANG H, 2009. Antibiotic resistance genes in water environment. Appl. Microbiol.
Biotechnol. 82, 397-414.
ZIELENKIEWICZ U, CEGŁOWSKI P, 2002. Mechanizmy stabilnego dziedziczenia plazmidów. Kosmos. Problemy
Nauk Biologicznych 51, 297-304.