Download - Estrutura e Evolução dos Genomas Embrapa
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
1/111
Ana Maria Costa Csar MartinsGenomas
EstruturaeevoluodosGe
nomas
Cerrados
.
. . .
. .
Ministrio daAgricultura, Pecuria
e Abastecimento
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
2/111
Genomas
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
3/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
4/111
Genomas
Empresa Brasileira de Pesquisa AgropecuriaEmbrapa Cerrados
Ministrio da Agricultura, Pecuria e Abastecimento
Embrapa Cerrados
Planaltina, DF
2009
Ana Maria Costa Csar Martins
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
5/111
Exemplares desta publicao podem ser adquiridos na:
Embrapa CerradosBR 020, Km 18, Rodovia Braslia/Fortaleza
Caixa Postal 08223CEP 73310-970 Planaltina-DF
Fone (61) 3388-9898 Fax (61) 3388-9879
Embrapa Informao TecnolgicaParque Estao Biolgica PqEB s/n. Plano Piloto
CEP 70707-901 Braslia-DFFone (61) 3448-4236 Fax (61) 3340-2753
Coordenao editorialFernanda Vidigal Cabral de Miranda
Equipe de revisoFernanda Vidigal Cabral de Miranda
Francisca Elijani do Nascimento
Jussara Flores de Oliveira Arbus
Normalizao bibliogrfca
Shirley da Luz Soares de Arajo
Capa, projeto grfco e diagramao
Fabiano Bastos
1a edio
1a impresso (2009): 500 exemplares
Todos os direitos reservados.
A reproduo no-autorizada desta publicao, no todo ou
em parte, constitui violao dos direitos autorais (Lei n 9.610).
Dados Internacionais de Catalogao na Publicao - CIP
Embrapa Cerrados
C 937e Costa, Ana Maria.
Estrutra e evoluo dos genomas/Ana Maria Costa, Cesar
Martins. Planaltina, DF : Embrapa Cerrados; Braslia, DF : EmbrapaInormao Tecnolgica, 2009.
110 p. : il. color.
ISBN 978-85-7075-043-3
1. Gentica. 2. Genoma. 3. Evoluo. I. Martins, C. II. Ttulo.
572.86
Embrapa 2009
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
6/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
7/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
8/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
9/111
atividades exigem constantes esoros para selecionar e recuperar alinhagem original.
O livro Estrutura e Evoluo de Genomas az um apanhado geraldos esoros para se conhecer o material gentico, apresenta concei
tos bsicos de biologia molecular e sintetiza os conhecimentos gerados nos projetos genomas quanto estrutura e organizao cromossmica das espcies. Finalizando, apresenta e discute os mecanismosmoleculares que promovem variabilidade e diversidade biolgica.
Os assuntos apresentados contribuem para o entendimento dadinamicidade dos processos evolutivos importantes aos programasde conservao e melhoramento gentico.
Jos Robson Bezerra Sereno
CheeGeral da Embrapa Cerrados
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
10/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
11/111
Genoma eucarionte 32
Genoma das organelas 37
Genoma dos cloroplastos e mitocndrias 37
Genoma mitocondrial de tripanossomatdeos 39
Organizao Estrutural e Instabilidade do Material Gentico 43
Elementos repetitivos 46
Elementos repetitivos mveis longos 50
Elementos repetitivos mveis curtos 54
Instabilidade de sequncias 57
Repeties do tipo satlites 57
Instabilidade de insertos clonados 59
Instabilidade e estruturas noB 62
Evoluo do Genoma 69
Mutao intragnica 71
Embaralhamento de xons 72
A transerncia horizontal de genes 74
ranserncia horizontal de genes e caractersticas estruturais
do genoma 74
ranserncia horizontal de genes de sequncias deminicrculos de kDNA de Trypanosoma cruzi para o genomada clula hospedeira 78
Duplicao gnica: a maior ora da evoluo 80
Consideraes Finais 85
Reerncias Bibliogrcas 87
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
12/111
A palavra genoma oi cunhada por Hans Winkler, em 1920,como uma conjugao de gene e cromossomo. No entanto, o con
ceito geral de genoma pode ser atribudo ao sculo IV, antes da EraCrist, quando Aristteles apontou os primeiros conceitos em relao hereditariedade. Embora os trabalhos de Mendel, no naldo sculo XIV, tenham propiciado grandes contribuies no campoda hereditariedade, essa rea mostravase, ainda, bastante abstrata.Com o avano dos mtodos cientcos e das tecnologias, a hereditariedade passou a ser associada s estruturas presentes no ncleodas clulas chamadas cromossomos nal do sculo XIX e incio do
sculo XX) e nalmente com os polmeros de nucleotdeos duplata chamados de DNA (meados do sculo XX), que ormam os cromossomos.
Anteriormente ao advento do sequenciamento de molculas deDNA, os cromossomos orneceram as primeiras noes detalhadas
O Genoma e
sua HistriaAna Maria CostaCsar Martins
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
13/111
12 Estrutra e evoluo dos genomas
sobre a organizao sica do genoma. Mesmo aps avanos signicativos obtidos por meio do sequenciamento completo de genomas,os cromossomos continuam sendo a base para a compreenso dogenoma, j que possibilitam integrar diversos tipos de inormaes
na gerao de mapas genticos sicos detalhados das espcies.As primeiras evidncias da existncia do DNA, no ncleo dasclulas, oram obtidas pelo jovem cientista suio Friedrich Miescher,em 1869. Miescher, aos 25 anos de idade, identicou uma substnciarica em soro que no se enquadrava como nenhuma das substncias proteicas conhecidas at aquele momento. A essa substncia eledeu o nome de nuclena. Embora alguns anos mais tarde WaltherFlemming (1889) tenha cunhado a palavra cromatina e Wilhelm
Waldeyer (1888) o termo cromossomo, nenhuma relao clara haviasido eita entre cromatina/cromossomo e nuclena. Em 1889, RichardAltman obteve amostras de nuclena livres de protena e cunhouuma denominao mais apropriada para a substncia: cido nuclei-co. Aps esse perodo, a composio das molculas de cido nucleico oi deduzida e, por volta de 1930, a nuclena se tornou o cidonucleico desoxirribose e, posteriormente, cido desoxirribonucleico.At aquele momento, existiam questionamentos acerca da molcu
la que carregava a inormao hereditria. As primeiras evidnciasde que o DNA era o material gentico oram obtidas por Avery,MacLeod e MacCarty, em 1944. A partir desse momento, importantes descobertas ocorreram nos anos seguintes, incluindo as primeiras hipteses sobre a estrutura do DNA e as descobertas quelevaram sntese de Watson e Crick, em 1953, sobre a estrutura doDNA e a subsequente decirao do cdigo gentico. A histria dosestudos em genoma acompanham os avanos recentes em genticae biologia molecular. Ao contrrio de outras reas como a sica,matemtica e losoa, essa rea muito recente e vem se desenvol
vendo de orma muito dinmica (Fig. 1). Dessa orma, a genmicacomo cincia existe desde os primeiros estudos bsicos sobre estrutura cromossmica, chegando aos avanos recentes relacionados ao
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
14/111
13O genoma e sua histria
sequenciamento de genomas inteiros. Assim, o genoma pode serentendido como o complemento gnico completo (no sentido degentipo ou o DNA total presente no lote cromossmico haplide.
Conhecimento
Tempo
1880
1940
Matemtica
Filosoa
Fsica
Gentic
a
Biologia
Molecul
ar
Fig. 1. Avanos no conhecimento, ao longo do tempo, nas dierentes reas da cincia e da losoa.
Por volta de 1950, diversos trabalhos comearam a utilizar a terminologia classes de DNA como reerncia ao contedo de DNAde clulas diplides (Classe I) e haplides (Classe IC). Uma ormaderivada utilizada com base nesses trabalhos para denir a quantidade de DNA em um ncleo haplide oi o valorC. Uma vezque o DNA o material hereditrio, poderamos considerar que as
variaes detectadas no tamanho do genoma estariam reetindo variaes no nmero de genes. No entanto, essa considerao passou a
perder sua validade a partir das comparaes que comearam a sereitas entre espcies.
Em 1951, Mirsky e Ris publicaram um trabalho sobre o contedode DNA das clulas de uma ampla gama de organismos animais,mostrando um verdadeiro paradoxo (paradoxo do valorC), uma
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
15/111
14 Estrutra e evoluo dos genomas
vez que o aumento da complexidade no estava correlacionado comaumento no genoma e do nmero de genes. No entanto, com a descoberta de que grande parte do DNA eucaritico representadapor sequncias nocodicaroras, o paradoxo do valorC parecia
parcialmente resolvido. Entretanto, essa questo oi, ainda, tema dedebates que persistiram durante a segunda metade do sculo XX,envolvendo diversos aspectos relacionados evoluo do genoma.
Diversos trabalhos de R Gregory, publicados nos anos subsequentes a 2000, enatizam que a evoluo do tamanho do genoma mais bem denida como um complexo quebracabea denominado Enigma do ValorC. Para compreender esse enigma, precisamos responder a dierentes e independentes questes que norteiam
diversos aspectos da biologia das espcies, tais como: (1) variaodo tamanho do genoma nas dierentes taxas; (2) quantidade, tipoe distribuio de DNA nocodicador nos dierentes organismos;3 mecanismos de perda e ganho de DNA ao longo do tempo; e 4uno do DNA nocodicador.
As ltimas dcadas do sculo XX representaram um perodoparticularmente excitante para a biologia. Novos mtodos de anlises de protenas, DNA e RNA levaram a uma exploso de inorma
es que permitiram aos cientistas estudar os organismos, as clulase suas molculas de orma mais detalhada. Essas novas tecnologiastm permitido no somente decirar as inormaes, mas, tambm,a orma com que os componentes moleculares interagem, ormandoclulas e organismos complexos e uncionais.
At o incio dos anos de 1970, o DNA era uma molcula dicilde ser analisada bioquimicamente. Hoje, graas ao desenvolvimentodas tecnologias de manipulao do DNA, ela uma das molculasmais ceis de ser estudada. Regies especcas do DNA podem seracilmente isoladas, propagadas em nmero inimaginvel de vezese sequncias nucleotdicas de milhes de pares de bases podem serconhecidas em questo de horas. O desenvolvimento de trs tecnologias em particular, a restrio enzimtica e a reao em cadeia da
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
16/111
15O genoma e sua histria
polimerase (Polymerase Chain Reaction PCR) e o sequenciamentodo DNA possibilitou avanos signicativos na manipulao e noconhecimento do genoma.
Em 1962, W. Arber orneceu as primeiras evidncias da existn
cia das nucleases de restrio, que so enzimas bacterianas de clivagem de DNA que reconhecem sequncias curtas de bases e azemum corte na dupla hlice do DNA. Sua uno na clula bacteriana cortar e destruir DNAs virais estranhos que possam ter entradona clula. Um aspecto importante que as enzimas de restrio noclivam aleatoriamente o DNA e sim em sequnciasalvoespeccas,o que az delas uma erramenta poderosa na manipulao do DNA.Qualquer molcula de DNA, de vrus a humanos, contm stiosalvo
de enzimas de restrio, distribudos aleatoriamente de orma queragmentos de DNA de tamanhos adequados possam ser produzidos para clonagem. Os stios de restrio no possuem relevnciauncional, uma vez que a maioria dos organismos no possui enzimas de restrio.
Em 1985, K. B. Mullis e colaboradores inventaram a PCR, tecnologia que permite uma rpida e eciente amplicao de regies especcas do genoma. Precisamente, essa reao possibilita que uma
regio selecionada do genoma seja amplicada milhes de vezes,permitindo seu isolamento do resto do genoma. Dessa orma, osconhecimentos gerados, nos ltimos 50 anos, permitiram avanossignicativos no esclarecimento da organizao estrutural e uncional dos genomas.
Grande parte dos genomas que oram completamente sequenciados utilizou o mtodo de Sanger (SANGER et al., 1977), que possibilita a determinao da sequncia nucleotdica ordenada de umragmento de DNA. Embora esse mtodo tenha sido melhorado aolongo das ltimas dcadas, seus princpios continuam os mesmos.Nessa tcnica, o DNA a ser sequenciado desnaturado inicialmente em tas simples por aquecimento, com posterior anelamento deuma sequncia de iniciadores marcado com soro radioativo (P32)
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
17/111
16 Estrutra e evoluo dos genomas
no nal da extremidade 3 de uma das tas simples. Essa soluo dividida em quatro amostras correspondendo s quatro bases doDNA. DNA polimerase e desoxinucleotdeos (dAP, dCP, dGP,dP so adicionados a cada amostra, sendo posteriormente adi
cionada a cada uma das amostras dideoxinucleotdeos correspondendo s quatro bases ddAP, ddCP, ddGP, ddP. Dessa orma, so montadas quatro reaes idnticas, exceto pela presena dedideoxinucleotdeos de Adeninas na primeira reao, dideoxinucleotdeos de iminas, na segunda reao, e assim sucessivamente.
Os dideoxinucleotdeos so estruturalmente similares aos nucleotdeos normais, exceto pela presena de um hidrognio no carbono3 do acar, em vez de um grupo hidroxila. Esse nucleotdeo mo
dicado, quando incorporado na cadeia de DNA nascente, impedea incorporao de um prximo nucleotdeo e consequentementeinterrompe a sntese da ta de DNA. Dessa orma, ao nal de cadareao se orma uma coleo de milhares de molculas terminando no mesmo nucleotdeo. Quando essas molculas so separadaspor eletroorese, possvel identicar a posio na ta de DNA dosdideoxinucleotdeos especcos daquela reao. A anlise conjuntadas reaes contendo dideoxinucleotdeos para as quatro bases per
mite a leitura ordenada da sequncia de bases do DNA.Na dcada de 1980, iniciativas comearam a ser discutidas para osequenciamento de diversos genomas de espcies modelo, incluindohumanos. No incio da dcada de 1990, o desenvolvimento de dideoxinucleotdeos marcados com corantes, assim como o desenvol
vimento das mquinas de sequenciamento por capilaridade, permitiram um aumento considervel da capacidade de sequenciamento.
O primeiro genoma completamente sequenciado oi do bacteriago phiX174, com 5.375 pares de base (pb) contendo 9 genes(SANGER et al., 1977). O sequenciamento desse genoma viral representou um passo signicativo, pois indicava que genomas maiscomplexos poderiam tambm ser sequenciados.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
18/111
17O genoma e sua histria
O primeiro eucarionte sequenciado oi o ungo Saccharomycescerevisiae, com 13 milhes de pb, cujo genoma oi somente determinado quase vinte anos aps o primeiro sequenciamento realizado (GOFFEAU et al., 1996). Nos anos seguintes, os avanos
continuaram e o primeiro animal a ter seu genoma sequenciadooi o nematdeo Caenorhabditis elegans com 100 milhes pb HEC. ELEGANS SEQUENCING CONSORIUM, 1998); a primeiraplanta sequenciada oiArabidopsis thaliana com 157 milhes de pbHEARABIDOPSIS GENOME INIIAIVE, 2000.
A idia de sequenciamento do genoma humano comeou a serdiscutida por volta de 1985 e o primeiro rascunho da sequncia nucleotdica do genoma humano saiu em 2001 (INERNAIONAL
HUMAN GENOME SEQUENCING CONSORIUM, 2001;VENER et al., 2001). Embora o sequenciamento completo dediversos genomas tenha sido divulgado, incluindo o genoma humano, muitas incorrees ainda existem, principalmente relacionadasao correto posicionamento no genoma de determinados segmentossequenciados. Alm disso, o correto arranjo e o posicionamento dagrande quantidade de sequncias repetitivas de DNA presentes nogenoma representam, ainda, um desao para os sistemas atuais de
montagem da sequncia nucleotdica ordenada do genoma.Aps 30 anos de avanos, existiam, em outubro de 2007, maisde 600 genomas sequenciados que cobrem mais de 180 espcies. Amaior parte dos dados desses organismos sequenciados pode seracessada on-line por meio dos seguintes stios na internet:
http://www.genomenewsnetwork.org/resources/sequenced_genomes/genome_guide_p1.shtml
http://cmr.tigr.org/tigrscripts/CMR/CmrHomePage.cgi http://www.ncbi.nlm.nih.gov/sites/entrez?db=Genome http://www.genomesonline.org/
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
19/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
20/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
21/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
22/111
21Uma viso geral dos genomas: de vrus a humanos
ou segmentada, j que a base da nomenclatura viral est no tipode genoma que possui. Em seguida, sero apresentados dierentesgrupos virais com base na estrutura do seu cido nucleico.
Vrus de DNAApresentam seu material gentico na orma de ta dupla (dsDNA)
ou ta simples ssDNA.Como exemplos de vrus de DNA ta dupla podem ser citados
os vrus da varola, herpes, hepatite B, citomegalovrus, adenovrus e alguns bacteriagos. De acordo com o ICV, existem 22amlias de vrus que possuem dsDNA (Poxviridae, Iridoviridae,Herpesviridae, Adenoviridae, Polyomaviridae, Papillomaviridae,
Asarviridae, Myoviridae, Siphoviridae, Podoviridae, ectioviridae,Corticoviridae, Plasmaviridae, Lipothrixviridae, Rudiviridae,Fuselloviridae, Guttaviridae, Phycodnaviridae, Polydnaviridae,Ascoviridae, Baculoviridae, Nimaviridae. Seus genomas variam de5 quilos de base (kb) a 375 kb e inectam bactrias, arqueobactrias,amebas, micoplasmas, algas, ungos, invertebrados e vertebrados.Interessantemente, no se conhece vrus de dsDNA que inectaplantas.
Existem cinco amlias de vrus de ssDNA (Inoviridae,Microviridae, Geminiviridae, Circoviridae, Parvoviridae). Comoexemplo de vrus de DNA ta simples, existem os bacteriagosphiX174 e o vrus AAV Adenoassociated virus. Seus genomas
variam de 1,7 kb a 8,5 kb e podem inectar bactrias, micoplasmas,spiroplasmas, plantas, invertebrados e vertebrados.
Durante a ineco, a maioria dos vrus dsDNA de vertebradosestimula a replicao do DNA da clula hospedeira, ou, pelo menos,
os estgios iniciais de replicao do DNA, para preparar um ambienteadequado para a replicao do seu prprio DNA. Esse ambienteavorvel inclui a presena de atores celulares requeridos para areplicao do DNA, assim como, aumento celular da quantidade de
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
23/111
22 Estrutra e evoluo dos genomas
substrados requeridos para a sntese de DNA. Alm disso, algunsvrus causam prolierao celular, ao menos no incio da ineco.Por isso, muitos vrus so conhecidos como causadores de tumoresem humanos e em outros animais.
Vrus de RNA fta simples positiva
Os vrus de RNA ta simples positiva [ssRNA(+)] compreendemum grupo extenso ormado por muitas amlias virais. Entre esses
vrus, esto os causadores de diversas doenas em humanos comoa encealite, a hepatite, a poliartrite, a ebreamarela, a dengue, apoliomielite e a gripe. Existem sete amlias de vrus ssRNA(+)que inectam humanos, dos quais alguns tambm inectam outros
vertebrados, causando importantes patogenias em animais domsticos. A maioria dos vrus que inectam plantas possui genoma comssRNA(+) e classicada em nove amlias e alguns gneros nodenidos. Outras amlias de vrus ssRNA(+) incluem duas amliasque inectam bactrias.
O genoma dos vrus ssRNA(+) contm Open Read Frames ORFse codica diversas classes de protenas como helicase, proteasepapanalike e RNA polimerase. Um exemplo de organizao ge
nmica dos vrus ssRNA(+) pode ser obtido por meio da anlise demembros da amlia Picornaviridae. O genoma dessa amlia viralcontm uma nica molcula de RNA de cerca de 7.5 kb que possuiuma ORF que traduzida em uma nica e longa poliprotena. Essapoliprotena clivada por uma ou mais proteinases codicadas pelo
vrus ormando 25 dierentes polipeptdeos.
Vrus de RNA fta simples negativa
Sete amlias de vrus possuem seus genomas na orma deRNA ita simples negativa [ssRNA()] e provocam srias epidemias em humanos como raiva, encealite, ineces do tratorespiratrio e ebre hemorrgica. Vrus pertencentes s amlias
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
24/111
23Uma viso geral dos genomas: de vrus a humanos
Paramyxoviridae, Rhabdoviridae, Filoviridae e Bornaviridae possuem seus genomas na orma de RNA no segmentados e organizados de orma similar. Essas amlias so agrupadas na ordemMononegavirales. As outras trs amlias de vrus ssRNA(),
que incluemArenaviridae, Bunyaviridae e Orthhomyxoviridae, possuem genomas segmentados com dois, trs e seis a oito segmentos,respectivamente. Independentemente de o genoma ser segmentado ou no, os vrus ssRNA() possuem um conjunto similar degenes. Nos vrus da ordemMononegavirales, a ordem dos genesest conservada em todos os membros da amlia. Nos vrus comgenomas segmentados, os genes podem ser ordenados por meiodo alinhamento dos segmentos.
Para todos os vrus ssRNA, o primeiro evento na ineco asntese de RNAm a partir do genoma pela RNA polimerase presenteno nucleocapsdeo, uma vez que essa polimerase necessria paraa produo do RNAm e as protenas traduzidas requeridas para areplicao do genoma, o genoma nu dos vrus ssRNA(), no soinecciosos. Mltiplos RNAs mensageiros so produzidos dos genomas ssRNA e a maioria dos RNAm traduzida em um nicopolipeptdeo. No entanto, alguns poucos genes produzem RNAs
mensageiros que so traduzidos em mais de um produto. Produtosmltiplos podem ser produzidos com base em um mesmo gene pormeio do uso de traduo alternativa dos cdons da iniciao, durantea traduo de um RNAm. Ao contrrio dos vrus ssRNA(+), os vrusssRNA() no produzem poliprotenas que requerem processamentopor proteases codicadas pelo prprio vrus. A replicao do genomassRNA() requer a produo de uma cpia complementar do genoma,chamada de antigenoma ou RNA vruscomplementar (vcRNA). Osgenomas de todos os vrus ssRNA possuem sequncias terminaisinvertidas que podem ter papel na circularizao do genoma dealguns desses vrus. A circularizao do genoma pode ser requeridapara a replicao do genoma ou a mesma para a sntese de RNAm.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
25/111
24 Estrutra e evoluo dos genomas
Vrus de RNA fta dupla
A maioria dos vrus contendo RNA ta dupla (dsRNA) pertence amlia Reoviridae e possue 10, 11 ou 12 segmentos de dsRNAno seu genoma, tatalizando 16 kb a 27 kb. Esse grupo de vrus
inecta um amplo espectro de organismos incluindo vertebrados,invertebrados, plantas e ungos. Vrios deles vrus so importantesagentes patognicos em humanos. A amlia Reoviridae possui 12gneros, dos quais o Orthoreovirus bastante estudado, j que inecta muitas espcies de mameros, incluindo humanos. O genomados Orthoreovirus consiste de dez segmentos de dsRNA que variade tamanho de 1,2 kb a 3,9 kb e somam 23.5 kb. Os dez segmentosso agrupados em trs classes chamadas L para grande, M para
mdio e S para pequeno, e so responsveis pela produo de 11ou 12 protenas distintas.
Vrus de transcrio reversa
Duas amlias de vrus animais utilizam transcriptase reversa(R) na replicao do seu genoma: Retroviridae e Hepadnaviridae.Alm disso, dois gneros de vrus de plantas, com ciclos de vida si
milares amlia Hepadnaviridae tambm utilizam R. Nesses vrus,a inormao gentica no genoma alterna entre o estado de RNA eDNA. A R, codicada pelo genoma viral, converte o genoma deRNA dos retrovrus, ou uma cpia de RNA do genoma de DNA doshepadnavrus, em DNA duplata. No ncleo da clula inectada, aRNA polimerase celular transcreve o DNA do genoma do hepadna
vrus ou a cpia de DNA do retrovrus produzindo RNA a ser transcrito pela R. Os hepadnavrus e os vrus de plantas transcrevem,
reversamente, o RNA em DNA durante o empacotamento. Dessaorma, a replicao do genoma dos retrovrus ocorre no sentidoRNADNARNA, enquanto a replicao do genoma dos hepadnavrus ocorre no sentido DNARNADNA. Uma caractersticainteressante da transcrio reversa a destruio do molde de RNA
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
26/111
25Uma viso geral dos genomas: de vrus a humanos
no processo de converso para DNA. A R possui, associada a ela,uma atividade RNase H que degrada a ta de RNA de uma molculahbrida RNADNA. Essa atividade essencial para a produo deuma cpia de DNA duplata a partir do RNA viral pela R.
Particularmente no que se reere aos retrovrus, aps a ineco,a cpia de dsDNA integrada no cromossomo da clula hospedeira e passa a ser chamada de provrus. Somente o DNA integrado estvel e e ecientemente transcrito pela maquinaria da clulahospedeira, sendo a integrao requerida para produzir a ineco.Entretanto, durante a ineco de hepadnavrus, o DNA no integrado no genoma hospedeiro. Ao contrrio disso, o DNA mantidono ncleo como epissomos noreplicativos estveis e so eciente
mente transcritos pela maquinaria da clula hospedeira.Supese que retrovrus tenham evoludo pela aquisio de genes, lhes permitindo deixarem a clula e se tornarem inecciosos(por exemplo, genes que cocam as protenas que ormam o envelope). possvel, tambm, que eventos contrrios tenham ocorrido,em que retrovrus deram origem aos retrotransposons.
Genoma bacteriano
radicionalmente, a terminologia bactria tem sido utilizadacomo reerncia a procariontes de orma geral. No entanto, recentemente, tornase claro que os procariontes compreendem dois grupos distintos, denominados de Arqueobactria e Eubactria, quedivergiram muito cedo na histria evolutiva do planeta. Em nvelmolecular, as arqueobactrias so mais parecidas com os eucariotos,apresentando uma maquinaria de replicaao, transcrio e traduo
semelhante.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
27/111
26 Estrutra e evoluo dos genomas
Estrutura do genoma bacteriano
Acreditase que as bactrias mantenham caractersticas das primeiras ormas de vida que existiram na terra e que representem oshabitantes mais antigos do planeta. As dimenses micromtricas da
clula bacteriana ornecem uma congurao estvel para o metabolismo celular e replicao do DNA. Alm disso, sua habilidade decrescer e se dividir sob uma ampla diversidade de condies ambientais revelam sua capacidade de adaptarse e alterar a biosera.
A principal caracterstica que dierencia as clulas eucariticasdas clulas procariontes diz respeito presena de um envelope ouenvoltrio que delimita o contedo de DNA no ncleo das clulaseucariticas, que est ausente nos procariontes, e organelas mem
branosas. Alm disso, as clulas procariontes so simples e pequenase vivem, em sua maior parte, como indivduos unicelulares. Essasclulas so protegidas por uma parede celular que reveste externamente a membrana plasmtica, que, por sua vez, delimita um compartimento citoplasmtico nico contendo DNA, RNA, protenas emuitas outras molculas vitais.
A maioria dos genomas bacterianos consiste de uma nica molcula circular de DNA, embora molculas lineares de DNA tenham
sido encontradas em algumas espcies comoAgrobacterium tumefa-ciens, Rhodobacter capsulatus, Brucella melitensis e Rhizobium spp.Nos cromossomos bacterianos circulares, o DNA no existe emum crculo aberto relaxado. Os 3 a 4 milhes de pares de bases doDNA encontrados em um genoma bacteriano tpico equivale a cercade 1.000 vezes o tamanho da bactria. O DNA bacteriano encontrase extremamente compactado, por meio da ormao de complexoscom vrias protenas, no est ligado a protenas histonas como o
DNA eucaritico (discutido mais adiante nesta obra). Na microscopia eletrnica, o DNA bacteriano requentemente apresentasecomo um aglomerado distinto, o nucleoide, que connado a umaregio denida do citoplasma. Se uma bactria rompida suavemente, seu DNA se espalha em uma srie de alas torcidas. As alas
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
28/111
27Uma viso geral dos genomas: de vrus a humanos
so presas umas s outras por protenas. Alm do DNA do nucleoide, muitas bactrias possuem DNA adicional sob a orma de pequenas molculas circulares chamadas plasmdeos, que se replicamindependentemente do cromossomo.
Evoluo e dinmica do genoma bacteriano
O genoma bacteriano possui capacidade signicativa de sorermudanas, embora se mantenha relativamente constante. Essesestados opostos ornecem mecanismos essenciais para algumasalteraes e tambm para a manuteno de certa constncia nogenoma bacteriano. O tamanho do genoma bacteriano, dentro deum gnero, permanece praticamente constante, com potencial para
pequenas mudanas na ordem dos genes. No entanto, uma ormadas clulas bacterianas para alterar o tamanho dos seus genomas perder ou adquirir um ou mais plasmdeos. Os genomas bacterianos podem variar de 1 a 9 milhes de pares de bases (abela 1).Essa amplitude por causa da diversidade evolutiva das dierentesespcies de bactrias. Os genomas de Escherichiacoli e Salmonellatyphimurium (ambos microorganismos Gramnegativos) possuemcerca de 4 milhes de pares de bases. Isso equivalente ao peso
molecular de 3 x 109 Daltons e comprimento de cerca de 1,5 mm.Os cromossomos de E.coli e S. typhimurium, tambm, possuempropriedades comuns, uma molcula nica, contnua, empacotadae helicoidizada negativamente, permitindo que sua estrutura nucleotdica orme curvaturas em sequncias especcas de DNA.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
29/111
28 Estrutra e evoluo dos genomas
Tabela 1. Espcies de bactrias e caractersticas dos seus genomassequenciados.
EspciesTamanho do
genoma em Mb
Nmero
de genes
Bactria
Mycoplasma genitalium 0,58 468
Mycoplasma pneumoniae 0,82 687
Rickettsia prowazekii 1,11 834
Treponema pallidum 1,14 1.041
Aquiex aeolicus 1,55 1.544
Helicobacter pylori 1,67 1.590
Methanobacterium thermoautotrophicum 1,75 1.013
Haemophilus infuenzae 1,83 1.740Thermotoga maritima 1,87 1.877
Synechocystis sp 3,57 3.168
Bacillus subtilis 4,21 4.099
Mycobacterium tuberculosis 4,45 4.402
Escherichia coli 4,64 4.289
Myxococcus xanthus 9,20 7.380
Arqueobactrias
Methanococcus jannaschii 1,66 1.750
Archaeoglobus ulgidus 2,17 2.493
Nanoarchaeum equitans 0,49 552
Fonte: www.ncbi.nlm.nih.gov
Diversos trabalhos sobre evoluo e tamanho do genoma bacteriano tm mostrado que o tamanho do genoma no est distribudonas mdias aritmticas de 3.812 kb para as bactrias Gramnegativase 3.115 kb para as bactrias Grampositivas. Outro aspecto evidente
que o tamanho do genoma pode variar grandemente entre dierentes cepas (LAWRENCE; HENDRICKSON, 2005). Isso ocorre,por exemplo, com Pseudomonas aeruginosa, cujos tamanhos dosgenomas podem variar de 4.100 kb a 5.400 kb, 5.460 kb a 5.900 kb ede 2.200 kb a 2.800 kb, dependendo da cepa analisada REVORS,
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
30/111
29Uma viso geral dos genomas: de vrus a humanos
1996. Adicionalmente, dierenas na mdia do tamanho dos genomas podem variar dependendo se orem utilizados tamanhos de genomas Gramnegativos ou Grampositivos nos clculos e a presenaou ausncia de plasmdios, especialmente megaplasmdios como
ocorrem em Rhizobium spp. Bactrias relacionadas possuem tamanhos similares do seu genoma com pequenas variaes no contedode G + C guanina + citosina em dierentes partes do genoma. Emadio, as bactrias apresentam uma ampla variao do contedo G+ C de 23 % a 72 %.
possvel que bactrias com genomas grandes sejam resultado da duplicao do tamanho do cromossomo durante a evoluo.Adicionalmente, a maior parte dos cromossomos bacterianos tem
cado estvel durante milhes a bilhes de anos de evoluo. Asbactrias possuem sequncias de DNA que, normalmente, no soexpressas, mas esto sujeitas a eeitos mutacionais que podem tornlas uncionais. Os plasmdeos representam umpoolsignicantede diversidade de inormao gentica. Os plasmdeos variam emtamanho de 1 kb a 400 kb, dos quais os de maior tamanho podemrepresentar 10 % ou mais do genoma da bactria, dependendodo tamanho do cromossomo da bactria hospedeira. Por sua vez,
a ocorrncia de plasmdeos pode variar em espcies particulares.Populaes naturais de Pseudomonas contm plasmdeos de tamanhos diversos o que ajuda na determinao de entipos similaresou dierentes. Os plasmdeos promovem transerncia de inormao gentica entre bactrias pertencentes a uma mesma unidadetaxonmica ou mesmo para bactrias pertencentes a dierentesgrupos. Essa engenharia gentica in vivo, promovida pelas bactrias, tem permitido mudanas acentuadas no tamanho do genoma.Outro aspecto signicativo o dierente nmero de cpias dos plasmdeos que podem existir nas bactrias.
As clulas bacterianas mantm uma constncia relativa do seugenoma ao mesmo tempo em que sorem mudanas por mecanismos de recombinao gentica, adquirindo e perdendo plasmdeos
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
31/111
30 Estrutra e evoluo dos genomas
e transposons (material gentico capaz de promover sua mobilizao dentro do genoma e realizando transduo e deleo/inserode DNA (DOBRIND; HACKER, 2001). Esses mecanismos originam ormas variantes e uma diversidade acentuada nas populaes
de bactrias. Exposies a condies severas de estresse levam a delees e amplicaes contguas, conhecidas por tandem, muito comuns nos genomas bacterianos. A alta complexidade genmica dasbactrias de vida livre, em comparao complexidade genmicareduzida nas bactrias parasitas intracelulares, sugere que o contedo genmico reete o estilo de vida das bactrias, como resultado deprocessos de otimizao genmica (DOBRIND; HACKER, 2001).
A anlise dos genomas sequenciados de bactrias mostrou que
quase todo seu DNA (85 % a 90 %) codica para RNA estruturaisou protenas. Dessa orma, o tamanho do genoma bacteriano proporcional ao nmero de genes. Embora no se saiba a uno detodos esses genes, cerca de 60 % deles apresentam homologia entreas dierentes espcies. Esses genes esto envolvidos com metabolismo, estrutura celular, transporte e regulao da expresso gnica,mecanismos esses essenciais na estrutura e uno bsica da clula.O nmero de genes pode variar de 500 a 1.200, entre as bactrias
parasitas intracelulares obrigatrias, 1.500 a 7.500, entre as bactriasde vida livre, e 1.500 a 2.700 entre as arqueobactrias abela 1.
Organizao dos genes bacterianos
Nas bactrias, existe uma equivalncia exata entre um trecho especco de DNA de um gene e o nmero de aminocidos na protena codicada por esse gene. De acordo com o cdigo gentico, trsnucleotdeos do DNA gnico so necessrios para codicar cada
aminocido do polipeptdeo da protena. Dessa orma, um genebacteriano consiste de uma sequncia de DNA que transcrita emuma molcula de RNA (RNA mensageiro RNAm) que ser traduzida na sequncia de aminocidos de um polipeptdeo (Fig. 2).
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
32/111
31Uma viso geral dos genomas: de vrus a humanos
Os genes bacterianos esto requentemente organizados em blocosdenominados de clusters que incluem genes que codicam protenascujas unes esto relacionadas. Isso ocorre, por exemplo, com osgenes codicadores de enzimas que participam de uma via meta
blica especca. Esses clusters gnicos representam uma unidadetranscricional nica, operon, responsvel pela sntese de um RNAmpolicistrnico, que codicar as dierentes protenas de unes relacionadas LEWIN, 2004.
DNA
RNAmTranscrio
Traduo
Protena
Procarionte Eucarionte
Ncleo
Citoplasma
DNA
AAAAAA
Exportao
Traduo
Protena
AAAAA
AAAAA
Processamento do RNA
RNAmprimrio
Sequncialder
Transcrio
- Adio de sequncia lider 5- Adio de cauda poli-A
xon ntron
Fig. 2. Estrutura organizacional e uncional dos genes procariontese eucariontes.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
33/111
32 Estrutra e evoluo dos genomas
Genoma eucarionte
Ao contrrio dos procariontes, a presena de um ambiente individualizado representado pelo ncleo permite a compartimentali
zao de diversas unes gnicas nos eucariontes.No nal da dcada de 1970, oi descoberto que o RNAm dos
eucariontes e de seus vrus era menor que o DNA genmico doqual haviam sido transcritos (BERGER et al., 1977; CHOW et al.,1977). Os genomas eucariontes contm genes interrompidos queconsistem de sequncias alternadas denominadas de xons (que semantm no RNAm nal), interespaadas por sequncias denominadas de ntrons que so removidas do RNAm imaturo. Os genes
eucariticos so transcritos individualmente, cada qual produzindoum RNAm com inormao para apenas uma cadeia polipeptdica(RNAm monocistrnico). Existe apenas uma exceo geral a essaregra: no genoma do nematdeo C. elegans, ~15 % dos genes estoorganizadas em unidades policistrnicas (um RNAm que codica
vrias cadeias polipeptdicas.Independente do tamanho do genoma, os procariontes em geral
apresentam uma densidade mdia de 900 genes por Mb de DNA
genmico, enquanto o genoma dos mameros apresenta uma densidade de 11 genes por Mb (PAHY, 2003). Essas caractersticasrepresentam consequncias organizacionais da presena de genesinterrompidos e de grande quantidade de sequncias de DNA nocodicadores DNAs repetitivos no genoma dos eucariontes.
A expresso dos genes interrompidos requer um passo adicional que no ocorre nos genes no interrompidos dos procariontes.O RNAm ormado representa uma cpia exata da sequncia gen
mica e apenas um precursor utilizado para a sntese da protena.Primeiramente, os ntrons so removidos do transcrito primrio,produzindo uma molcula de RNA composta apenas de uma sriede xons. Alm dessa modicao denominada de processamento,um grupo metilguanosina adicionado extremidade 5 da mo
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
34/111
33Uma viso geral dos genomas: de vrus a humanos
lcula e uma cauda de aproximadamente 150 a 200 adenosinas A adicionada na extremidade 3 do RNAm Fig. 2. A proporo degenes interrompidos baixa em ungos e aumenta consideravelmente nos eucariontes mais complexos. Em Saccharomices cerevisiae, a
grande maioria dos genes (> 96 %) no interrompida. No existemgenes em S. cerevisiae com mais de 4 xons. Em insetos e mameros,a situao inversa: poucos genes apresentam sequncias codicadoras no interrompidas (6 % em mameros). Aproximadamente50 % dos genes de mameros possuem mais de 10 ntrons. Umaconsequncia desse padro de organizao reete no tamanho dosgenes. A mdia de tamanho de um gene de ungo de 1,4 kb e pouqussimos genes so maiores do que 5 kb.
Grande parte dos genes dos organismos est presente em mais deuma cpia, o que az com que o nmero de dierentes tipos de genesseja menor do que o nmero total de genes. A presena de genesduplicados extremamente comum nos eucariontes e representaum aspecto importante para a evoluo do genoma (discutido noitem Duplicao Gnica: a maior ora da evoluo, nesta obra). Aduplicao gnica permite que as novas cpias do gene assumamunes mais especializadas ou mesmo possibilita a origem de no
vos genes com unes totalmente distintas daquelas dos genes deorigem. A duplicao gnica permitiu a origem de novos genes quepassaram a dividir as unes celulares, permitindo, assim, um ganho de complexidade organizacional das clulas, tecidos e organismos. Em bactrias, a maior parte dos genes est presente na ormade cpia nica, enquanto, nos eucariontes superiores, a maioria dosgenes est organizada em amlias com um grande nmero de cpiasabela 2.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
35/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
36/111
35Uma viso geral dos genomas: de vrus a humanos
lmeros dos cromossomos, enquanto os DNAs repetitivos dispersosso encontrados como unidades isoladas ou agrupamentos distribudos ao longo do genoma. Embora extensivamente estudados nasltimas dcadas, as oras moleculares que governam a evoluo dos
DNAs repetitivos no genoma so ainda muito discutidas (Fig. 3).GENOMA
cloroplasto
codificadorcodificador
xons transposons
no-codificador
sequnciassimples
sequnciasrepetitiva
mitocondrial
no-codificador
pseudogenes ntrons DNA extragnico minissatlite microssatlitesatlite
nuclear
dispersastandemfamlias gnicas comgrande n de cpias
citoplasmtico
Fig. 3. Organizao do genoma dos eucariontes.
O genoma dos eucariontes unicelulares apresenta a mesma escala de tamanho dos maiores genomas de bactrias (abela 3). Oseucariontes multicelulares apresentam um nmero maior de genes,mas no existe uma correlao exata com as variaes no tamanhodos genomas. Os ungos S. cerevisiae e S. pombe possuem genomas de 13,4 Mb e 12,5 Mb, com aproximadamente 6.000 e 5.000genes, respectivamente. O genoma do nematdeo C. elegans possui~18.500 genes e 97 Mb. O genoma da mosca de rutas Drosophila
melanogasterpossui um genoma maior 165 Mb do que C. elegans,mas um nmero menor de genes (13.600). A razo pela qual a moscaderutas, organismo muito mais complexo, possuir apenas 70 %do nmero de genes do nematdeo no est bem compreendida.Isso mostra uma correlao entre o nmero de genes e a complexi
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
37/111
36 Estrutra e evoluo dos genomas
dade dos organismos. A plantaA. thaliana possui cerca de 25.000genes e um tamanho de genoma intermedirio entre o nematdeo ea mosca das rutas. Mostrando tambm uma tendncia das plantaspossurem um nmero maior de genes, provavelmente por causa
dos eventos de duplicaes genmicas ancestrais mais comuns nessegrupo do que entre os animais.
Tabela 3. Espcies eucariontes e caractersticas dos seus genomassequenciados.
EspciesTamanho do
genoma em Mb
Nmero
de genes
Plasmodium alciparum 22,9 5.268
Sacharomyces cerevisiae 13,5 6.034Sacharomyces pombe 12,5 4.929
Caenorhabditis elegans 97 18.424
Ciona intestinalis 160 16.000
Drosophila melanogaster 165 13.601
Anopheles gambiae 278 13.683
Arabidopsis thaliana 119 25.498
Rattus norvegicus 2.800 30.000
Takiugu rubripes 400 30.000Homo sapiens 3.000 30.000
Fonte: www.ncbi.nlm.nih.gov
Um exemplo bastante interessante de complexidade e diversidade organizacional de genomas ocorre no peixe baiacu Takiugu ru-bripes, que possui o menor genoma dos vertebrados, com aproximadamente 390 Mb. Embora extremamente compacto, o genoma dessaespcie apresenta o mesmo nmero de genes quando comparado
com o genoma humano, que quase oito vezes maior (abela 3).O sequenciamento do genoma do baiacu mostrou uma alta densidade gnica e genes com ntrons bastante reduzidos em tamanhoquando comparados com humanos. Enquanto o genoma humano
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
38/111
37Uma viso geral dos genomas: de vrus a humanos
possui apenas 3 % de sequncias codicadoras de protenas, o genoma do baiacu possui 17 %.
Anlises dos genomas dos baiacus Takifugu rubripes e Tetraodonnigroviridis mostraram ainda uma quantidade reduzida de sequn
cias repetitivas de DNA do tipo retrotransposons, quando comparados com humanos e camundongos. No entanto, esses peixes apresentam uma alta diversidade de classes de elementos transponveisno encontrada nos mameros. Essa diversidade de retrotransposons oi tambm observada no peixe Danio rerio (paulistinha) e nooi perdida aps a compactao do genoma nos baiacus (VOLFFet al., 2003. Acreditase que a alta diversidade de sequncias repetitivas de DNA presente nos peixes tenha representado um papel
signicativo na radiao das espcies, o que levou a alta diversidadede espcies presentes neste grupo.
Genoma das organelas
Genoma dos cloroplastos e mitocndrias
Os cloroplastos e mitocndias so organelas celulares portadoras
de material gentico prprio. Acreditase que tenham se originado nos endossimbiontes ancestrais e que evoluram em organelas.Os cloroplastos provavelmente se originaram de endossimbiontesdo grupo das cianobactrias, enquanto as mitocndrias, de parentes das alaprotobactrias, grupo das riquetsias e semelhantesEMELYANOV, 2001, 2003; GRAY, 2001; BARBROOK et al., 2006,KUROIWA, et al., 2006; KHACHANE et al., 2007.
Em virtude das suas origens, o material gentico dessas organe
las normalmente composto por um nico cromossomo circularcom replicao semelhante aos seus ancestrais: do tipo anis FtsZMIYAGISHIMA, 2006 no caso dos cloroplastos, e do tipo MD nocaso das mitocndrias KUROIWA et al., 2006.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
39/111
38 Estrutra e evoluo dos genomas
Nas ltimas duas dcadas, muitos genomas de mitocndrias ecloroplastos oram sequenciados e analisados em termos de estrutura, regies nocodicadoras, presena de intros, contedo de genes, RNA ribossomais RNAr e contedo de RNA transportadores
(EMELYANOV, 2001; 2003; GRAY, 2001; KHACHANE et al., 2007).Desses estudos, observouse que os genomas mitocondriais variam signicativamente no tamanho e na organizao estrutural,principalmente em relao extenso das regies no codantese presena de ntrons (EMELYANOV, 2001; 2003; GRAY, 2001;KHACHANE et al., 2007. Por exemplo, os genomas mitocondriaisde angiospermas so os maiores e mais complexos quando comparados com as demais mitocndrias. Contudo, o contedo gnico das
mitocndrias e dos cloroplastos parece no variar, signicativamente, nas espcies analisadas BARBROOK et al., 2006.Nos cloroplastos, a estrutura e contedo gnico so altamente
conservados, principalmente nos das plantas superiores. J os plastdeos das algas so mais variveis e contm uma srie de genes emcpia nica que esto ausentes nos cloroplastos das plantas superiores. Os genomas dos plastdeos codicam protenas envolvidasna transcrio e traduo, alm daquelas responsveis pelo aparato
otossinttico BARBROOK et al., 2006.Em termos evolutivos, vericase uma ntida diminuio notamanho e complexidade dos genomas de mitocndrias e cloroplastos em relao aos seus provveis ancestrais GRAY et al., 2001;BARBROOK et al., 2006; KHACHANE et al., 2007. Alm da reduo no tamanho dos genomas, observase tambm uma reduo nospercentuais de C + G nesses genomas (KHACHANE et al., 2007).Observase que muitos genes oram transeridos das organelas parao ncleo dos hospedeiros, ou mesmo excludos do genoma GRAYet al., 2001; BARBROOK et al., 2006; KHACHANE et al., 2007). Porexemplo, os genes relacionados diviso dos cloroplastos e mitocndria oram transeridos para o ncleo da clula (MIYAGISHIMA,2006; KUROIWA, et al., 2006). O gene FtsZ oi duplicado e mo
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
40/111
39Uma viso geral dos genomas: de vrus a humanos
dicado, surgindo uma nova amlia de protenas envolvidas naregulao da diviso cloroplastidial (MIYAGISHIMA, 2006).
Uma caracterstica dos genomas mitocondriais de tripanossomatdeos a presena de genes que realizam modicaes nos RNAm
mitocondriais num processo chamado de edio. Esse mecanismo,detalhado no tpico seguinte, gera variabilidade nos transcritos pelasubstituio de bases, em geral, C para U e, em menor requncia, deU para C, com o auxlio de RNA guias (RNAg) e enzimas especcas. At recentemente, acreditavase que a edio osse um mecanismo restrito a essa amlia, contudo identicaramse, emArabidosisthaliana,aproximadamente 450 genes de enzimas participantes doprocesso, despertanto a ateno dos pesquisadores para o assunto
SHIKANAI, 2006.
Genoma mitocondrial de tripanossomatdeos
O cinetoplasto uma mitocndria dos protozorios da amliakinetoplastidae. Est presente em cpia nica e contm o DNA mitocondrial do cinetoplasto kDNA. O kDNA representa 10 % a 25 %do DNA total dos kinetoplastidea (EIXEIRA et al., 2006) e estpeculiarmente arranjado, ormando uma estrutura complexa, com
posta de pequenos segmentos de DNA circular catenados minicrculos) e de segmentos crculares maiores (maxicrculos) (SHAPIRO;ENGLUND, 1995.
Os maxicrculos esto presentes na organela em nmero de 25 a100, conorme o tripanossomatdeo. Em termos de sequncia de bases do DNA, observase que cada molcula de maxicrculo apresenta um alto grau de homogeneidade entre si e carregam inormaespara a biognese mitocondrial. Os genes presentes nessas molculas,
dierentemente de outros eucariotos, codicam RNA mensageirosque apresentam discrepncias nas ases de leitura, quando comparados s sequncias das suas protenas correspondentes, sugerindoparticipao de mecanismos de processamentos pstranscricio
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
41/111
40 Estrutra e evoluo dos genomas
nais caractersticos para se tornarem ativos (BENNE et al., 1986;FEAGIN et al., 1988.
Os minicrculos variam em quantidade e tamanho entre os cinetoplastideos. Por exemplo, em Trypanosoma brucei, essas molculas
variam entre 0,5 kb a 2,9 kb e esto presentes em mais de 10.000cpias por organela. No Trypanosoma cruzi, a grande maioria dosminicrculos est na aixa de tamanho entre 1,4 kb a 1,5 kb, e composta por quatro regies variveis semelhantes entre si, intercaladas, a cada 90 na molcula circular, por regies conservadas comaproximadamente 120 pb (SIMPSON, 1997). A heterogeneidadeentre minicrculos de tripanosomatdeos observada tanto interespcie, como intraespcie. Em T. brucei, estimase a existncia de
300 classes de minicrculos dierentes, enquanto, em Trypanosomaequiperdum, todos os minicrculos apresentam alta homogeneidadena sequncia de bases do DNA. J o T. cruzi mostra um grau intermedirio entre os dois citados RIOU; YO, 1977. Em decorrnciade sua alta complexidade, a caracterizao de esquizodemas permiteidenticar isolados do parasita (MOREL et al., 1980; SURM, 1989;SIMPSON, 1997.
O processo de edio oi descrito pela primeira vez por Blum
et al. 1990, em T. brucei. A princpio, acreditavase que os RNAgseram codiicados pelos maxicrculos, porm Sturm e Simpson1990 mostraram que provinham da transcrio dos minicrculos.Os RNAgs so normalmente pequenos, em torno de 50 a 70 bases,e possuem uma cauda de uridina (poliU) na extremidade 3OHda molcula.
O processo de edio promove modicaes nas sequncias debases dos RNA mensageiros imaturos (prRNAms), por meio dainsero, ou, em alguns casos, pela remoo de resduos uridinilados da molcula, como dito anteriormente. O mecanismo propostopara o processo prev a existncia de uma molcula de RNAg, comsequncia complementar em sua extremidade 5ostado ao prRNAm. Inicialmente, haveria o pareamento de 4 a 15 bases da regio
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
42/111
41Uma viso geral dos genomas: de vrus a humanos
complementar, que teria a nalidade de manter as tas unidas. Asbases no pareadas da extremidade 3OH do RNAg teriam a unode direcionar a edio (BLUM et al., 1990; HAJDUK et al., 1993;SEIWER, 1996. Vrios estudos sugerem que a estrutura secund
ria do prRNAm a ser editado j seria suciente para expor o stioonde ocorreria a clivagem para a insero dos resduos uridinilados PILLER et al., 1995a, 1995b, 1996. Porm, existem transcritoscuja exposio do stio mediada pelo RNAg (KABLE et al., 1996;SEIWER et al., 1996; ALDER; HAJDUK, 1997). Aps a clivagemdo prRNAm, as enzimas uridilil transerase e (ou) terminal uridilil exonuclease ariam, respectivamente, a adio ou remoo dasuridinas de acordo com as inormaes contidas no RNAg. Findo o
processo, as tas do RNA mensageiro maduro seriam religadas pelaRNA ligase mitocondrial CRUZREYES; SOLLNERWEBB, 1996;KABLE et al., 1996; SEIWER et al., 1996; ADLER; HAJDUK, 1997).
Por meio da edio, o RNAm pode receber cdigos de iniciaoe de terminao, podem ocorrer mudanas das ases de leitura ouaumento do RNAm, o que, supostamente, permitiria uma maiorvariabilidade de transcritos (ALDER; HAJDUK, 1994; SEIWER,1996). Esse processo est presente em vrios tripanosomatdeos:
Herpetomonas, Crithidia, Leishmania, e cinetoplastdeos correlacionados, tais como o ripanoplasma (SCO, 1995), e, inclusive,no T. cruzi VILA; SIMPSON, 1997.
Tertulien et al. (1991; 1994) identicaram transcritos obtidoscom base em um banco de DNA complementar (cDNA) de T. cruzi,que correspondiam a sequncias de minicrculos, mas, sem as caractersticas tpicas de um RNAg. A uno desses transcritos aindano est bem denida, e sugere que os minicrculos sejam potencialmente capazes de codicar pequenos peptdeos.
A quantidade de DNA, presente no cinetoplasto, varia em unodo estgio de desenvolvimento do parasita. Essa peculiaridade conhecida por descinetoplastidizao, e se caracteriza pela perda parcial ou total do kDNA (VICKERMAN; PRESON, 1976). O en
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
43/111
42 Estrutra e evoluo dos genomas
meno oi detectado, em condies naturais, nas ormas sanguneasdas espcies T. equiperdum T. evansi e T. brucei e recentemente nasormas sanguneas de T. cruzi. Mas pode ocorrer em consequnciaao tratamento com drogas, tais como brometo de etdio, acriavina,
diamidinas e compostos relacionados. Nesse caso, as drogas atuariam ao nvel da enzima topoisomerase II, essencial para o processode replicao do kDNA.
Em adio, Lee et al. (1992a, 1992b, 1993) relataram um novoenmeno conhecido como transcinetoplastidizao, em que variantes de Leishmania leishmania mexicana, resistentes a arseniato e tunicamicina, apresentaram uma alterao na sequncia dosmaxicrculos, bem como uma signicativa mudana na populao
de minicrculos. Durante o enmeno, classes, antes pouco representadas, passam a ser majoritrias, enquanto as inicialmente bemrepresentadas, minoritrias. So necessrias 15 geraes do parasitapara que o evento se complete e populaes intermedirias so observadas no decorrer do processo LEE et al., 1994. Embora no seconheam os mecanismos de regulao que levam a expanso ouperda de determinados kDNAs, acreditase que esse material gentico de extrema importncia na adaptao do parasita s dierentes
condies do meio ambiente.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
44/111
Os mecanismos de recombinao so undamentais para a gerao da variabilidade e diversidade gentica. Esses mecanismos po
dem ser agrupados genericamente em trs grandes categorias: (1)Recombinao homloga recombinao que ocorre com a participao de grandes regies de similaridade, normalmente entre cromtides irms de cromossomos homlogos; (2) recombinao stioespecca mediada por pequenas regies de identidade no localda recombinao; (3) recombinao nohomloga sem similaridade de sequncias no ponto da recombinao LEWIN, 2004.
Basicamente, as ezimas que participam desses processos identi
cam sequncias e (ou) estruturas caractersticas no DNA que, aoreconheclas, desencadeiam uma sequncia de eventos que culminam nos rearranjos do material gentico.
Grande parte das mutaes e aberraes cromossmicas decorreu das recombinaes stioespeccas e nohomlogas. Essas
Organizao Estruturale Instabilidade do
Material GenticoAna Maria Costa
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
45/111
44 Estrutra e evoluo dos genomas
ormas de recombinaes esto presentes na incorporao de DNAsexgenos no genoma incorporao de vrus, retrovrus, DNAs obtidos por transormao, elementos de transposio) e no reparo deestruturas consideradas anormais pela clula, como as quebras da
ta simples ou ta dupla do DNA, regies com pareamento de basesincorreto provenientes da recombinao homloga, estruturas dotipo ala, grampo, entre outras LEWIN, 2004.
Ao longo do tempo, os eventos recombinativos promovem modicaes signicativas no contedo e distribuio dos genes noscromossomos contribuindo para evoluo dos genomas (Fig. 4). NaFig. 5, est ilustrada a complexidade dos eventos de recombinaoque contriburam para a ormao dos cromossomosdeA. thaliana,
enmeno evidenciado aps o sequenciamento e anlise do genomadessa planta HE ARABIDOPSIS GENOME INIAIVE, 2000.Apesar do assunto ter recebido muita ateno nas ltimas d
cadas, ainda existem muitas lacunas do conhecimento para serempreenchidas por causa da complexidade do enmeno.
Como ser discutido adiante, atualmente observase que o ocoprincipal de grande parte das pesquisas no tema est voltado para aidenticao das enzimas participantes do processo. Acreditase que
o resultado da recombinao mudaria conorme o perl enzimticono momento do evento, e, de acordo com o contexto celular, poderia ocorrer perdas (deleo), ampliaes (duplicao ou inserode DNA da clula ou de outro organismo) ou rearranjos diversosnas tas de DNA (inverso ou translocao de segmentos dentro doprprio cromossomo.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
46/111
45Organizao estrutural e instabilidade do material gentico
Ancestral comum
Deleo
Inverso Variante 1a
Variante 1b
Expanso
Variante 2a
Variante 2bDeleo
Distanciamento
gentico
Fig. 4. Representao das mudanas na composio e na estruturado DNA de um cromossomo, ao longo do tempo, em consequnciade dierentes eventos recombinativos.
5Mb 10Mb 15Mb 20Mb 25Mb 30Mb
5Mb 10Mb 15Mb 20Mb 25Mb 30Mb
Fig. 5. Distribuio e arranjo das repeties de segmentos de DNA
no genoma deArabidospis thaliana
. As cores semelhantes, destacadas do cinza, mostram repeties de segmentos cromossmicos presentes na orma direta (trapzios) ou invertidas (cones). Em preto,observamse as regies centromricas de cada cromossomo (HEARABIDOPSIS GENOME INIIAIVE, 2000.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
47/111
46 Estrutra e evoluo dos genomas
Uma das questes mais intrigantes, que tem despertado a ateno da pesquisa, o que torna uma determinada regio genmicaalvo preerencial de modicaes na sequncia de DNA em relaoa outras. Regies que so constantemente associadas a eventos de
recombinao, ou que, quando clonadas, passam a ser denominadasde "instveis".Acreditase que alteraes na estrutura tipo B do DNA (dupla
hlice, invertida e complementar passo direito), como predita porWatson e Crick (1953), poderiam ser reconhecidas pelas enzimasdos complexos de recombinao e desencadearem o enmeno.
De concreto, vericase uma correlao direta entre os stios derecombinao e a alterao da estrutura local do DNA provocada
pela presena de elementos repetitivos e pela distribuio de basesnuma ordem peculiar. Alguns trabalhos mostram que a clonagemde determinadas repeties gera recombinao stioespecca. Essetema ser aproundado no tpico Instabilidade de sequncias.
Elementos repetitivos
Em consequncia do Projeto Genoma, sabese hoje que ape
nas 3 % do material gentico haplide de uma clula mamera composto por sequncias que codicam para cadeias polipeptdicas (exons), o restante compreende as chamadas regies nocodicadoras, onde esto distribudas as diversas repeties, de origem
viral ou noviral, agrupadas genericamente em satlites, minissatlites microssatlites, telmeros, sequncias repetitivas curtas, entreelas, Sines short interspersed elements, ALU e MIR, e longas, taiscomo Line (long interspersed elements), L1 e L2 LR (long terminal
repeats) (LEWIN, 1994; BERNARDI, 1995; KAZAZIAN; MORAN,1998, INERNAIONAL HUMAN GENOME SEQUENCINGCONSORIUM, 2001; KIM, et al., 2004; HAN et al., 2007). Nos grupos de sequncias repetitivas, curtas e longas, encontramse os ele
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
48/111
47Organizao estrutural e instabilidade do material gentico
mentos transponveis (elementos mveis), as sequncias interruptoras de genes (ntrons) e os provrus tanto de origem viral como retro
viral BERNARDI, 1995; FAWCE, et al., 2006; HAN et al., 2007.Os elementos mveis, curtos e longos, so agrupados em duas
categorias de acordo com a existncia ou no de um intermediriode RNA durante o processo de mobilidade no genoma. Na primeira categoria, esto as sequncias com capacidade de transposiodireta, tais como elementos transponveis de origem viral, sequncias IS, n, e muitos ntrons, que se mobilizam por mecanismosde recombinao nohomloga replicativa ou noreplicativa. Asegunda categoria compreende os elementos de origem retroviral etransposons que se locomovem via mecanismo de retrotransposio
(FINNEGAN, 1983; WEISS et al., 1985; VARMUS, 1988; LEWIN,2004). De acordo com a similaridade de sequncias os dierenteselementos mveis podem, ainda, ser agrupados em superamlias,amlias e subamlias dentro de cada categoria HAN et al., 2007.
A grande maioria das partculas mveis apresenta, em sua estrutura, as inormaes necessrias para promover a sua expanso, outranserncia de um ponto do genoma para outro. Contudo, algumas amlias necessitam da expresso de enzimas de outros elemen
tos mveis ativos para se transporem, como no caso dos Sines, quese movimentam por retrotransposio com o auxlio da maquinaria de outros retrotransposons HAN et al., 2007; FAWCE, et al.,2006; GU, et al., 2007.
Existe uma orte correlao entre as sequncias de bases dasrepeties que interrompem sequncias gnicas, os ntrons, e assequncias que compe o grupo dos elementos mveis no genoma. Essa semelhana levou a especulao de que os ntrons e os
elementos mveis poderiam estar evolutivamente correlacionadosLAMBOWIZ, 1989; CAVALIERSMIH, 1991; HICKEY, 1992.
As inseres de elementos mveis no genoma, dependendo danatureza do elemento repetitivo, podem alterar a expresso gnica
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
49/111
48 Estrutra e evoluo dos genomas
(DEININGER et al., 2003); se rico em regies CG, como no casodos elementos Alu, podem introduzir novas ilhas CpG (LANDERet al., 2001, gerar delees HAN et al., 2005, criar novos genes ouamlias gnicas XING et al., 2006.
As sequncias repetitivas semelhantes, mveis ou no mveis,podem estar arranjadas prximas umas das outras ormando estruturas simples ou complexas, genericamente classicadas quanto ssuas orientaes na ta de DNA. Desse modo, duas repeties prximas, estando na mesma orientao, ormam uma estrutura simplesdenominada de repetio direta. Igualmente, duas repeties comsequncias invertidas entre si, ou invertidas e complementares, soclassicadas no grupo das repeties invertidas, ou no grupo das pa
lindrmicas, respectivamente. Essas sequncias podem estar ligadasumas s outras, ormando estruturas complexas, tambm conhecidas por tandens. Estruturas simples ou complexas so encontradas tanto dentro, como ora de regies transcritas (LEWIN, 2004).
Conorme a organizao das repeties e da natureza da sequncia em termos de composio e distribuio das bases, o DNA podeassumir localmente estruturas dierentes das preditas por Watsone Crick (1953), ou seja, pode ormar estruturas dierentes das do
tipo B (dupla hlice invertida e complementar de passo direito) eormar ala, grampos, estruturas cruciormes, estruturas do tipo Z,curvas e dobramentos, estruturas triplas ou tipo H, qudruplas outetraplex (WANG et al., 2006; KMIEC et al., 1985; SEINMEZ,1986, LINIAL; SHLOMAI, 1987; KIYAMA; KIYAMA 1996;GABRIELIAN et al., 1996; GABRIELIAN; PONGOR, 1996;VLAHOVICEK; PONGOR, 2000; KIYAMA et al., 1999; WANG;VASQUEZ, 2004; KAUSHIK et al., 2007; COSA, 2008), que po
dem ser reconhecidas pelos mecanismos de recombinao celulare propiciar rearranjos diversos no material gentico demonstradasem dierentes tipos de estudos (LEACH; SAHL, 1983; WYMAN,et al., 1985; 1986; MEIMA, et al., 1997; SRADER; HOWELL, 1997;
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
50/111
49Organizao estrutural e instabilidade do material gentico
SONG et al., 2001; KOUPRINA et al., 2003; LAN; MUGUIRA,2005; GRINDLEY et al., 2006; DU et al., 2007; WELLS, 2007;COSA, 2008.
Estruturas repetidas invertidas e diretas no mveis so encon
tradas anqueando muitos elementos transponveis ativos e inativos. Os tamanhos das estruturas invertidas variam signicativamente de elemento para elemento, podendo apresentar de 9 pb a maisde 200 pb (LEWIN, 2004; DOAK et al., 1997; BENIO; WALBO,1997). As repeties diretas so resultantes da duplicao do stio deentrada da integrao. So sequncias normalmente pequenas entre3 a 12 bases. Acreditase que as enzimas envolvidas reconheam assequncias do stio de entrada e direcionem o evento de transposi
o, a exemplo do que acontece na integrao do ago (LEWIN,2004; BELFOR; PERLMANS, 1995; BENIO; WALBO, 1997).
No genoma, esto presentes milhares de estruturas que possuemcapacidade de transposio, porm a maioria encontrase inativa.Muitas inseres novas, com base em estruturas transgnicas, sosilenciadas pouco tempo depois de sua integrao. Acreditase queo silenciamento seja o resultado das discrepncias entre a composio de CG do elemento inserido e o ambiente do isochore receptor.
Observase tambm que elementos integrados em regies pobresem CG so mais requentemente inativados que os inseridos emregies mais ricas em CG BERNANRDI, 1995.
Como h uma coincidncia entre os stios inativos e o grau demetilao, vrios pesquisadores sugeriram que a metilao poderiaser responsvel pelo controle da transposio ao nvel de transcrio(BESOR; YCKO, 1996; YOLDER et al., 1997). ONeill et al. (1998)mostraram a associao entre a diminuio da metilao e ativao
de retroelementos, correlacionando o silenciamento estabilidadedo genoma.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
51/111
50 Estrutra e evoluo dos genomas
Elementos repetitivos mveis longos
Entre os elementos repetitivos longos de origem viral, os maisrequentes em mameros so os LR long terminal repeats e Lineslong interspersed elements).
Os LR caracterizamse por apresentarem longas regies repetidas nas extremidades de suas sequncias integradas, com tamanhoentre 250 pb a 1.400 pb, anqueadas pela duplicao de 4 a 6 basescorrespondentes ao stio de entrada no genoma. Esses elementos,durante o processo de mobilizao, so transcritos pela RNA polimerase II. A ta de RNAm gerada no apresenta cauda poliadenilada, e requentemente possui ntrons, que so removidos antes dea ta ser traduzida. De um modo geral, os retroelementos possuem
as inormaes necessrias para promover a sua retrotransposio(transcriptase reversa e (ou) integrase), mas, ao contrrio dos retrovrus, os genes do envelope viral esto ausentes, ou deectivos(LEWIN, 2004). Dentro desse grupo esto os elementos Ty (emlevedura), copia (em drosophila), IAP(em roedores) e THE1 (emhumanos LEWIN, 2004.
O segundo grupo de elementos mveis longos em mameroscompreende a amlia Line. Inicialmente, esses elementos oram
classicados no grupo dos retroelementos de origem noviral, emdecorrncia da presena de sequncias poliadeniladas terminais eausncia de LR. Entretanto, as anlises das ases abertas de leitura mostraram alta identidade com enzimas retrovirais responsveis pela retrotransposio (LEWIN, 2004). A estrutura dos Linecompreende duas ases abertas de leitura. A primeira codica umaprotena semelhante gag com stio de ligao com RNA e propriedade chapernica para cidos nucleicos (HOHJOH; SINGER,
1996; KOLOSHA; MARIN, 1997; MARIN; BUSHMAN, 2001;MARIN et al., 2005), e a segunda ase aberta, uma protena dotipo polimerase com atividade endodesoxirribonuclease (endonuclease e transcriptase reversa MAHIAS et al., 1991; FENG et al.,1996. As anlises in silico dos stios de integrao de Line sugerem
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
52/111
51Organizao estrutural e instabilidade do material gentico
a participao do mecanismo de reparo de duplata do DNA natransposio desses elementos ICHIYANAGI; OKADA, 2006.
ratase de uma amlia com pelo menos 11 classes (MALIK;EICKBUSH, 1999). Line de dierentes categorias oram encontra
dos em um grande nmero de genomas eucariotos ARKHIPOVA;MESELSON, 2000; compilado de RepBase em http://www.girinst.org/repbase/index.html.
Em mameros, o elemento Line1 o mais requente. Aproximadamente 17 % do genoma humano so compostos por esse tipo derepetio, o que corresponde a 100 mil cpias, variando entre 50 mila 100 mil cpias nos demais genomas (HWU, et al., 1986; SMIH,1996; HAN et al., 2007). Dessas, apenas 3.500 cpias possuem a
sequncia Line1 completa, das quais 95 % restantes encontramse truncadas na sua poro 5 osato ou rearranjados FANNING;SINGER, 1987; DOMBROSKI et al., 1993.
Em razo do grande nmero de cpias presentes no genoma, oselementos repetitivos so tidos como stios preerenciais para mediar recombinao homloga desigual FANNING, SINGER, 1987;BURWINKEL; KILIMANN, 1998.
Esses elementos no so completamente idnticos, variam em
tamanho podendo atingir mais de 7 kb, sendo o consenso na ordemde 6 kb. Muitos elementos Line1 completos acumularam cdigosde terminao da traduo em suas sequncias de DNA, o que impede a sntese das protenas responsveis pela sua locomoo, sendoraros os elementos capazes de se transpor a outros stios no genoma.Acreditase que apenas 20 a 40 elementos possam estar ativos no genoma humano SASSAMAN, 1997. Desses, pelo menos sete j oram clonados e apresentaram atividade de retrotransposio em clulas mameras, o que tem permitido ampliar as inormaes sobreo mecanismo de transposio desse elemento (MORAN et al., 1996;SASSAMAN et al., 1997; HOHJOH; SINGER, 1997; MIKI, 1998).
De acordo com Miki (1998), parece existir uma divergnciaevolucionria entre o elemento Line1 murino e o Line1 humano.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
53/111
52 Estrutra e evoluo dos genomas
Essas amlias apresentam identidade em torno de 60 %. O Line1murino compe a amlia IAP. O elemento Line1 murino anqueado por repeties diretas sugestivas do stio de entrada no genoma,enquanto o Line1 primata apresenta repeties do tipo CpG na
regio prxima a extremidade 5 osato. Na regio 5 ostato, queantecede a ase aberta de leitura 1, tambm denominada de ORF1(open reading frame) do elemento murino, dierentemente do humano, observamse repeties com aproximadamente 200 pb denominada de monmeros, que possui atividade promotora e ativadora datranscrio GOODIER et al., 2001.
Nos elementos Line1 completos, a extremidade 5 osato apresenta uma regio de aproximadamente 1 kb, contendo vrios cdi
gos sinalizadores para nal de traduo (stopcodons) em todasas ases de leituras (rames). Woodcock et al. (1996) mostraramque essa regio codica dois RNA pequenos, um de 305 nucleotdeos e outro de 275 nucleotdeos, cuja uno ainda desconhecida. Seguemse a essa regio duas ases abertas de leitura (ORF),a primeira, com 1kb (ORF 1) e a outra, de 4kb (ORF 2), intercaladas por uma pequena sequncia que no codica protena. A regio correspondente extremidade 3 OH no traduzida e possui
uma sequncia terminal rica em A (FANNING; SINGER, 1987;LANKINEN et al., 1996.; MCGLYNN et al., 2001.O mecanismo de transposio dos elementos Line1 ainda no
est esclarecido. Sabese que so transcritos pela RNA polimeraseII. Contudo, Kurose et al. (1995) mostraram a dependncia da regio promotora do Line1 humano pela RNA polimerase III, compossvel participao de atores associados a RNA polimerase II. AsORF codicam para protenas relacionadas a mobilidade do elemento (KOLOSHA; MARIN, 1997; HOHJOH; SINGER, 1997),das quais a primeira codica para uma protena tipo gag e segundacarrega inormaes para transcriptase reversa, endonuclease AP, euma possvel RNAe H, como nos demais elementos dessa amlia. Oproduto da ORF 2 tem localizao predominantemente citoplasm
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
54/111
53Organizao estrutural e instabilidade do material gentico
tica, contudo a perda da regio carboxiterminal direciona a protenapara o nuclolo GOODIER et al., 2004.
A gerao de uma nova cpia de Line1 no genoma requer a ruptura e o reparo da ta de DNA alvo. Acreditase que, semelhana
das retrotransposies de elementos LR R2Bm (LUAN et al., 1993;COS et al., 2001), a ruptura no stioalvo geraria uma extremidadelivre que atuaria como primer para a sntese da ta de DNA complementar ao RNA do elemento de transposio. No caso dos Line1,identicouse no genoma a sequncia alvo 5 /A 3 comoponto preerencial de integrao (GILBER et al., 2002; SYMERet al., 2002; COS et al., 2002; GILBER et al., 2005.
Farkash et al. (2006a e b), com base nas observaes in silico de
Zingler et al. (2005), que mostravam a existncia de pequenos trechos de identidade entre os stios de insero e as extremidades 5dos ragmentos de Line1 de tamanho menores, no encontrada nas
junes ragmentos maiores de Line1, postularam uma segunda viade transposio com participao de endonucleases do mecanismode reparo do DNA.
Inseres recentes de Line1 oram associadas a doenas tantoem murinos, como em humanos. A integrao da amlia IAP (Line
1 murino) oi identicada nas regies codicadoras dos genes cFos, em plasmocitomas de camundongos, na extremidade 5 osatodo gene cmyc, no gene Fu murino, e no gene reeler(AKAHARAet al., 1996; MIKI, 1998). Em humanos, oi descrita pela primeiravez por Kazazian et al. (1988), interrompendo e exon 14 do atorde coagulao VIII, e posteriormente vrias outras mutaes oramassociadas integrao de novo desse elemento MIKI, 1998.
Belgnaoui et al. (2006) demonstraram que a ativao de Line1na clula gera mltiplas quebras na duplata do DNA em clulastumorais, resultando em apoptose.
Segundo Bernardi (1995), os Line estariam localizados preerencialmente em regies ricas em A e com baixa concentrao gnica.Contrariamente, Ostertag e Kazazian (2005) sugerem que, apesar da
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
55/111
54 Estrutra e evoluo dos genomas
aparente aleatoriedade na distribuio desses elementos no genoma,inseres recentes tenderiam a ocorrer em regies prximas a genesque estariam sendo expressos. O enmeno seria evidente em culturas de clulas neuronais e in vivo, sendo possvel notar mudanas
nos padres de expresso gnica em uno da entrada do elemento.Babushok et al. (2006), por meio de estudos com murinos transgnicos, tambm demonstraram uma tendncia de direcionamento dasnovas inseres de Line1 para as regies intergnicas.
Fragmentos de Line1 degenerados esto presentes nas regiesestruturais silenciosas, regulatrias, e em regies transcritas demuitos genes, compondo principalmente ntrons. Esse elemento encontrado azendo parte da estrutura genmica do complexo de
histocompatibilidade principal (MHC) (emb X87344), cadeia dos receptores de lincitos gb L36092, atores de coagulao gbM22333 e gb M64554), receptores para interleucinas (emb X67285),atores do complemento, e genes para globina (gb UO1317), entre outros (KAZAZIAN et al.,1988; MIKI, 1998; KAZAZIAN;MORAN, 1998.
Elementos repetitivos mveis curtos
As principais caractersticas dos retroelementos no virais so:ausncia de LRs; transcrio via RNA polimerase II ou III; duplicaes de 7 pb a 21 pb nas extremidades; presena de poliadenilao na extremidade 3 OH; ausncia ou poucos ntrons (LEWIN,2004; BLINOV 1998). Considerados inicialmente como elementosestruturais sem uno, sabese hoje que muitos participam de stiosregulatrios, a exemplo das ilhas de CpG e stios recombinativos(CHRISMANN et al., 1991; CRAIG; BICKMORE, 1994; RUBIN
et al., 1994; BERNARDI, 1995; MIGHELL et al., 1997; GRAFF et al.,1997; BLINOV et al., 1998. Nesta categoria, encontramse os Sinesshort interspersed elements.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
56/111
55Organizao estrutural e instabilidade do material gentico
As sequncias repetitivas do tipo Sine movimentamse por retrotransposio com o auxlio de outros elementos mveis ativos,
j que no codicam as enzimas necessrias para a sua prpria mobilizao, e so transcritos por intermdio de um promotor interno
para RNA polimerase III MAHIAS et al., 1991; WALLACE et al.,1991; BELFOR; PERLMANS, 1995; FAWCE et al., 2006; GUet al., 2007.
Em geral, possuem tamanho entre 100 pb a 500 pb (YASUI et al.,2001; FAWCE et al., 2006; GU et al., 2007). Em termos evolutivos,os Sines contriburam signicativamente para a histria evolucionria da maioria das espcies eucariticas (FAWCE et al., 2006).Em vertebrados, compe duas superamlias CoreSine e V Sine
(KAZAZIAN et al., 2004, GILBER; LABUDA, 1999; OGIWARA,2002; FAWCE et al., 2006). Em plantas, sua distribuio maislimitada, sendo encontradas amlias de Sines do tipo AU (YASUIet al., 2001; FAWCE et al., 2006.
Entre os Sines, as sequncias do tipo Alu so as mais presentes no genoma primata. Esses elementos representam 5 % a 10 %do genoma primata o que corresponde a pelo menos 1 cpia acada 3 kb a 6 kb. Sua distribuio no randmica e normalmen
te so encontrados no genoma, prximos uns aos outros (HWUet al., 1986; MOYZIZ et al., 1989; PIMAN; SCHIMENI, 1998;BLINOV et al., 1998). Por exemplo, o gene Bat2 do lcus HLA classeII possui 42 repeties de Alu, o que corresponde a 1,9 repeties acada 1 kb MIGHELL et al., 1997.
O elemento Alu, em murinos, um monmero com aproximadamente 150 pb e conhecido como elemento B (B1 e B2).Acreditase que os monmeros tenham um ancestral comum, homlogo partcula 7SL de RNA nuclear. A estrutura dimrica exclusiva de primatas e estimase que tenha surgido a 65 milhes deanos (BLINOV et al., 1998), mas a orma monomrica tambm estpresente ZUCMANROSSI et al., 1997.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
57/111
56 Estrutra e evoluo dos genomas
A amlia Alu composta por vrias subamlias que apresentamidentidade da ordem de 70 % a 75 % (DEININGER et al., 1992).Descrevemse inseres antigas e recentes desse elemento, existindosubamlias espcieespeccas, a exemplo de alguns tipos de Alu
caractersticos de determinados grupos de primatas DEININGERet al., 1992; FAWCE et al., 2006.O Alu dimrico possui aproximadamente 280 pb, composto
por dois monmeros ligados por uma regio rica em A, sendo odireito 31 pb maior que o esquerdo. Apesar das dierenas estruturais entre a amlia B e Alu, ambos possuem dois stios promotores(A e B) para RNA polimerase III e cauda poli A (BLINOV, 1998).Recombinao homloga desigual entre elementos Alu requente
e no randmica, ocorrendo preerencialmente entre as regies A eB nos Alus dimricos KASS et al., 1995.No Alu primata, os stios de ligao polimerase esto no brao
esquerdo e os monmeros esto ligados por uma sequncia poli A(MIGHELL et al., 1997). Em elementos de origem recente, possvelobservar pequenas regies repetidas diretas nos ancos (WALLACEet al., 1991.
O conjunto das inormaes sugere que esses elementos tenham
origem retrotransponvel (MIGHELL et al., 1997; MIKI, 1998).Como esses elementos no possuem as enzimas necessrias parapromoverem sua prpria retrotransposio, contam com o auxlio de outros elementos ativos, tais como, Line1 MAHIAS et al.,1991, LANDER et al., 2001; DEWANNIEUX et al., 2003; HULMEet al., 2007). Desse mecanismo, sabese que a protena codicada pela ORF 2 dos elementos Line1 requerida no processo, e atransposio pode ser bloqueada pela protena APOBEC3G, umacitidina deaminase que inibe a ineco pelo vrus HIV, de ormaindependente da expresso da protena da ORF 1 do elemento Line1 HULME et al., 2007.
Cpias simples de Alu ou regies ricas em Alu so normalmenteencontradas em regies com altos contedos de C/G, em regies
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
58/111
57Organizao estrutural e instabilidade do material gentico
prximas a ilhas CpG, e anqueando genes (GRAFF et al., 1997),ntrons e espaos intergnicos, mas no oi demonstrada a presena,at o momento, em regies codicadoras de RNA (BLINOV et al.,1998). Existem controvrsias quanto aos motivos dessa distribui
o, se essas regies seriam stios preerenciais de integrao, ouse haveria uma seleo positiva para regies CG ou negativa paraas entradas em A/ (GROVER et al., 2003; GROVER et al., 2004;JURKA 2004; HACKENBERG et al., 2005; CORDAUX et al., 2006).Contudo, estudos com populaes antigas e recentes de Alu sugerem que a entrada desses elementos no genoma seria randmica emtermos de distribuio de C/G, havendo uma seleo positiva paraos elementos inseridos em regies ricas nessas bases (BELLE; EYRE
WALKER, 2002; CORDAUX et al., 2006; GU et al., 2007.A princpio acreditavase que a uno desses elementos osseapenas estrutural MIGHELL et al., 1997. Porm, vrios trabalhosindicam que os elementos Alu possam atuar na regulao da expresso gnica. Rubin et al. (1994) sugerem uncionalidade das sequncias Alu em virtude da variao no seu padro de metilaoem dierentes tecidos. Graf et al. (1997) propem a participao dassequncias Alu no processo de metilao de novo das regies CpG
prximas. Lander et al. (2001) mostram que os elementos Alu podem introduzir a ormao de novas ilhas CpG. Blinov et al. 1998,com base na potencialidade de os Alus ormarem estruturas triplex,sugerem que as sequncias Alu comporiam um cdigo espacial ormado pelas combinaes das dierentes repeties completas e truncadas, diretas e invertidas.
Instabilidade de sequncias
Repeties do tipo satlites
odos os organismos eucariotos possuem pequenas sequncias repetidas mltiplas vezes (AUZ; SCHLOERER, 1994).
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
59/111
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
60/111
59Organizao estrutural e instabilidade do material gentico
cao geraria a expanso das repeties na ta nascente (KOKOSKAet al., 1998; MARCADIER; PEARSON, 2003). Apesar de outras teorias serem plausveis, em comum a maioria teria uma etapa ondese ormam quebras na duplata do DNA por endonucleases do
reparo (MARCADIER; PEARSON, 2003; PEARSON et al., 2005).Vrias mutaes que aetam o reparo de estruturas secundriastm como consequncia a elevao da requncia de mutaes emsatlites. Em leveduras, a protena Msh2 juntamente com a Msh3ou Msh6 e MutL, homloga a Mlh1 e Pms1 corrigem a ormaode alas com at 14 nucleotdios. Alas maiores so corrigidas porum mecanismo de reparo no usual, que envolve os genes Msh2e Rad1 (KIRKPARICK; PEES, 1997). Aparentemente, outras
protenas, alm das que participam do reparo, esto envolvidasna estabilidade dessas regies. Mutaes no gene rad27 (FEN1de mameros), responsvel pela atividade 53 exonuclesica,atuam na remoo da regio ribonucleotdica dos ragmentos deOkaski e, na DNA polimerase (pol3-t), promovem aumento nainstabilidade de satlites (KOKOSKA et al., 1998). Em humanos,haveria a participao do complexo Mre11Rad50NBS1 no reparo dessas alas (PAUL; GELLER, 1999). Haveria, tambm, a
participao de outras enzimas especcas (CONSANINOUet al., 2001) e de helicases (KAMAHLOEB et al., 2001).Sequncias repetitivas simples quando clonadas tendem a sorerdelees ou inverso das repeties (MARCADIER; PEARSON,2003). Prximo aos stios de quebra e juno da regio que soreu a deleo ou inverso, observamse, normalmente, estruturas do DNA do tipo noB (WOJCIECHOWSKA et al., 2005).
Instabilidade de insertos clonadosObservase que alguns segmentos de DNAs quando clonados
propiciam o rearranjo do vetor. As anlises desses ragmentos mostraram que a instabilidade estaria correlacionada a presena de se
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
61/111
60 Estrutra e evoluo dos genomas
quncias repetidas diretas, invertidas e invertidas complementares,repeties do tipo microssatlite e minissatlite, todas potencialmente capazes de promover estruturas noB no DNA (LEACH;SAHL, 1983; WYMAN, et al., 1985, 1986; MEIMA, et al., 1997;
RINH; SINDEN,1993; SRADER; HOWELL, 1997; SONGet al., 2001; KUPRINA et al., 2003; BACOLLA et al., 2004; LAN;MUGUIRA, 2005; WOJCIECHOWSKA et al., 2005; GRINDLEYet al., 2006; WANG; VASQUEZ, 2006; WOJCIECHOWSKA et al.,2006; DU et al., 2007; WELLS, 2007.
Os rearranjos podem ser complexos e resultar em perdas, duplicaes, inverses, translocaes de DNAs, com ou sem a presena deregies de identidade nos stios recombinativos (LEACH; SAHL,
1983; WYMAN et al., 1985; 1986; MEIMA et al., 1997; SRADER;HOWELL, 1997, LEEM et al., 2004). Em alguns casos, observaseo comprometimento de sequncias do vetor, inviabilizando a suamultiplicao LEACH; SAHL, 1983; WYMAN et al., 1985; 1986;MEIMA et al., 1997; SRADER; HOWELL, 1997, LEEM et al., 2004).
Leem et al. (2004), em um trabalho que envolveu sobreposies de sequncias clonadas em vetores bacterianos e de leveduras, identicaram que as regies de instabilidade de quatro genes
eram constitudas principalmente por grandes blocos de microssatlite e minissatlite e alta densidade de repeties do tipo Alu.Outras sequncias, tambm identicadas como altamente instveisem vetores bacterianos, oram as LineS repeties invertidas longas, sequncias ricas em A e sequncias com estruturas do tipoZDNA (HAGAN; WARREN, 1982; SCHROH; HO, 1995; KANG;COX, 1996; RAZIN et al., 2001). Em leveduras, tanto o tamanho dasregies repetitivas como a distncia entre elas estimulam a recombinao (LOBACHEV et al., 1998). J a presena de origem de replicao orte entre as repeties diminui a recombinao, sugerindo quea origem orte rompa a estrutura secundria que seria importanteno avorecimento dos rearranjos.
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
62/111
61Organizao estrutural e instabilidade do material gentico
Insertos ricos em CG clonados em plasmdios do tipo YACs podem ser instveis em leveduras, indicando a participao de estruturas peculiares no mecanismo recombinativo BERNANRDI, 1995.
Plasmdios que se mantm em grande nmero de cpias na clu
la hospedeira, independente de presena de insertos, podem sorerrecombinao, mesmo em hospedeiras decientes para esse tipo demecanismo. Os produtos intermedirios da recombinao ormamestruturas do tipo caudacabea, onde dois ou mais plasmdios cam ligados entre si, podendo posteriormente ser resolvidos ormamonomrica. Observase que 95 % dos plasmdios mantidos emE. coli esto na orma monomrica, e 5 %, na orma de dmeros,trmeros ou tetrmeros BOE; OLKERNIELSEN, 1997.
Esses segmentos, eventualmente, so estabilizados quando alinhagem hospedeira deciente para enzimas do mecanismo dereparo e salvaguardas do DNA (LEACH; SAHL, 1983; WYMANet al., 1985; 1986; MEIMA et al., 1997; SRADER; HOWELL, 1997;KOUPRINA et al., 2003; LEEM et al., 2004; INERNAIONALHUMAN GENOME SEQUENCING CONSORIUM, 2004; LAN;MUGUIRA, 2005.
rinh e Sinden 1993 assinalaram a inuncia da estrutura pri
mria e secundria de insertos com dierentes repeties diretas naestabilidade de plasmdios. Esses autores concluram que as repeties so capazes de ormar estruturas que podem ser removidas ouamplicadas, mesmo em bactrias hospedeiras decientes em RecA,principal enzima responsvel pela recombinao. Outra observao a de que o nmero, o tamanho, a distncia entre as repeties e apresena de palndromos inuenciam na requncia dos rearranjosque resultam em perdas. Duplicaes e inverses ocorreriam a umataxa elevada, quando no houvesse uma repetio direta ou invertida no seguimento contido entre duas repeties diretas.
Vetores contendo palndromos superiores a 30 pb, instveis emplasmdios, oram mantidos com sucesso em ago , utilizando hos
-
8/7/2019 Estrutura e Evoluo dos Genomas Embrapa
63/111
62 Estrutra e evoluo dos genomas
pedeiros decientes para o gene recBC exonuclease V e sbcB exonuclease I LEACH; SAHL, 1983.
Repeties superiores a 300 pb mantiveramse estveis quandoclonadas em ago no hospedeiro E. colirecA+ decientes para recB,
recC, e sbcB ou recD (WYMAN et al., 1985; 1986). Vericouse tambm que a utilizao de vetores com stios chi, e ou genegam uncional pode, eventualmente, estabilizar sequncias com problemasde clonagem WYMAN et al., 1986.
Apesar do grande nmero de vetores e linhagens hospedeirasgeradas para acomodar segmentos instveis, a noclonabilidadeainda representa obstculo para o conhecimento pleno dos genomas tidos como completos (KOUPRINA et al., 2003; LEEM et al.,
2004; INERNAIONAL HUMAN GENOME SEQUENCINGCONSORIUM, 2004; LAN; MUGUIRA, 2005). Estimase que 1 %das sequncias eucariticas so de dicil clonagem e as regies reconhecidas como instveis permanecem nos rascunhos dos bancosgenmicos at sua plena elucidao LEEM et al., 2004.
Instabili