apresentação do powerpoint - universidade de são … de... · –tempo para sequenciamento do...
TRANSCRIPT
Genômica
• O que chamou mais atenção no filme?
– Tempo para sequenciamento do genoma
– Predição do fenótipo com base no genótipo
– Como este conhecimento pode ser usado para gerar novas tecnologias?
Sequenciamento de Genoma
Sequenciamento do Genoma
Genoma Humano: 3 bilhôes de bases
• AGCAATCAACTCGCTCGTGCTGC
AGCTTGGCAAGCGGCACAGAAAC
CGGGAGACCGTACTCACAACCCT
CTATTGCTCTATGGTGGGACTGG
TTTGGGTAAAACCCATTTAATGT
TTGCTGCAGGTAACGTAATGCGG
CAAGTAAACCCAACTTATAAAGT
AATGTATCTTCGTTCGGAACAGT
TTTTCAGCGCCATGATAAGAGCG
TACAAGATAAAAGTATGGATCAU
AAATGGAATCTTGGTCCCGTTGC
CTGGAACGTCTTGAAACTGAATT
CCCGCCAGAAGATGTTCATACTT
GGTTAAGACCTTTACAAGCCGAC
CAACGTGGTGACAGTGTCGTCCT
CGTACCAGTAGACACTACAGGAC
• Animação DNA polimerase
Replicação do DNA
Sequenciamento de DNA
Limitação: tamanho da sequencia
• ATGGAATCTTGGTCCT……………CCCGCCAGAAGATGTTCATACAAGACCTTTAC (M bases)
• ATTTCTCATACG………TGAAGTAG (600 bases)
http://www.k.u-tokyo.ac.jp/pros-e/person/shinichi_morishita/shinichi_morishita.htm
Shot gun sequencing
Montagem dos fragmentos
Fechamento dos gaps
Análise
Genome Assembly
Contigs
Assembler: Phrap (www.phrap.org)
Gaps
Complete Genome
O projeto foi fundado em 1990, com prazo de conclusão de 15 anos. James D. Watson, na época chefe dos Institutos Nacionais de Saúde dos EUA, assumiu inicialmente a direção do projeto.[1] Em 1990, o PGH tinha o envolvimento de mais de 5000 cientistas, de 250 diferentes laboratórios, que contavam com um orçamento, segundo diferentes fontes, que variou de US$ 3 bilhões a US$ 53 bilhões. O PGH contou com um financiamento de 3 milhões de dólares do Departamento de Energia dos Estados Unidos e do NIH estadunidense. O Projeto contou com o envolvimento de diversos laboratórios e centros de pesquisa ao redor do mundo, criando dessa forma o Consórcio Internacional de Sequenciamento do Genoma Humano. Este consórcio publicou um esboço inicial na revista científica Nature em fevereiro de 2001 com cobertura de cerca de 90 por cento do genoma. [2]
O genoma humano contém cerca de 3 bilhões de pares٭de nucleotídios.
O tamanho médio médio de um gene é cerca de 3.000 ٭pares de nucleotídios, mas a variação é muito grande; o maior gene humano é o da distrofina, com 2,4 milhões de pares de nucleotídios.
O número de genes no genoma humano está entre ٭20.000 e 25.000.
A seqüência de nucleotídios é muito semelhante ٭(99,9%) entre todas as pessoas.
O que o PGH nos informa?
*A função de 50% dos genes humanos descobertos é totalmente desconhecida.
*Menos do que 2% do genoma humano codifica proteínas.
* Seqüências repetitivas que não codificam proteínas (DNA lixo) constituem pelo menos 50% do genoma humano. * As seqüências repetitivas parecem não desempenhar nenhuma função direta, mas elas podem ter papel na dinâmica estrutural dos cromossomos. De tempos em tempos, essas seqüências possibilitam rearranjos do genoma, criando genes novos e modificando outros.
* O genoma humano possui regiões onde se concentram genes e regiões muito pobres em genes
* As regiões onde se concentram os genes possuem blocos ricos nas bases C e G, enquanto as regiões pobres em genes possuem blocos ricos nas bases A e T.
* A região rica em genes parecem se concentrar aleatoriamente no genoma, separados por longas seqüências de DNA não-codificante.
* O cromossomo 1 é o que contém o maior número de genes (2.968), e o cromossomo Y, o menor (231).
• O número de genes, suas localizações exatas e suas funções • Como os genes são regulados • Detalhes da estrutura dos cromossomos e da organização dos genes • Os tipos de DNA não-codificante, sua quantidade, sua distribuição, se contêm algum tipo de informação e suas funções • Como as células coordenam a expressão dos genes, a síntese das proteínas e os eventos pós-tradução • A interação das proteínas nas complexas maquinarias celulares • Explicar a conservação evolutiva entre as espécies • O proteoma, ou seja, o conjunto total de proteínas e suas funções • A correlação entre as diferenças genéticas entre as pessoas com a saúde e com as doenças • Predizer a susceptibilidade a doenças com base na variação da seqüência gênica • Os genes envolvidos em traços complexos e doenças multigênicas • O controle genético do desenvolvimento
O que ainda não sabemos...
Novas tecnologias
Illumina Genome Analyzer Workflow
Preparação das bibliotecas
Formação dos clusters
sequenciamento
Preparação das bibliotecas (6 horas)
Illumina Genome Analyzer
A
A
Preparação das bibliotecas
Illumina Genome Analyzer
A
A
T
T
A
A
T T
Preparação das bibliotecas
Illumina Genome Analyzer
Preparação dos clusters (5 horas)
Illumina Genome Analyzer
Lâmina – 8 canais
1 a 12 amostra por canal = 96 amostras
~375 Mb por canal
3 a 3,5 GB (3 bilhões de bases)
48 horas
Illumina Genome Analyzer
Re-sequenciar um genoma microbiano inteiro (5 MB)
- 75 x de cobertura (um canal)
genoma humano (1 x – lâmina inteira)
Illumina Flow Cell •One (1) flow cell.
•Eight (8) channels.
•Each channel can run up to twelve (12) differently tagged libraries (Multiplexed Sequencing).
•Input requirement: 0.1–1.0 μg (single- and paired-end reads), 10 μg (Mate Pair reads).
•1.4-mm wide channels.
•Relies on the binding of randomly fragmented DNA to attached oligos on a planar, optically transparent surface (flow cell).
•96-120 million reads (clusters) per flow cell, each containing ~1,000 copies of the same template.
Preparação dos clusters
Illumina Genome Analyzer
Preparação dos clusters
Illumina Genome Analyzer
Preparação dos clusters
Illumina Genome Analyzer
Preparação dos clusters
Illumina Genome Analyzer
Preparação dos clusters
Illumina Genome Analyzer
Sequencing Technology Overview
Sequencing Technology Overview
Preparação dos clusters
Illumina Genome Analyzer
A
C
T
G
G
C
T
Sequenciamento (2-3 dias)
- 4 nucleotídeos marcados ao mesmo tempo
- acurácia
- sem problemas com homopolimeros
Illumina Genome Analyzer
Incorporação
detecção
desbloqueio
Sequenciamento
Illumina Genome Analyzer
Sequenciamento
Illumina Genome Analyzer
Sequenciamento
Illumina Genome Analyzer
A
T C
G
Sequenciamento
Illumina Genome Analyzer
A T
C
G
Sequenciamento
Illumina Genome Analyzer
A
Sequenciamento
Illumina Genome Analyzer
A T
C
G
A
Sequenciamento
Illumina Genome Analyzer
A
T
C
G
A
Sequenciamento
Illumina Genome Analyzer
A
T
Illumina Genome Analyzer
Illumina Genome Analyzer
Illumina Genome Analyzer
Variante
não conhecida SNP
Illumina Genome Analyzer
Illumina Genome Analyzer
ILLUMINA HiScanSQ DNA, RNA sequencing and Genotyping
Novas tecnologias de Sequenciamento
60
Novas tecnologias de Sequenciamento
61
Novas tecnologias de Sequenciamento
62
Variações encontradas no genoma
• Microssatélites
• SNP
• Outras...
>ZZFIGCO001g_A04_.g_033_Rome.ab1 CHROMAT_FILE: CGATTGGGCCGACGTCCATGCTCCGGNNCGCATGTCGGCCGCGGGAATTCGATTCTCTTGCTTACGCGTGGACTAGCTTACAATA
GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGTTTTGGCTGATGCCTTATCTCAAAAG
AAGAAACGACCCTATATATAGAAAAGAAAAAAACAGAAAGAATCTATGCACAGTAAAGTAGGTCCCATATGTGGGTCCCTTATACAGT
GTATTTACTGTGTATACAATATTTCTACTATATAAACAATGTATCTACTGTTGAGTGGGTCGGCGGCCTCACTGTTGATCATATTCCAC
GTCTCTCTAATTCTTTCATCTGTTGGATGAAATCTTCCGCATTTTCTACAGCTTCGTCAGATAATATCTTCTCCGATTGAATAGGCTGA
GAATCTTCTGCAATATCATCGTTGCTTGTTTCACTTCGCATTAAAGTGTCAGATTTTTCATACTGGTTAATAGATTGAAGTAAGTTTCTT
TTTACTTCTTCCAAATACTTATTAATCAATTTCTATAAGATAAACATATAAGTTCAGATCCAGGCACATAATTATAACCATGCGTTTTCA
CACGTATTTGTCAAAATAAGTCTGCATTTCTCACTTCTTTTTCCTGGTTAAGACCCGTTATACCCTCCAATTATACTTGGAACACCTTT
TATCGGCGCTATTTATCCTTTTACTAGCATAGATTCTAAAGGATTTACCACAACTTATAAAAATAAAAGAATAGGTTATACCTTTGTTAC
CGATCCCGTAACTAGGGGATATAATGGCTTTATTAGATATAAATCCAAAATATATT
(AG)30
DNA sequencing
mutation
Useful when you suspect a gene, but don’t know
the variant. This one is BRAF gene in leukemia
The products of the sequencing reaction are separated on a
gel mixture that can separate fragments by one base pair.
Larger fragments Smaller fragments
SNP
Discovery of SNPs in aligned DNA sequence data using PolyBayes in the
Consed viewer
SNP Discovery
software
DNA Sequence Alignment for Single Nucleotide Polymorphism (SNP) Discovery in Soybean
Observações após o sequenciamento de vários genomas
• Se somos 99,9% iguais, onde estão as diferenças?
• Como uma mudança de bases pode mudar o fenótipo?
Atalho para 3D Animations - Disease Mutation Sickle Cell Dolan DNA Learning Center.lnk
Mutação: Albinismo
McPherron et al., Nature e PNAS 1997
Musculatura dupla em bovinos
• Mutações em regiões não codificantes podem alterar o fenótipo?
• Exemplos?
Georges, 2007
• Como estas informações de mutações podem ser utilizadas?
• Detecção de doenças
• Como esta informação pode ser usada para curar ou minimizar as doenças?
• Como a identificação dos polimorfismos podem ser usados para prever o fenótipo?