pontifícia universidade católica de goiás departamento de...

30
Prof. Macks Wendhell Gonçalves, Msc Pontifícia Universidade Católica de Goiás Departamento de Biologia [email protected] Introdução a Bioinformática Disciplina: Bioinformática Bio1015

Upload: others

Post on 15-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Prof. Macks Wendhell Gonçalves, Msc

Pontifícia Universidade Católica de GoiásDepartamento de Biologia

[email protected]

Introdução a Bioinformática

Disciplina: Bioinformática Bio1015

Page 2: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

EMENTA

Introdução à bioinformática: conceitos, uso de bancos de dados,recuperação e formatos de sequências, BLAST, métodos dealinhamento de sequências, desenho de primers, compreensãoda bioinformática evolutiva, estudos de estruturas 3D deproteínas, panorama de vias metabólicas.

Page 3: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

OBJETIVOS DA DISCIPLINA

- Dotar os alunos de conhecimentos básicos sobre a aplicação da informática na análise dos processos biológicos a partir de dados de sequências de DNA, sequências de proteínas e de expressão gênica.

- Entender a importância do Projeto Genoma Humano- Entender a forma como a ciência da computação tem ajudado na exploração de dados biológicos.- Conhecer a história da genômica e da bioinformática.- Compreender os serviços bioinformáticos mais utilizados.- Conhecer os principais bancos de dados disponíveis para análises em bioinformática- Conhecer as principais ferramentas bioinformáticas utilizadas em Biologia Molecular

• Objetivos específicos

• Objetivo geral

Page 4: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

CONTEÚDO PROGRAMÁTICO

• Biologia na era da informática e importância da Bioinformática;• Revisão dos principais conceitos de Biologia molecular e conexão com conceitos de

informática;• Compreensão dos principais métodos de sequenciamento;• Breve histórico do Projeto Genoma Humano;• Apresentação e familiarização dos principais bancos de dados utilizados em

Bioinformática;• Obtenção de sequências (DNA e Proteína) e formato dos arquivos;• Compreensão e realização de técnicas de alinhamentos pareados;• Compreensão e realização de técnicas de alinhamentos múltiplos;• Desenho de primers;• Anotação de sequências;• Bioinformática evolutiva – construção de árvores filogenéticas;• Predição de Estrutura secundária e terciária de Proteínas • Principais recursos do Expasy;• Principais recursos do Protein Data Bank;• Principais recursos do KEGG.

Page 5: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

BIBLIOGRAFIA

• Básica

• Complementar

Schrank A. et al. Biologia molecular básica. 3 ed. Porto Alegre: Mercado Aberto, 2003.

Alberts, Bruce. Biologia molecular da célula. 4. ed. Porto Alegre: Artmed, 2006[i.e.2004]. 1463 p.

Prosdocimi et al. Bioinformática: Manual do Usuário. Um guia amplo e básico sobrediversos aspectos desta nova ciência. Revista Biotecnologia 29.

Prosdocimi & Santos. Sobre bioinformática, genoma e ciência. Ciência Hoje.Malone et al. 2006. R. Bras. Agrociência, Pelotas, v. 12, n. 1, p. 07-13, jan-mar, 2(http://www.ufpel.tche.br/faem/agrociencia/v12n1/artigo02.pdf)

Binneck E. As ômicas: integrando a bioinformação. Revista Biotecnologia 32.Prosdocimi, F. Curso de bioinformática.

Page 6: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

O que é a bioinformática?

A bioinformática consiste em todo tipo de estudo ou de ferramenta computacional que se pode realizar e/ou produzir de forma a organizar ou obter informação biológica a partir de sequências de biomoléculas.

A Bioinformática é uma nova disciplina científica com raízes nas Ciências da Computação, Estatística, Genética, Bioquímica e Biologia Molecular.

• A 10 anos atrás o termo nem existia.

Page 7: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo
Page 8: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Bioinformática

Interpretação da linguagem dos genes por algoritmos oriundos da

informática

Aprendizado automático a partir de grande volume de dados

Geração de hipóteses a partir

dos dadosCriação de bancos

de dados.

Leitura de informações contidas no código genético

Desenvolvimento de softwares que otimize a

análise de bancos de dados genômicos

Para que serve a bioinformática?

Page 9: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

A história começa na década de 1940 com a invenção do moderno computador digital

Colossus

Page 10: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico- Ele se chama digital, pois os dados são armazenados

com um alfabeto binário

- Dígitos binários – 0 e 1 (Liga/desliga) Possível graças aos transístores

Em 1944, Avery e colaboradores descobriram que o DNA era a substância que carregava a informação genética

Usando a descoberta de Avery como referência, vemos que o nascimento do moderno computador digital e da moderna

biologia molecular se deram mais ou menos ao mesmo tempo

Page 11: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

A descoberta da hélice dupla, em 1953, mostrou que a informação genética também é armazenada de forma digital

- Mas diferente do alfabeto binário dos computadores, os dados genéticos são armazenados com um alfabeto quaternário “A, C, G e T”

- Mais tarde se descobriu que a forma dos genes operarem também é digital, os genes podem ser “ligados” ou “desligados”

Apenas estas observações já seria suficiente para prever, na década de 1950, que um dia informática e biologia molecular iriam juntas fazer nascer uma nova área de conhecimento

Page 12: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

O nascimento da área, entretanto, teve de esperar muito tempo para acontecer

Essa é a razão da bioinformática ser uma aparente novidade

Algumas pessoas consideram que a bioinformática passou a ser reconhecida como importante pelo mundo científico por volta de 1995, ano que o primeiro genoma de uma bactéria foi publicado

Por que tão longa demora?

Page 13: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

Do lado da biologia molecular o motivo é simples

- Apesar da estrutura do DNA ter sido desvendada em 1953, a informação nela contida não podia ser “lida”

- Foi como tivéssemos descoberto o alfabeto utilizado para escrever “o livro da vida”, mas as “palavras” desse livro estavam com letrinhas tão pequenas que não conseguíamos lê-las

- Foi preciso esperar até fins da década de 1980 para que aparecesse uma “lente de aumento” suficientemente boa que permitisse a leitura dessas letrinhas em grande quantidade

Uma máquina automática- Em 1995, uma única máquina dessas já conseguia ler milhares de

letrinhas por dia

Page 14: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

Do lado da computação foi também preciso um amadurecimento

- Computadores sendo capazes de armazenar cada vez mais informação, de processá-la de modo cada vez mais rápido, a um custo cada vez menor

- Se o sequenciamento automático do DNA tivesse amadurecido mais rapidamente, não haveria computadores com poder suficiente para dar conta dos dados gerados

- Na década de 1970 a unidade básica de armazenamento de informação era o kilobyte - 1024 bytes, aproximadamente 1000 letras

Page 15: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Contexto Histórico

Então, através de uma evolução que parece mais ou menos sincronizada, desembocamos em 1995

Os computadores já estavam suficientemente poderosos para poder processar os milhões e milhões de letrinhas que passaram a vir à luz.

E assim nasceu a bioinformática, com a missão de ajudar-nos a entender a história que está escrita

nesse livro da vida

Page 16: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Surgimento da bioinformática

Com o surgimento dos sequenciadores capilares de DNA em larga escala gerou-se uma enorme quantidade de informação biológica, de modo que seria impossível de se analisar manualmente.

Crescimento do GenBank. Crescimento exponencial do número de sequências contidas nesse banco de dados ao longo de duas décadas.

Fonte: GenBank

Page 17: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Surgimento da bioinformática

1988É fundada a Human Genome Oganization (HUGO), uma organização internacional de cientistas para sequenciar e anotar o genoma humano.

Page 18: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Surgimento da bioinformática

1988Foi criado o National Center for Biotechnology Information (NCBI), como um repositório de diversas bases de dados biológicas (como o GenBank).

Page 19: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Surgimento da bioinformática

1993O primeiro mapa de genoma bacteriano completo é publicado (Haemophilus influenzae) e termina a primeira fase do Projeto Genoma Humano, com o mapeamento genético pela Genethon

Page 20: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Surgimento da bioinformática

2003Depois de uma década o genoma humano é finalmente publicado

Page 21: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Objetivos da bioinformática

• Reconhecimento de padrões• Criação de algoritmos• Descoberta de genes• Descoberta de novos fármacos• Alinhamento de estruturas de

proteínas• Agrupar proteínas homólogas• Predição de estruturas de proteínas• Previsão de expressão gênica e

interações de proteínas• Identificar inibidores de enzimas• Estudos de associação ampla de

genoma e modelagem da evolução

Page 22: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Biologia computadorizada Bioinformáticax

Diz respeito a qualquer aplicação da computação

na área biológica.

Está frequentemente associada a análises de sequências do genoma,

transcriptoma e proteoma.

Biologia computadorizada e a Bioinformática

Page 23: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Paradigmas da Bioinformática

Ferramentas de bioinformática são produzidas para construir os edifícios genômicos. Ex: Projeto Genoma

Mineração do grande volume de dados

biológicos em genômica gerados.

Onde a genômica encontra a ciência e o método científico de

observação: hipótese, experimentação

resultados.

Page 24: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Paradigmas da Bioinformática

Montagem de DNA

- Um genoma de bactéria tem em geral 3 ou 4 milhões de letrinhas ou bases. As máquinas sequenciadoras conseguem ler apenas pedaços de cerca de 1000 bases

- A solução é gerar uma enorme quantidade de fragmentos que tenham sobreposição entre si. Para ler 3 ou 4 milhões são necessários cerca de 100 mil desses fragmentos

Aí, obviamente, é necessário um programa de computador para montar esse quebra cabeça

- Como é possível montar um livro com 4 milhões se só conseguimos ler fragmentos de 1000 bases?

Page 25: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Paradigmas da Bioinformática

Funções dos genes já identificados em estudos.

Frequentemente esse é o perfil de resultados de trabalhos em Genômica –Ciência descritiva.

É preciso utilizar a “peneira” para gerar dados mais informativos e relevantes

Page 26: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Paradigmas da Bioinformática

Aprendizagem de Máquina (AM)

• Principal preocupação

- Como construir programas de computador que automaticamente melhoram seu desempenho com a experiência?

• Técnicas orientadas a dados

- Aprendem automaticamente a partir de grandes volumes de dados- Geração de hipóteses a partir dos dados

Page 27: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Algumas Técnicas

Redes Neurais Artificiais (RNs) Máquinas de Vetores Suporte (SVMs) Algoritmos de Agrupamento (AA) Algoritmos Genéticos (AGs) Árvores de Decisão (ADs) Raciocínio Baseado em Casos (RBC) K-vizinhos mais próximos (kNN)

Aprendizagem de Máquina

Page 28: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Problemas em Biologia Molecular que podem ser tratados por AM

Reconhecimento de genes Reconstrução de árvores filogenéticas Análise de dados de expressão gênica Previsão de estruturas de proteínas Análise de interação entre genes Montagem de fragmentos Alinhamento de sequências

Aprendizagem de Máquina

Page 29: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Área estratégica de pesquisa

Os bancos de dados genômicos disponíveis gratuitamente na internet hoje contêm mais informação biológica do que todos os cientistas do mundo serão capazes de analisar, não importa quanto tempo se dediquem

Dados gratuitos e de qualidadeMuitas vezes pobremente analisados: a corrida genômicaBrasil: pra quê financiar pesquisas tão caras?Não seria melhor investir na educação?

Tarefa do bioinformata Ser criativo e produtivo ao mesmo tempoNão perde o tempo da produção do dadoEconomiza “50%” do esforço científico

Page 30: Pontifícia Universidade Católica de Goiás Departamento de ...professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497... · A bioinformática consiste em todo tipo de estudo

Bioinformática e suas aplicações

Ciência básica- Construção de árvores filogenéticas;- Montagem e caracterização de genomas;

Na medicina- Diagnóstico e tratamento;- Analisar uma Mutação nova de uma doença e comparar com

outras mutações em bancos de dados;- Farmacogenética;- Alvos proteicos com potencial de serem modificados com

fármacos minimizando as causas da doença;- Terapia gênica