bioinformÁtica y Ómicas

63
MARTÍN ESPARIZ - [email protected] BIOTECNOLOGÍA DE LOS ALIMENTOS 2019 BIOINFORMÁTICA Y ÓMICAS

Upload: others

Post on 13-Jul-2022

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BIOINFORMÁTICA Y ÓMICAS

M A R T Í N E S P A R I Z - E S P A R I Z @ I B R - C O N I C E T . G O V . A R

B I O T E C N O L O G Í A D E L O S A L I M E N T O S 2 0 1 9

BIOINFORMÁTICA Y ÓMICAS

Page 2: BIOINFORMÁTICA Y ÓMICAS

Las secuencias de aminoácidos de los

polipéptidos relacionados se dan en un código

de una letra.

El sitio de unión al hierro conservado se muestra

en negrita. En particular, el átomo de hierro

está unido por los dos residuos de histidina (H)

conservados.

Chapter 26 • Molecular Evolution * Clark, D.P.

ALINEACIÓN DE SECUENCIAS RELACIONADAS

Page 3: BIOINFORMÁTICA Y ÓMICAS

La glicerol-dihidrogenasa de Bacillus está

relacionada con los otros miembros de esta

familia de proteínas, pero ya no usa hierro.

La secuencia de unión al hierro no está más

presente ya que ambas histidinas se han

reemplazado por otros aminoácidos.

Chapter 26 • Molecular Evolution * Clark, D.P.

ALINEACIÓN DE SECUENCIAS RELACIONADAS

Page 4: BIOINFORMÁTICA Y ÓMICAS

ALINEACIÓN DE SECUENCIAS RELACIONADAS

Árbol filogenético construido comparando la secuencia

de aminoácidos del citocromo c que se encuentra

codificado en todos los organismos analizados.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 5: BIOINFORMÁTICA Y ÓMICAS

ALINEACIÓN DE SECUENCIAS RELACIONADAS

Cuanto más

cerca están las

ramas, más

similares son las

secuencias. Los

números a lo largo

de las ramas

representan el

número de

diferencias de

aminoácidos.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 6: BIOINFORMÁTICA Y ÓMICAS

La duplicación del gen de la globina ancestral permitió que ambos genes evolucionen independientemente.

El primer gen se convirtió en hemoglobina, que solo se encuentra en los glóbulos rojos. La segunda copia se convirtió en mioglobina, que se encuentra en el tejido muscular.

Ambas proteínas todavía transportan oxígeno, pero tienen especificidad de tejido.

Chapter 26 • Molecular Evolution * Clark, D.P.

LA DUPLICACIÓN ES FUENTE DE NUEVOS GENES

Page 7: BIOINFORMÁTICA Y ÓMICAS

ORIGEN DE GENES DE LA FAMILIA GLOBINA.

Durante la evolución,

una variedad de

duplicación de genes y

eventos de

diferenciación dieron

origen a una familia de

las globinas.

Chapter 26 • Molecular Evolution * Clark, D.P.

El primer gen de globina ancestral se duplicó dando

hemoglobina y mioglobina. Después de otra duplicación, el

gen de la hemoglobina divergió en los genes de la globina α

ancestral y de la globina β ancestral. La duplicación y la

divergencia continuadas crearon toda la familia de genes de

globina.

Page 8: BIOINFORMÁTICA Y ÓMICAS

ORIGEN DE GENES DE LA FAMILIA GLOBINA.

Los diferentes miembros de

la familia de hemoglobina

están adaptados para

funciones específicas.

Chapter 26 • Molecular Evolution * Clark, D.P.

El feto utiliza dos cadenas α y dos cadenas γ para formar su

tetrámero de hemoglobina. Esta forma es capaz de extraer el

oxígeno de la sangre de la madre porque tiene una mayor afinidad por el oxígeno que la forma adulta de la

hemoglobina.

Page 9: BIOINFORMÁTICA Y ÓMICAS

Genes homólogos son genes que se derivan de un gen ancestral encontrado en un organismo ancestral.

Genes parálogos. Si el gen A se duplica dentro del organismo ancestral y una copia evoluciona hacia una nueva función dando el gen B.

Genes ortólogos. El gen A de chimpancés y el gen A de humanos se consideran ortólogos así como y el gen B de chimpancé y el gen B de humanos ya que se originan por un evento de especiación.

Chapter 26 • Molecular Evolution * Clark, D.P.

SECUENCIAS PARÁLOGAS Y ORTÓLOGAS

Page 10: BIOINFORMÁTICA Y ÓMICAS

En este árbol evolutivo, se

produjo otra duplicación del

gen B en chimpancés y

humanos. Los genes B 'y B' 'de

chimpancé o humano están

dentro de la especie, y por lo

tanto, estos también son

parálogos.

Chapter 26 • Molecular Evolution * Clark, D.P.

SECUENCIAS PARÁLOGAS Y ORTÓLOGAS

Page 11: BIOINFORMÁTICA Y ÓMICAS

CREANDO NUEVOS GENES POR SHUFFLING

La evolución modular de un nuevo gen puede implicar la

fusión de módulos de genes separados o unidades

funcionales. Por ejemplo, el módulo púrpura del gen 1

puede proporcionar una función que complemente al

módulo azul del gen 2. Si estos dos dominios se fusionan,

podrían formar un gen nuevo pero funcional.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 12: BIOINFORMÁTICA Y ÓMICAS

DIFERENTES PROTEÍNAS EVOLUCIONAN A VELOCIDADES MUY DIFERENTES

Durante el curso de la

evolución, algunas

proteínas acumulan más

mutaciones que otras.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 13: BIOINFORMÁTICA Y ÓMICAS

DIFERENTES PROTEÍNAS EVOLUCIONAN A VELOCIDADES MUY DIFERENTES

El gen del citocromo c es muy estable y solo se han producido 50 cambios / 100 aminoácidos en 800 millones de años. Los fibrinopéptidos A y B, por otro lado, han acumulado 50 cambios / 100 aminoácidos en menos de 100 millones de años.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 14: BIOINFORMÁTICA Y ÓMICAS

BASE MOLECULAR DE LA VARIACIÓN: LA MUTACIÓN DEL ADN

Page 15: BIOINFORMÁTICA Y ÓMICAS

RELOJES MOLECULARES PARA SEGUIR LA EVOLUCIÓN

Durante la evolución, las mutaciones en la tercera

posición del codón triplete raramente alteran la

secuencia de aminoácidos de la proteína; por lo

tanto, rara vez son perjudiciales.Chapter 26 • Molecular Evolution * Clark, D.P.

Page 16: BIOINFORMÁTICA Y ÓMICAS

EL ADN NO CODIFICANTE EVOLUCIONA MÁS RÁPIDO

Las regiones de ADN no codificantes a menudo no tienen una función obvia y muchas mutaciones se acumulan dentro de estas regiones. Las mutaciones en las regiones espaciadoras intragénicas o en los intrones no tienen efecto en la secuencia o función de la proteína.

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 17: BIOINFORMÁTICA Y ÓMICAS

ARN RIBOSOMALUN RELOJ QUE AVANZA LENTAMENTE

La comparación de las

secuencias de ARN ribosomal

permité deducir qué tan cerca

están relacionadas las divisiones

principales de los organismos

eucarióticos.

Chapter 26 • Molecular Evolution * Clark, D.P.

Se observa que Los hongos están más

estrechamente relacionados con los animales

que con las plantas. La rama que lleva a las

plantas superiores incluye varios grupos de

algas, incluida la roja, como se muestra aquí.

Page 18: BIOINFORMÁTICA Y ÓMICAS

LOS TRES DOMINIOS DE LA VIDA

Todos los organismos de hoy pertenecen a una de las tres divisiones principales basadas en las relaciones entre el ARN ribosomal: las Eubacterias, las Arqueas (o Arquebacterias) y los Eucariotas. Las mitocondrias y los cloroplastos tienen un ARNr que se parece mucho al de las Eubacteria

Chapter 26 • Molecular Evolution * Clark, D.P.

Page 19: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Crecimiento del

contenido del par de

bases y registros de

secuencia en la base de

datos GenBank DNA.

Bernard R. Glick, Jack J. Pasternak,

and Cheryl L. Patten. — 4th ed.

Capítulo 5 (p146-172)

El campo de la bioinformática se ocupa del análisis

computarizado de grandes cantidades de datos de

secuencias genéticas.

Chapter 9 • Molecular

Evolution * Clark, D.P.

Tenga en cuenta que los ejes y

son escalas logarítmicas.

Page 20: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Bernard R. Glick, Jack J. Pasternak,

and Cheryl L. Patten. — 4th ed.

Capítulo 5 (p146-172)

Chapter 9 • Molecular

Evolution * Clark, D.P.

Tanto en la biología molecular

como en otras áreas, se

acumulan grandes cantidades de

información en los bancos de

datos informáticos.

Page 21: BIOINFORMÁTICA Y ÓMICAS

OMICAS.

Genómica: Área de investigación

que genera, analiza y gestiona las

montañas de información sobre

las secuencias del genoma y

todos los genes que se transcriben

en varios tipos de células y tejidos.

Proteómica: Los estudios de las

poblaciones de proteínas

completas de diversos tipos de

células y tejidos y las numerosas

interacciones proteína-proteína.

Bernard R. Glick, Jack J. Pasternak,

and Cheryl L. Patten. — 4th ed.

Capítulo 5 (p146-172)

Page 22: BIOINFORMÁTICA Y ÓMICAS

OMICAS.

A medida que se implementaron nuevos métodos y se enfocaron

más los objetivos de la investigación, surgieron otras "ómicas",

como la metagenómica, la genómica funcional

(transcriptómica) y la metabolómica.

En general, el sufijo "omics" implica la experimentación a gran

escala del genoma completo, con el análisis de muchas

muestras al mismo tiempo.

Bernard R. Glick, Jack J. Pasternak,

and Cheryl L. Patten. — 4th ed.

Capítulo 5 (p146-172)

Page 23: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Existe una gran dependencia de las computadoras y los programas informáticos para ensamblar, analizar, archivar y distribuir datos genómicos.

Se han desarrollado diversos recursos informáticos para manejar los diversos tipos de información genómica.

Una variedad de sitios web ahora están disponibles para la búsqueda en línea y la manipulación de secuencias

Chapter 9 • Molecular Evolution * Clark, D.P.

Bernard R. Glick, Jack J. Pasternak,

and Cheryl L. Patten. — 4th ed.

Capítulo 5 (p146-172)

Page 24: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Chapter 9 • Molecular Evolution * Clark, D.P.

La minería de datos es el uso de programas informáticos para encontrar

información útil mediante el filtrado o la selección de los datos.

Algunos ejemplos simples de análisis en secuencias de ADN o proteínas:

• Búsqueda de secuencias relacionadas.

Cualquier secuencia de ADN/Aminoácidos puede compararse con otras

secuencias disponibles en los bancos de datos.

Si se encuentra otra proteína con una secuencia relacionada, esto puede

dar una idea de la función de la proteína bajo investigación.

¡Por supuesto, esto supone que la función de la proteína carnada ya se ha

descifrado!

Page 25: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Chapter 9 • Molecular Evolution * Clark, D.P.

Algunos ejemplos simples de análisis en secuencias de ADN o

proteínas:

• Búsqueda de secuencias relacionadas.

Cualquier secuencia de ADN/Aminoácidos puede compararse con

otras secuencias disponibles en los bancos de datos.

Otro uso importante de las comparaciones de secuencias es rastrear

la evolución tanto de los genes individuales como de los organismos

que los portan.

Page 26: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Chapter 9 • Molecular Evolution * Clark, D.P.

Algunos ejemplos simples de análisis en secuencias de ADN o

proteínas:

• El análisis de sesgo de codón puede ubicar las regiones de

codificación.

Debido a la redundancia de la tercera base y al uso preferencial de

algunos codones sobre otros (en las regiones de codificación pero no

en el ADN intergénico aleatorio), existen diferencias en la frecuencia

de codones entre el ADN codificante y el no codificante. Se puede

calcular un índice de sesgo de codón que dé una primera estimación

razonable de si es probable que un tramo de ADN sea codificante o

no codificante.

Page 27: BIOINFORMÁTICA Y ÓMICAS

BIOINFORMÁTICA Y ANÁLISIS INFORMÁTICO

Chapter 9 • Molecular Evolution * Clark, D.P.

Algunos ejemplos simples de análisis en secuencias de ADN o

proteínas:

• Buscando secuencias de consenso conocidas.

Se conoce una variedad de secuencias de consenso cortas o motivos

de secuencia. El análisis de las secuencias de ADN puede revelar

promotores, sitios de unión a ribosomas (solo en procariotas),

terminadores y otras regiones reguladoras. Las repeticiones invertidas

en el ADN implican posibles estructuras de vástago y bucle, que a

menudo son sitios para la unión de proteínas reguladoras. El análisis de

las secuencias de proteínas puede indicar sitios de unión para iones

metálicos, cofactores, nucleótidos, ADN, etc.

Page 28: BIOINFORMÁTICA Y ÓMICAS

HOMOLOGÍA

Page 29: BIOINFORMÁTICA Y ÓMICAS

BASIC LOCAL ALIGNMENT SEARCH TOOL

Page 30: BIOINFORMÁTICA Y ÓMICAS

BLAST

Page 31: BIOINFORMÁTICA Y ÓMICAS

BLAST

Secuencia

Base de

datos

Page 32: BIOINFORMÁTICA Y ÓMICAS

IDENTIFICACIÓN DE CEPAS POR SECUENCIA DE GEN CODIFICANTE DE 16S rARN

Page 33: BIOINFORMÁTICA Y ÓMICAS

Sobre 98,7% de identidad no se puede determinar si

dos organismos son de distintas especies o no.

(Stackebrandt and Ebers, 2006).

IDENTIFICACIÓN DE CEPAS POR SECUENCIA DE GEN CODIFICANTE DE 16S rARN

Page 34: BIOINFORMÁTICA Y ÓMICAS

IDENTIFICACIÓN DE CEPAS POR SECUENCIA DE GEN CODIFICANTE DE OTROS GENES

CONSERVADOS

Page 35: BIOINFORMÁTICA Y ÓMICAS

ANÁLISIS FILOGENÉTICO CON PROTEÍNAS CORE CONCATENADOS

GéneroFamilia EspeciaCepa

Alineamientos: 214922 sitios de 827 proteínas. Organismos: E. faecalis V583 (EfaeV583), E. faecium 1,231,408 (Efm_1231408), E. faecium Com15 (Efm_Com15), E. faecium DO (Efm_DO), E. italicus DSM 15952 (Eita_DSM15952), E. casseliflavusATCC12755 (Ecas_ATCC12755), E. gallinarum EG2 (Egal_EG2), and E. saccharolyticus 30_1 (Esac_30_1)

Repizo et al. BMC Genomics 2014, 15:489

Page 36: BIOINFORMÁTICA Y ÓMICAS

GENÓMICA

La genómica se refiere al análisis de genomas completos, a diferencia de los genes individuales, ya sea por experimentación o análisis de datos. Estudio de genomas en su conjunto en lugar de un gen a la vez.

Chapter 9 • Molecular Evolution * Clark, D.P.

Page 37: BIOINFORMÁTICA Y ÓMICAS

ENSAMBLANDO GENOMAS PEQUEÑOS POR SHOTGUN SEQUENCING

Se digiere el genoma en una gran

cantidad de pequeños fragmentos

adecuados para la secuenciación.

Todos los fragmentos pequeños se

clonan y secuencian.

Las computadoras analizan los

datos de secuencia para las

regiones superpuestas y ensamblan

las secuencias en varios contigs

grandes.

Page 38: BIOINFORMÁTICA Y ÓMICAS

CERRAR BRECHAS ENTRECONTIGS

Dado que algunas regiones del genoma son inestables cuando se clonan, algunos huecos pueden permanecer incluso después de que este procedimiento se repita varias veces.

Para identificar brechas entre contigs, se hacen cebadores (primers) que corresponden a los extremos de los contigs(rosa).

Chapter 9 • Molecular Evolution * Clark, D.P.

Page 39: BIOINFORMÁTICA Y ÓMICAS

CERRAR BRECHAS ENTRECONTIGS

Los cebadores de PCR

que corresponden a los

extremos de los contigs

se usan para amplificar

el ADN genómico. Si el

par de cebadores está

dentro de unas pocas

kilobases entre sí, se

hace un producto de

PCR y se puede

secuenciar.

Chapter 9 • Molecular Evolution * Clark, D.P.

Page 40: BIOINFORMÁTICA Y ÓMICAS

CERRAR BRECHAS ENTRECONTIGS

Alternativamente se usa una sondas para identificar clones que hibridan con las sondas de dos lados de una brecha.

Chapter 9 • Molecular Evolution * Clark, D.P.

En este ejemplo, una sonda para el

final del contig # 3 (3b) y el comienzo

del contig # 4 (4a) se hibrida al

fragmento mostrado. Por lo tanto, la

secuencia de este clon debe cerrar la

brecha entre el contig # 3 y # 4.

Page 41: BIOINFORMÁTICA Y ÓMICAS

EVITAR SOLAPAMIENTOS INCORRECTOS ENTRE SECUENCIAS REPETITIVAS

Si un clon es lo suficientemente grande como para contener completamente secuencias repetitivas, entonces las secuencias de flanqueo únicas pueden posicionar ese clon dentro del genoma.

Chapter 9 • Molecular Evolution * Clark, D.P.

Page 42: BIOINFORMÁTICA Y ÓMICAS

EVITAR SOLAPAMIENTOS INCORRECTOS ENTRE SECUENCIAS REPETITIVAS

Si un fragmento clonado es

corto en relación con

secuencias repetitivas,

pueden producirse errores.

Aquí, el final del fragmento verde

clonado podría alinearse con la

primera o la segunda secuencia

repetitiva; por lo tanto, la secuencia

marcada c-d puede omitirse.

Determinar el espaciado y el número

de elementos repetitivos es

prácticamente imposible con clones

cortos.

Chapter 9 • Molecular Evolution * Clark, D.P.

Page 43: BIOINFORMÁTICA Y ÓMICAS

METAGENOMICA

Construcción de bibliotecas

metagenómicas de diversas fuentes. Las

bacterias de muestras marinas o de agua

dulce se concentran mediante el uso de

un filtro de porosize de 0,1 a 0,8 μm, y los

virus se concentran utilizando un filtro de

<0,1 μm antes de extraer el ADN y luego

se fragmentan. Las bibliotecas que

contienen pequeños fragmentos de ADN,

insertadas en un plásmido, se analizan en

busca de nuevos genes, mientras que las

bibliotecas que contienen fragmentos de

ADN más grandes, se insertan en un

vector de cromosoma artificial fosmid,

cósmido o bacteriano, se analizan para

detectar los operones que codifican

complejos de proteínas o vías

metabólicas.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 44: BIOINFORMÁTICA Y ÓMICAS

ENZIMAS IDENTIFICADAS EN BIBLIOTECAS METAGENÓMICAS

Bernard R. Glick, Capítulo 5 (p146-172)

Page 45: BIOINFORMÁTICA Y ÓMICAS

METAGENÓMICA

Un vector SIGEX, denominado p18GFP, contiene el gen gfp que codifica la proteína fluorescente verde (GFP) bajo el control del plac del promotor inducible por IPTG (plásmido superior). Los fragmentos de ADN metagenómico se insertan en el sitio de clonación múltiple (MCS) entre plac y gfp. Si un fragmento insertado contiene un promotor constitutivo que está activo en la célula huésped e impulsa la expresión de gfp o una secuencia que no interrumpe la actividad de plac (por ejemplo, una secuencia que lleva un terminador transcripcional), las células que llevan estas construcciones emitirán Fluorescencia verde en presencia del inductor, IPTG.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 46: BIOINFORMÁTICA Y ÓMICAS

METAGENÓMICA

Si el inserto lleva un promotor y elementos reguladores que se activan solo en

presencia de un sustrato de interés, por ejemplo, benzoato y unidad de

expresión de gfp, estas células emitirán una fluorescencia verde cuando se

agregue el sustrato. ND, no determinado porque las células que expresan gfp en

presencia de IPTG se eliminan en la primera etapa de selección SIGEX.

Page 47: BIOINFORMÁTICA Y ÓMICAS

FLUORESCENCE-ACTIVATED CELL SORTING (FACS)

Las inserciones de los clones que emiten

fluorescencia verde solo en presencia del

sustrato se analizan para identificar secuencias

completas o parciales que codifican enzimas

catabólicas. Se pueden requerir experimentos

adicionales para aislar operones catabólicos

completos.

Page 48: BIOINFORMÁTICA Y ÓMICAS

TRANSCRIPTOMICA

La transcriptómica (o

genómica funcional ) estudia

los patrones de transcripción,

ya sea cualitativamente para

determinar qué genes se

expresan o

cuantitativamente para

medir los cambios en los

niveles de transcripción de

los genes.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 49: BIOINFORMÁTICA Y ÓMICAS

TRANSCRIPTOMICA

Uno de los objetivos de los estudios de expresión génica es descubrir los genes que están regulados hacia arriba y hacia abajo en condiciones específicas (el transcriptoma).

La transcriptómica estudia la transcripción simultánea de miles de genes (perfiles de expresión génica) de una muestra celular o de tejido.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 50: BIOINFORMÁTICA Y ÓMICAS

MICROMATRIZ DE ADN (DNA CHIP)

El ARNm se extrae de dos muestras

(muestra 1 y muestra 2) y, durante la

transcripción inversa, las primeras cadenas

de ADNc se marcan con los colorantes

fluorescentes Cy3 y Cy5, respectivamente.

Las muestras de ADNc se mezclan y se

hibridan con una matriz ordenada de

secuencias de genes o de

oligonucleótidos específicos de genes.

Después de la reacción de hibridación,

cada celda de sonda se escanea en

busca de colorantes fluorescentes y se

registran las emisiones separadas.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 51: BIOINFORMÁTICA Y ÓMICAS

MICROMATRIZ DE ADN (DNA CHIP)

Las células de sonda que producen

solo una emisión verde o roja

representan genes que se transcriben

solo en las muestras 1 y 2, respectivamente; Las emisiones

amarillas indican genes que están

activos en ambas muestras; y

ninguna emisión (negro) representa genes que no se transcriben en

ninguna de las muestras.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 52: BIOINFORMÁTICA Y ÓMICAS

TRANSCRIPTOMICA

Imagen de fluorescencia de

una micromatriz de ADN

hibridada con ADNc marcado

con Cy3 y Cy5.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 53: BIOINFORMÁTICA Y ÓMICAS

TRANSCRIPTOMICA

Perfiles de expresión génica con una micromatriz

de oligonucleótidos. El ARNm se purifica con una

secuencia de poli (dT) que tiene una extensión de

la secuencia del cebador de la ARN polimerasa

T7. Después de la síntesis de ADNc bicatenario, la

segunda hebra de ADNc actúa como un molde

para la síntesis de ARNc por la ARN polimerasa T7

en presencia de ATP, trifosfato de citidina (CTP),

trifosfato de guanosina (GTP), trifosfato de uridina

(UTP), y CTP biotinilado. UTP. Los círculos grises

representan nucleótidos biotinilados incorporados.

El ARNc biotinilado se purifica, se fragmenta en

trozos de 50 a 100 nucleótidos de longitud y se

hibrida a un microarray de oligonucleótido. La

micromatriz se trata con estreptavidina-ficoeritrina

y las células de la sonda (cuadrados negros) se

analizan para determinar la emisión (amarilla) de

la estreptavidina-ficoeritrina biotinada.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 54: BIOINFORMÁTICA Y ÓMICAS

TRANSCRIPTOMICA

Perfil de expresión génica del

tejido hepático cirrótico. Las

columnas 1 a 7 y 8 a 15 son

muestras de hígado de pacientes

con cirrosis del hígado inducida

por el etanol y el virus de la

hepatitis C, respectivamente. La

muestra de cada paciente se

comparó con el tejido hepático

normal. El cluster está formado por

2.965 genes. Los asteriscos

denotan pacientes con cirrosis

severa del hígado.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 55: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA

La proteómica es el estudio integral de

todas las proteínas, es decir, el proteoma,

de una célula, tejido u organismo desde

una variedad de perspectivas, que

incluyen estructura, función, perfil de

expresión e interacciones proteína-

proteína.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 56: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA

• Las proteínas comprenden el componente activo

de las células. • Las modificaciones postraduccionales, que

influyen en la función y localización de la proteína a menudo no se pueden predecir a partir de la secuencia.

• La función de una proteína a veces puede inferirse determinando las condiciones bajo las cuales se expresa y activa.

• Algunos marcos de lectura abiertos anotados (ORF) no codifican proteínas, y otros codifican proteínas cuyas funciones no se pueden predecir a partir de la secuencia.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 57: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA. PAGE 2D

PAGE 2D para la separación de proteínas.

• Primera dimensión. El enfoque isoeléctrico se realiza para separar primero las proteínas en una mezcla en función de su carga neta. La mezcla de proteínas se aplica a un gel de gradiente de pH. Cuando se aplica una corriente eléctrica, las proteínas migrarán hacia el ánodo (+) o el cátodo (-), dependiendo de su carga neta. A medida que las proteínas se mueven a través del gradiente de pH, ganarán o perderán protones hasta que alcancen un punto en el gel donde su carga neta es cero. El pH en esta posición del gel se conoce como el punto isoeléctrico y es característico de una proteína dada. En ese punto, una proteína ya no se mueve en la corriente eléctrica.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 58: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA. PAGE 2D

PAGE 2D para la separación de proteínas.

• Segunda dimensión. Varias proteínas en una muestra pueden tener el mismo punto isoeléctrico y, por lo tanto, migrar a la misma posición en el gel en la primera dimensión. Por lo tanto, las proteínas se separan aún más en función de las diferencias en sus pesos moleculares (MW) por electroforesis, en ángulo recto con la primera dimensión, a través de un gel de dodecilsulfato de sodio (SDS) y poliacrilamida.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 59: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA

Page 60: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA

Una mancha que contiene una

proteína desconocida que se

separó mediante PAGE 2D se

escinde del gel y se trata con

tripsina. Los péptidos de tripsina

purificados se separan por MALDI–

TOF MS.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 61: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA . MALDI–TOF MS

Mass fingerprinting de péptidos. El

conjunto de masas peptídicas de la

proteína desconocida se utiliza para

buscar en una base de datos que

contiene las masas de péptidos trípticos

para cada proteína secuenciada

conocida, y se determina la mejor

coincidencia. Los sitios de escisión de

tripsina de proteínas conocidas se

determinan a partir de la secuencia de

aminoácidos y, en consecuencia, las

masas de los péptidos trípticos son fáciles

de calcular.

Bernard R. Glick, Capítulo 5 (p146-172)

Page 62: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA. ESI-MS-MS

Secuenciación de péptidos utilizando ESI-MS-MS. Los péptidos trípticos se separan de acuerdo con

sus relaciones masa / carga (m / z), y la

secuencia de aminoácidos de un péptido

seleccionado se determina con un

espectrómetro de masas (MS). El péptido

seleccionado se fragmenta e ioniza para generar

una escala de péptidos más pequeños que

difieren en aminoácidos individuales (aquí solo se

representa la escalera de iones y [y1, y2, etc.]).

Las diferencias en las masas de los péptidos

fragmentados corresponden a las masas

características de los aminoácidos. La proteína

desconocida se identifica buscando una base

de datos de proteínas con las secuencias de

aminoácidos de dos o más péptidos.

Page 63: BIOINFORMÁTICA Y ÓMICAS

PROTEÓMICA

Electroforesis en gel diferencial 2D para el análisis

cuantitativo de la expresión de proteínas. Las proteínas de dos proteomas se marcan con los

colorantes fluorescentes Cy3 y Cy5, respectivamente.

Las muestras marcadas con fluorescencia se

combinan y se separan mediante 2D PAGE. El gel se

escanea para cada colorante fluorescente, y se

registran los niveles relativos de los dos colorantes en

cada mancha de proteína. El gel se tiñe con un

colorante proteico, y cada punto con una proteína

desconocida se escinde y se trata con tripsina. Los

péptidos se separan por ESI-MS-MS, y se determinan las

secuencias de aminoácidos de algunos péptidos

seleccionados. La proteína se identifica mediante la

búsqueda en una base de datos de proteínas para

una posible coincidencia con las secuencias de

aminoácidos de dos o más péptidos.

Bernard R. Glick, Capítulo 5 (p146-172)