2 genómica, proteómica y medicina - cloud object storage · tington, la fibrosis quística o la...

15
Genómica, proteómica y medicina 15 Resumen La secuenciación del genoma humano, junto con el desarrollo y la implementación de las nuevas tecnologías «ómicas» de alto rendimien- to (genómica, proteómica, metabolómica), están incrementando de manera esencial el conoci- miento de la enfermedad humana y establecien- do unas bases sólidas para el desarrollo de la medicina personalizada (MP). El paradigma de la MP , y que plantea unos objetivos más ambi- ciosos, es la denominada «medicina 4P»: pre- ventiva, predictiva, personalizada y participativa. Aplicando la biología de sistemas (que utiliza los datos y las técnicas genómicas, proteómicas y metabolómicas), la emergencia de nuevas tec- nologías (nanochips, microfluídica, técnicas de visualización) y las nuevas herramientas compu- tacionales, pretenden establecer nuevos están- dares en salud humana. Uno de sus objetivos es incorporar el genoma de cada individuo a su historial clínico. En septiembre de 2010 se ha anunciado el lanzamiento del Proyecto del Pro- teoma Humano que, de forma similar al del Ge- noma Humano, pretende identificar y caracteri- zar todas las proteínas humanas. Su consecución es una pieza esencial en el establecimiento de la MP para facilitar la obtención de los perfiles proteicos (de tejidos, células y líquidos fisiológi- cos) que definan cada enfermedad. De la medicina personalizada a la medicina 4P La MP es una forma o modalidad de la me- dicina que utiliza la información de los genes, proteínas y metabolitos de cada paciente para prevenir, diagnosticar y tratar la enfermedad. Emplea la información del genoma de un indi- viduo (y los datos que se derivan, expresión de proteínas, presencia de metabolitos) en pruebas de diagnóstico útiles y tratamientos específicos para cada enfermedad y para cada paciente. La medicina genómica hace uso de la información genómica y las tecnologías complementarias (bioinformáticas) para determinar el riesgo y la predisposición a la enfermedad, diagnóstico y pronóstico y la selección y priorización de las opciones terapéuticas. Mientras que la farma- cogenética se centra en el estudio de cómo un gen (o un pequeño número de genes) afecta al metabolismo de un fármaco, la farmacogenómi- ca lo hace en el estudio de cómo la variación genética del genoma afecta al metabolismo y respuesta frente a los fármacos. La MP utiliza los test moleculares farmacogenéticos y farmacoge- nómicos para estratificar a los pacientes según su respuesta predicha a un tratamiento parti- cular y mejora la eficacia del tratamiento selec- 2 Genómica, proteómica y medicina Fernando Vivanco FUNDACIÓN JIMÉNEZ DÍAZ Universidad Complutense. Madrid

Upload: tranduong

Post on 10-Aug-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Genómica, proteómica y medicina 15

Resumen

La secuenciación del genoma humano, junto con el desarrollo y la implementación de las nuevas tecnologías «ómicas» de alto rendimien-to (genómica, proteómica, metabolómica), están incrementando de manera esencial el conoci-miento de la enfermedad humana y establecien-do unas bases sólidas para el desarrollo de la medicina personalizada (MP). El paradigma de la MP, y que plantea unos objetivos más ambi-ciosos, es la denominada «medicina 4P»: pre-ventiva, predictiva, personalizada y participativa. Aplicando la biología de sistemas (que utiliza los datos y las técnicas genómicas, proteómicas y metabolómicas), la emergencia de nuevas tec-nologías (nanochips, microfluídica, técnicas de visualización) y las nuevas herramientas compu-tacionales, pretenden establecer nuevos están-dares en salud humana. Uno de sus objetivos es incorporar el genoma de cada individuo a su historial clínico. En septiembre de 2010 se ha anunciado el lanzamiento del Proyecto del Pro-teoma Humano que, de forma similar al del Ge-noma Humano, pretende identificar y caracteri-zar todas las proteínas humanas. Su consecución es una pieza esencial en el establecimiento de la MP para facilitar la obtención de los perfiles proteicos (de tejidos, células y líquidos fisiológi-cos) que definan cada enfermedad.

De la medicina personalizada a la medicina 4P

La MP es una forma o modalidad de la me-dicina que utiliza la información de los genes, proteínas y metabolitos de cada paciente para prevenir, diagnosticar y tratar la enfermedad. Emplea la información del genoma de un indi-viduo (y los datos que se derivan, expresión de proteínas, presencia de metabolitos) en pruebas de diagnóstico útiles y tratamientos específicos para cada enfermedad y para cada paciente. La medicina genómica hace uso de la información genómica y las tecnologías complementarias (bioinformáticas) para determinar el riesgo y la predisposición a la enfermedad, diagnóstico y pronóstico y la selección y priorización de las opciones terapéuticas. Mientras que la farma-cogenética se centra en el estudio de cómo un gen (o un pequeño número de genes) afecta al metabolismo de un fármaco, la farmacogenómi-ca lo hace en el estudio de cómo la variación genética del genoma afecta al metabolismo y respuesta frente a los fármacos. La MP utiliza los test moleculares farmacogenéticos y farmacoge-nómicos para estratificar a los pacientes según su respuesta predicha a un tratamiento parti-cular y mejora la eficacia del tratamiento selec-

2 Genómica, proteómica y medicinaFernando VivancofundaCIón JIménez díaz

Universidad Complutense. Madrid

9a edición del curso de Biotecnología Aplicada a la Salud Humana16

cionando los individuos que responden bien o excluyendo a los que van a tener un efecto ad-verso (fig. 1). En los últimos años los genetistas han conseguido identificar los genes responsa-bles de enfermedades que dependen de 1 solo gen (unos 2.000), como la enfermedad de Hun-tington, la fibrosis quística o la anemia falcifor-me. Sin embargo, otras enfermedades mucho más comunes, como la diabetes, la enfermedad coronaria o diversos tipos de cánceres, tienen una base genética compleja (están implicados muchos genes) y su estudio no puede realizarse por las técnicas genéticas habituales. No obs-tante, las nuevas técnicas de secuenciación de ADN y los microarrays de ADN han permitido la identificación de un gran número de genes de

susceptibilidad para estas enfermedades com-plejas, abriendo la posibilidad de una detección temprana y una posible prevención en algunos casos. Los microarrays permiten evaluar miles de fragmentos de ADN o ARN y medir el ni-vel de expresión de cada gen, obteniéndose las firmas de expresión génica o perfiles de expre-sión; son, por tanto, una herramienta muy pode-rosa para investigar el papel de uno o múltiples genes y los polimorfismos (SNP, variaciones de secuencias en el ADN) en los procesos patoló-gicos de individuos o de poblaciones. Asimismo, los estudios de asociación genómica (Genomic-Wide Association Study, GWAS) han permitido, a partir de 2006, la identificación de cientos de genes de susceptibilidad para las enfermedades prevalentes (muy recientemente para el asma). Con esta aproximación se comparan los geno-mas de un número de pacientes que tienen una enfermedad con un grupo control que no la tiene, para identificar las diferencias entre am-bas poblaciones. Si se encuentra alguna variante genética de algún gen que aparece con mayor frecuencia en la población de pacientes que en el grupo control, esas variantes se consideran que están asociadas con la enfermedad.

En cierto sentido los médicos siempre han practicado la MP, ajustando las dosis de los me-dicamentos a cada paciente, cambiando el tipo de fármaco, etc., pero para probar en función del resultado, lo que con frecuencia dilataba el tiempo para aplicar el tratamiento óptimo y se padecían los efectos adversos o la ineficacia de los fármacos. Actualmente, la MP incorpora la información derivada de los análisis moleculares, con nuevos perfiles proteicos en sangre que in-dican un riesgo elevado de enfermedad cardio-vascular o la presencia de cáncer de páncreas o de próstata o de inflamación, que orientan al clínico de forma decisiva en la toma de de-cisiones. Cada vez más, un mayor número de enfermedades se caracteriza por su perfil mo-lecular (genómico, proteómico), cuyo máximo exponente es el cáncer –hasta ahora el órgano, tejido, localización y caracterización histológica

Figura 1A. Eficacia de distintos fármacos sobre la población general.

Patients can respond differently to the same medicine

Anti-depressants

(SSRIS) 38%

40%

43%

50%

70%

75%

Asthma drugs

Diabetes drugs

Arthritis drugs

Alzheimer’s

drugs

Cancer drugs

Percentage of the patient population for witch particular drug

in a class is ineffective, on average

Genómica, proteómica y medicina 17

eran los criterios decisivos–. Hoy día, además, se caracterizan por los genes que expresa cada tumor o por las proteínas presentes en su su-perficie. Los test moleculares ofrecen una gran información sobre la situación de cada paciente, incluyendo la susceptibilidad a una enfermedad, su progresión y la respuesta a distintos fárma-cos: el fármaco adecuado, en la dosis adecuada, para el paciente adecuado, que es la esencia de la MP (farmacogenómica). Además, tienen en

gran medida naturaleza predictiva, lo que favo-rece intervenciones preventivas (tabla 1). Los dos enfoques son complementarios, siendo los protagonistas del primero (clásico) las células, los tejidos y los fármacos de tipo general, su-puestamente útiles para todos los pacientes de una misma enfermedad («talla única para to-dos»). En el enfoque de la MP, los protagonistas son los genes, las proteínas y los metabolitos; y las rutas, redes e interconexiones entre ellos, de

Figura 1B. Comparación de la estrategia utilizada en la MP, utilizando test genéticos (panel inferir), frente a la medicina clásica, que utiliza el mismo fármaco para todos los pacientes de una misma enfermedad.

Pacientes con el mismo diagnóstico

Beneficio y toxicidad

No beneficio y no toxicidad

Beneficio y no toxicidad

No beneficio y toxicidad

Pacientes con el mismo diagnóstico

Tratamiento óptimo

para cada paciente

Genotipado

Medicina personalizada

9a edición del curso de Biotecnología Aplicada a la Salud Humana18

Tabla 1. Selected Personalized Medicine Drugs, Treatments, and Diagnostics as of March 2009*

Therapy Biomarker/test Indication

Herceptin® (trastuzumab)Tykerb® (lapatinib)

HER-2/neu receptor Breast cancer: «…for the treatment of patients with metastatic breast cancer whose tumors overexpress the HER2 protein and who have received one or more chemotherapy regimens for their metastatic disease»

Pharmaceutical and sur-gical prevention options and surveillance

BRCA 1,2 Breast cancer: Guides surveillance and preventive treatment based on susceptibility risk for breast and ovarian cancer

Tamoxifen Aviara Breast CancerIndexSM (HOXB13, IL17BR)

Breast cancer: Calculates a combined risk analysis for recurrence after tamoxifen treatment for ER-positive, node-negative breast cancer

Chemotherapy Mammostrat® Breast cancer: Prognostic immunohistochemistry (IHC) test used for postmenopausal, node negative, estrogen receptor expressing breast cancer patients who will receive hormonal therapy and are considering adjuvant chemotherapy

Chemotherapy MammaPrint® Breast cancer: Assesses risk of distant metastasis in a 70 gene ex-pression profile

Coumadin® (warfarin) CYP2C9 Cardiovascular disease: «an increased bleeding risk for patients ca-rrying either the CYP2C9*2 or CYP2C9*3 alleles»

Coumadin® (warfarin) VKORC1 Cardiovascular disease: «Certain single nucleotide polymorphisms in the VKORC1 gene (especially the -1639G > A allele) have been associated with lower dose requirements for warfarin»

Coumadin® (warfarin) PGx PredictTM:Warfarin

Cardiovascular disease: Determines CYP2C9 and VKORC1 genoty-pes to predict likelihood of adverse events with warfarin therapy.

Coumadin® (warfarin) Protein C deficiencies Cardiovascular disease: Hereditary or acquired deficiencies of pro-tein C or its cofactor, protein S, has been associated with tissue necrosis following warfarin administration

Pharmaceutical and lifes-tyle prevention options

Familion® 5-gene profile

Cardiovascular disease: Guides prevention and drug selection for patients with inherited cardiac channelopathies such as Long QT Syndrome (LQTS ), which can lead to cardiac rhythm ab-normalities

Statins PhyzioType SINM Cardiovascular disease: Predicts risk of statin-induced neuro-myopa-thy, based on a patient’s combinatorial genotype for 50 genes

Atorvastatin LDLR Cardiovascular disease: «Doses should be individualized ac-cording to the recommended goal of therapy. Homozygous Familial Hypercholestremia (10-80mg/day)and heterozygous (10-20mg/day)»

Camptosar® (irinotecan) UGTIA1 Colon cancer: «Variations in the UGT1A1 gene can influence a patient’s ability to break down irinotecan, which can lead to increa-sed blood levels of the drug and a higher risk of side effects»

Genómica, proteómica y medicina 19

Therapy Biomarker/test Indication

Erbitux® (cetuximab)

Gefitinib

Vectibix® (panitumab)

EGFR expression Colon cancer: «Patients enrolled in the clinical studies were re-quired to have…evidence of positive EGFR expression using the DakoCytomation EGFR pharmDx™ test kit». EGFR positive indi-viduals are more likely to respond to the drug than those with reduced EGFR expression.

Erbitux® (cetuximab)

Gefitinib

Vectibix® (panitumab)

KRAS Colon cancer: Certain KRAS mutations lead to unresponsiveness

to the drug

Erbitux® (cetuximab) and

Vectibix® (panitumab)

Fluorouracil

Camptosar® (irinotecan)

Target GI™ Colon cancer: Provides information of the expression of key mole-

cular targets–KRAS, TS, and TOPO1–to guide therapy

Tagretol (carbamazepine)

HLA-B*1502 Epilepsy and bipolar disorder: Serious dermatologic reactions are

associated with the HLAB*1502 allele in patients treated with

carbamazepine. «Prior to initiating Tegretol therapy, testing for

HLA-B*1502 should be performed in patients with ancestry in

populations in which HLAB*1502 may be present»

Immunosuppressive drugs

AlloMap® gene profile

Heart transplantation: Monitors patient’s immune response to heart transplant to guide immunosuppressive therapy.

Ziagen® (abacavir) HLA-B*5701 HIV: «Patients who carry the HLA-B*5701 allele are at high risk for expe-

riencing a hypersensitivity reaction to abacavir. Prior to initiating therapy

with abacavir, screening for the HLA-B*5701 allele is recommended»

Selzentry® (maraviroc)

CCR5 receptor (1) HIV: «Selzentry, in combination with other antiretroviral agents, is indicated for treatment experienced adult patients infected with only CCR5-tropic HIV-1 detectable...»

Budesonide IBD Serology 7 Inflammatory bowel disease: Identifies subset of patients who will

benefit from budesonide.

Gleevec®

(imatinib mesylate)

BCR-ABL Leukemia: «Gleevec® (imatinib mesylate) is indicated for the

treatment of newly diagnosed adult and pediatric patients with Phi-

ladelphia chromosome positive [indicated by presence of BCRABL]

chronic myeloid leukemia (CML) in chronic phase»

Dasatinib Philadelphia

Chromosome

Leukemia: «Dasatinib is indicated for the treatment of adults with

Philadelphia chromosomepositive acute lymphoblastic leukemia

(Ph+ AL) with resistance or intolerance to prior therapy»

Busulfan PhiladelphiaChromosome

Leukemia: «Busulfan is clearly less effective in patients with chronic mye-logenous leukemia who lack the Philadelphia (Ph1) chromosome»

Purinethol® (mercaptopurine)

ThiaguanineAzathioprine

TPMT Leukemia: Guides adjustment of dose in treatment of acute lym-

phoblastic leukemia: «Patients with inherited little or no thiopurine

S-methyltransferase (TPMT) activity are at increased risk for severe

Purinethol toxicity from conventional doses…»

9a edición del curso de Biotecnología Aplicada a la Salud Humana20

Therapy Biomarker/test Indication

Tarceva® (erlotinib) EGFR expression Lung cancer: The test determines patients most likely to respond.

Capecitabine DPD Multiple cancers: «Rarely, unexpected severe toxicity (e.g., sto-matitis, diarrhea, neutropenia and neurotoxicity) associated with 5-fluorouracil has been attributed to a deficiency of dihydropyri-midine dehydrogenase (DPD) activity»

Pharmaceutical and sur-gical treatment options and surveillance

MLH1, MSH2, MSH6 Multiple cancers: Guides surveillance and preventive treatment ba-sed on susceptibility risk for colon and other cancers.

Chemotherapy CupPrintTM Multiple cancers: Determines cancer classification for tumors of unknown primary origin.

Chemotherapy Aviara Cancer TYPEID®

Multiple cancers: Classifies 39 tumor types from tumors of unk-nown primary origin, using a gene expression profile.

Elitek® (rasburicase) G6PD deficiency Multiple cancers: «Rasburicase administered to patients with glucose- phosphate dehydrogenase (G6PD) deficiency can cause severe he-molysis. … It is recommended that patients at higher risk for G6PD deficiency … be screened prior to starting ELITEK therapy»

Drugs metabolized by CYP P450

2C19: Celecoxib, Codeine, Dia-zepam, Esomeprazole, Nelfinavir, Omeprazole, Pantoprazole, Ra-beprazole, Voriconazole

2D6: Acetaminophen, Aripiprazo-le, Atomoxetine, Carvedilol, Ce-vimeline hydrochloride, Clozapi-ne, Fluoxetine HCl, Fluoxetine HCL and Olanzapine, Metopro-lol, Propranolol, Propafenone, Protriptyline HCl, Risperidone, Tamoxifen, Terbinafine, Thiorida-zine, Timolol maleate, Tiotropium bromide inhalation, Tolterodine, Tramadol, Venlafaxine

Amplichip®

CYP2D6/CYP2C19Multiple diseases: FDA classification 21 CFR 862.3360: «This device is used as an aid in determining treatment choice and individualizing treatment dose for therapeutics that are metabolized primarily by the specific enzyme about which the system provides genotypic information»

RifampinIsoniazidPyrazinamide

NAT Multiple diseases: N-acetyltransferase slow and fast acetylators and toxicity- «slow acetylation may lead to higher blood levels of the drug, and thus, an increase in toxic reactions»

Rituximab PGx PredictTM: Rituximab

Non-Hodgkin’s lymphoma: Detects CD-20 variant (polymorphism in the IgG Fc receptor gene FcgRIIIa) to predict response to cancer drug rituximab.

Celebrex® (celecoxib) CYP2C9 Pain: «Patients who are known or suspected to be P450 2C9 poor metabolizers based on a previous history should be administered celecoxib with caution as they may have abnormally high plasma levels due to reduced metabolic clearance»

Risperdal® (resperidone)Zyprexa® (olanzapine)

PhyzioType PIMS Psychiatric disorders: Predicts risk of psychotropic-induced metabolic syndrome, based on a patient’s combinatorial genotype for 50 genes.

Genómica, proteómica y medicina 21

forma que los fármacos (a veces en forma de cóctel) interfieren con las redes o con los nudos (intersecciones) que bloquean toda la red. Algu-nos test para el cáncer de mama, que evalúan 70 genes, orientan no sólo sobre el fármaco a administrar sino que predicen la probabilidad de desarrollar metástasis e incluso el grado de malignidad. La MP, por tanto, se basa en análisis moleculares, con frecuencia altamente comple-jos (perfiles genómicos de miles de genes, perfi-les proteómicos de cientos de proteínas) y que requiere un amplio apoyo de todo el sistema de salud de los países que quieran implantar-lo: nuevas regulaciones, revisión profunda de la educación en biomedicina, sistemas integrados de información sobre la salud, nueva legislación que proteja frente a la discriminación (por ra-zones genéticas), cobertura de los test por los seguros públicos y privados, etc.

A pesar de los numerosos obstáculos, lenta-mente, pero con paso firme, la MP se va incor-porando a los sistemas de salud de los países desarrollados. La tecnología y las nuevas estra-tegias científicas han sido siempre los motores de las revoluciones científicas y todo indica que lo mismo va a ocurrir con la medicina. Países como Estados Unidos o el Reino Unido han aprobado recientemente en sus parlamentos las directrices para el establecimiento de la MP

como el camino óptimo para la salud de la po-blación y, a la vez, el de menor costo a largo plazo. El paradigma de la MP, y que plantea unos objetivos más ambiciosos, es la denominada me-dicina 4P: preventiva, predictiva, personalizada y participativa. Sus promotores (cuyo máximo re-presentante es L. Hood, presidente del Institute for Systems Biology, Seattle, Estados Unidos) consideran que la aplicación de la biología de sistemas (que hace uso de los datos y técnicas genómicas, proteómicas y metabolómicas) (fig. 2), la emergencia de nuevas tecnologías (nano-chips, microfluídica, técnicas de visualización), y las nuevas herramientas computacionales, van a modificar significativamente la medicina y el tra-tamiento de la enfermedad. El carácter predicti-vo proviene de la estimación de la probabilidad de padecer o no una cierta enfermedad en función del genoma individual. Es personalizada porque las variaciones genéticas únicas de cada individuo orientan y/o dirigen los tratamientos: cada paciente se convierte en su propio con-trol; a partir del genoma individual se poseen billones de datos de cada individuo y cientos de millones de individuos con esa cantidad de información. Es preventiva porque pueden di-señarse fármacos terapéuticos/preventivos a partir de la información generada mediante la biología de sistemas. Y, finalmente, es participa-

Therapy Biomarker/test Indication

Gleevec® (imatinib mesylate)

c-KIT Stomach cancer: «Gleevec® is also indicated for the treatment of patients with Kit (CD117) positive unresectable and/or metastatic malignant gastrointestinal stromal tumors (GIST)»

*This list is not intended to be comprehensive but reflects commonly used or available products as of March 2009. Some products, for which the FDA recommends or requires pharmacogenomic testing or which have pharmacogenomic information in their label, are listed at the FDA’s Web site (http://www.fda.gov/cder/genomics/genomic_biomarkers_table.htm). Other listed products that are novel, and/or that address large popula-tions, have been identified via websites and public announcements.

Indications in quotes are taken from the therapeutic product label.

BCR-ABL = breakpoint cluster region – Abelson DPD = dihydropyrimidine dehydrogenase TOPO1 = topoisomerase 1BRCA 1,2 = breast cancer susceptibility gene 1 or 2 G6PD = glucose 6 phosphate dehydrogenase TPMT = thiopurine S-methyltransferasec-KIT = tyrosine kinase receptor HER2 = human epidermal growth factor receptor 2 TS = thymidylate synthaseCYP = cytochrome P450 enzyme NAT = N-acetyltransferase UGT1A1 = UDP-glucuronosyltransferase 1A1

Therapeutic product label contains pharmacogenomic information as: Information only Recommended Required

9a edición del curso de Biotecnología Aplicada a la Salud Humana22

tiva porque los pacientes entienden y partici-pan en las opciones que toman los médicos, los cuales deben actuar como integradores de la información total.

Utilizando los análisis moleculares de la bio-logía de sistemas para el tratamiento de la en-fermedad o su predisposición, la medicina 4P promete introducir nuevos estándares en la salud humana. El resultado es que en los próxi-mos 5-20 años la medicina puede cambiar de ser prioritariamente reactiva (responde cuando aparecen los síntomas de la enfermedad) a ser proactiva, caracterizada por las 4P. Si se adop-tan los test moleculares en la práctica clínica se puede realmente transformar la salud de la población. Gracias a la secuenciación ultrarrápi-da se puede obtener el perfil genómico de un individuo (o de un tumor) en cuestión de días e incluso horas, lo cual introduce unos niveles de complejidad difícilmente controlables en la actualidad. Sin embargo, el número de causas o modificaciones (mutaciones) que hacen que una célula sana se convierta en tumoral no pa-

rece ser muy elevado y son comunes a muchos tumores, lo que facilita el diagnóstico y sobre todo el tratamiento. Ya no es arriesgado decir que en un futuro inmediato la determinación del genoma completo de cada individuo es algo no sólo factible, sino de un precio asequible (unos 1.000 dólares, 800 euros): el primer geno-ma costó 3 billones de dólares, el segundo 100 millones y el tercero, el de James Watson, 1,5 millones (fig. 3). En el futuro cada recién nacido tendrá determinado su genoma completo antes de abandonar el hospital, lo que ya es un obje-tivo en Estados Unidos, donde el número de nacimientos anuales ronda los 4 millones. Los genomas individuales serán un estándar dentro de las historias clínicas en los próximos años.

Sin embargo, algunas de las tecnologías de hoy día necesitan ser mejoradas de forma im-portante si se quieren conseguir los objetivos de la medicina 4P. Por ejemplo, los métodos na-notecnológicos para la medición de proteínas –como medir 2.500 proteínas a partir de una gota de sangre– no son posibles actualmente.

Figura 2. Representación esquemática de los elementos que constituyen la biología de sistemas y su aplicación en medicina.

• Parallel analyses of proteins, metabolites and mRNA from complex samples

• Determination of molecular function and elucidation of disease mechanisms

• Informatics tools to link gene response, protein activity and metabolite dynamics

• BioSystematics™ to translate covariant sets of genes, proteins, metabolites into biochemical interaction and target information

prot

ein

inde

x

metabolite index

gene

inde

x BioS

yste

mat

icsT

M

Target andSystem information

Genes

Proteins

Metabolites

Clinical data

Genómica, proteómica y medicina 23

Existen pequeños dispositivos que son capaces de cuantificar 40-60 proteínas en líquidos fisio-lógicos (se han testado en saliva) que pueden ser prototipos de desarrollos posteriores (fig. 4). La propuesta de que deben desarrollarse test que evalúen 50-100 proteínas específicas de los distintos órganos, como forma de pre-guntarnos acerca del estado de salud en vez del estado de la enfermedad, está sin embar-go mucho más cerca. Las técnicas proteómicas más recientes, como el método MRM, ya son capaces de cuantificar 50-100 proteínas/ensayo en un breve tiempo y con gran sensibilidad y exactitud. Igualmente, la capacidad de obtener análisis detallados a partir de una única célula o un pequeño grupo de ellas (actualmente se está haciendo con 1.000 células) podrá ser real en un futuro próximo. El desarrollo de herra-mientas computacionales y matemáticas con capacidad de gestionar la dimensionalidad de los datos es una tecnología con un alto poder transformador. En los próximos 10 años vamos a disponer de millones de datos procedentes del genoma y proteomas de cada paciente. ¿Cómo reducir esa enorme cantidad de datos a hipótesis simples de salud y enfermedad? El

modo de correlacionar los datos genómicos y proteómicos con el fenotipo normal y asociado a cada enfermedad es un gran reto. Dónde y cómo se van a manejar informáticamente todos esos datos es actualmente un desafío y un tema para la reflexión. Hood considera que esta im-plementación abocará en una digitalización de la medicina, de forma similar a lo que ha ocurrido recientemente en el paso de la información ana-lógica a la digital. Es posible que la medicina se convierta así en una ciencia de la información.

Proteómica y medicina: el proyecto proteoma humano

En septiembre de 2010, dos centros indepen-dientes (The Institute for Systems Biology, en Seattle, Washington y el Swiss Federal Institute of Technology, ETH, en Zúrich) han anunciado oficialmente que han completado la primera fase para la generación de un mapa comple-to del proteoma humano, utilizando la espec-trometría de masas (MS) para la identificación

Figura 3. Descenso progresivo en el costo (en $) estimado para la determinación del genoma completo de un individuo.

3,0

2,5

2,0

1,5

1,0

0,5

0

$3B$20M

2006 2006 2006 2006 2006

$2M$5K $1K

20

15

10

5

0

$ M

illons

$ Bi

llons

1990 1992 1994 1996 1998 2000 2002 2004 2006 2008

9a edición del curso de Biotecnología Aplicada a la Salud Humana24

de las proteínas –estos datos están libremen-te accesibles a toda la comunidad científica en (www.srmatlas.org; www.peptideatlas.org–. Los investigadores han generado espectros de ma-sas (análisis que permite identificar cada proteí-na) de referencia para cada una de las proteínas correspondientes a los 20.300 genes humanos presentes en el genoma. Este mapa de refe-rencia permitirá a los investigadores de todo el mundo detectar y cuantificar cualquier proteína humana de cualquier muestra biológica (tejidos, células, líquidos fisiológicos). Se utilizan para ello técnicas específicas de MS, fundamentalmente SRM (Selected Reaction Monitoring), que per-miten detectar y cuantificar cada proteína indi-

vidual a partir de alguno de sus péptidos. Mo-ritz, Hood y Aebersold han generado más de 150.000 SRM que incluyen al menos 5 péptidos proteotípicos (específicos de cada proteína) para la identificación de las proteínas. Además, han dsarrollado ensayos de SRM específicos para todas las proteínas de membrana y todas las glucoproteínas con sitios de N-glucosilación. Este ingente trabajo supone un avance compa-rable al primer borrador del genoma humano, de forma que ahora las bases de datos con las proteínas son de libre acceso; el costo estimado ha sido de 5 millones de euros. El mapeo del genoma humano requirió 10 años y un costo de casi 3 billones de dólares; fue el origen de lo

Figura 4. A) La presencia de proteínas órgano-específicas en el plasma permite la obtención de perfiles proteicos asociados a la enfermedad. B) Representación esquemática de un nanochip para el análisis de proteínas plasmáticas.

Determinación de perfiles proteicos órgano-específicos (cerebro, hígado) en el plasma

Distinción salud/enfermedad

Eliminar células 300 nl de plasmaCuantificación de proteínas

Nanochips (microfluídica) para el análisis del plasma sanguíneo (proteínas)

B

A

Genómica, proteómica y medicina 25

que ahora comienza como Proyecto del Pro-teoma Humano (HPP), que se estima pueda es-tar completado en el año 2020. Con los datos, ahora públicos, se da un paso de gigante para reforzar el desarrollo de la MP porque facilita hacer el tipo de análisis de alto rendimiento (mi-les de proteínas de un individuo) que se requie-re en la MP o 4P. Pero el objetivo final del HPP no es tener un mero listado de proteínas, sino todas las posibles variantes de cada proteína (isoformas), su función, abundancia, localización subcelular y sus interacciones (redes y rutas de señalización). Casi un tercio de los 21.000 ge-nes del genoma humano no tiene una proteína conocida asociada y de los otros dos tercios no hay una información detallada. El HPP se propo-ne obtener esta información detallada y tener al menos una proteína correspondiente a cada gen humano. Es un objetivo complicado, por-que el proteoma es dinámico, está cambiando constantemente y las proteínas son modificadas de múltiples formas (fosforilación, glucosilación, acetilación, etc.) y en distintos tiempos. Además, se pretende tener una colección de anticuerpos específicos para cada una de las proteínas.

De cara al futuro inmediato, uno de los ma-yores desafíos es almacenar, manejar y controlar todos los datos que genera el HPP, especial-mente de forma integrada entre sí y con los datos genómicos. Es fundamental que presente utilidad práctica y, en especial, que proporcio-ne información útil para la medicina que pueda trasladarse rápidamente a la práctica clínica. No debe olvidarse que en último término son las proteínas (y no sólo los genes) las moléculas clave para el entendimiento de las enfermeda-des (y de la salud). Las proteínas son los con-tribuyentes fundamentales del fenotipo, y las enfermedades se refieren fundamentalmente al fenotipo y no al genotipo. Cualquier mejora e implementación en la medicina y en la MP de-pende de un mayor conocimiento de las proteí-nas y del proteoma humano que ahora empieza a desvelarse. Es importante recordar, además, que más del 90% de las dianas terapéuticas son proteínas, sobre las que actúan los fármacos.

Proteómica clínicaLa proteómica ofrece una información al-

tamente complementaria de la genómica; como la mayoría de las funciones biológicas las realizan las proteínas, la proteómica ofrece una nueva visión de la enfermedad. A pesar de su complejidad, el rápido y notable desa-rrollo en los últimos años ha conducido a su aplicación a los procesos patológicos o pro-teómica clínica, la cual se ocupa de la identifi-cación sistemática y exhaustiva, a gran escala, de patrones proteicos de enfermedad y de la aplicación de esos datos a los pacientes (estu-dio de la enfermedad, susceptibilidad, preven-ción, selección de terapias, seguimiento de los tratamientos, etc.). Entender, por ejemplo, las alteraciones tempranas en diversas enferme-dades (típicamente en cáncer o en el síndro-me coronario agudo), produciría una notable mejora en la prevención e identificación de pacientes con riesgo y/o en estado preclínico. La proteómica clínica pretende definir patro-nes de proteínas que puedan generar infor-mación de valor clínico acerca de la suscep-tibilidad, diagnóstico, pronóstico y terapia de la enfermedad; para que impacte de manera real en la mejora de la salud debe identificar y seleccionar patrones proteicos, validarlos en estudios poblacionales muy amplios y trasla-darlo a la práctica clínica. Entre sus objetivos, se encuentran los que siguen.

Identificación de biomarcado-res individuales

La búsqueda e identificación de biomarca-dores individuales se lleva a cabo siguiendo la metodología proteómica clásica de separa-ción de proteínas (2-DE, DIGE, cromatografía multidimensional y electroforesis capilar) y su identificación por espectrometría de ma-sas (MS, MALDI-TOF, ESI-Q-TOF o ESI-Trap, MALDI-TOF/TOF). Su estrategia fundamental es el análisis de la expresión diferencial de proteínas entre controles y muestras pato-

9a edición del curso de Biotecnología Aplicada a la Salud Humana26

lógicas (fig. 5), de proteomas completos (li-sados celulares) o subproteomas específicos (mitocondrias, membranas, etc.). Un aspecto fundamental es la determinación de las mo-dificaciones postraduccionales y su potencial implicación en patología. En muchos casos los biomarcadores se convierten simultáneamen-te en nuevas dianas terapéuticas.

Obtención de perfiles proteicos

Consiste en el estudio sistemático, a gran esca-la, de las proteínas de una muestra para la identi-ficación de patrones o perfiles proteicos (huellas dactilares proteicas), con carácter diagnóstico (discriminatorio) y/o pronóstico. Los escasos biomarcadores identificados y aprobados por la FDA en los últimos años son un reflejo de la es-

trategia habitual de testar una proteína individual, o llevar a cabo análisis en pequeña escala, etc. Aunque existen excepciones (paraproteínas de los mielomas, déficit de α-1-antitripsina) es muy posible que no existan marcadores únicos de las enfermedades complejas, por lo que la estrategia proteómica de estudiar paneles proteicos, supo-ne un paso cualitativo de gran trascendencia. Este estudio se puede realizar mediante, al menos, las tres estrategias que siguen.

Perfiles proteicos de plasma o suero

Se analiza el suero/plasma de los pacientes con la patología objeto de estudio (cardiovas-cular, neurodegenerativa, infecciosas, cáncer, etc.) y alternativamente en otros líquidos fisiológicos (lavado broncoalveolar, líquido cefalorraquídeo, orina). Se utiliza la técnica denominada SELDI-

Figura 5. Ejemplo de análisis proteómico de expresión diferencial mediante electroforesis bidimensional. La comparación entre las proteínas (manchas en la figura) del tejido sano (Normal) y patológico (RCC), permite detectar alteraciones en los niveles de expresión de varias proteínas (flechas en los paneles de la derecha)

Normal

RCC

Normal

RCC

Genómica, proteómica y medicina 27

TOF (Surface Enhanced Laser Desorption/Ionization-Time of Flight) para la generación de los perfiles proteicos, que combina la retención de las proteínas del suero en biochips con la de-terminación de sus masas moleculares mediante MS, permitiendo generar gráficos donde se re-presenta la abundancia frente a la masa molecu-lar de las proteínas, a modo de código de barras proteicos constituidos por miles de líneas que caracterizan el suero de cada individuo (fig. 6). Su poder discriminatorio es muy superior al de mar-cadores únicos con los que se han comparado (p. ej., PSA en cáncer de próstata, proteína C reac-tiva en infección e inflamación). Como el análisis mediante SELDI-TOF utiliza muy poca muestra (1 μl) y, además, es muy rápido (se pueden anali-zar cientos de muestras al día) y automatizado, su potencial en clínica analítica es enorme y puede ir sustituyendo muchas de las técnicas habituales de los laboratorios de bioquímica clínica (enzimo-inmunoanálisis), que son más lentos, más caros (utilizan anticuerpos marcados con sondas fluo-rescentes), precisan mayor cantidad de muestra y sólo informan de un único marcador, frente a los miles que proporciona el SELDI-TOF.

Perfiles proteicos de tejidos: MS-Imaging

En tejidos, pueden obtenerse perfiles o imáge-nes (mapas) bidimensionales de proteínas (MS-Imaging) aplicando directamente la MS sobre cortes histológicos del tejido (cortes habituales sobre portaobjetos para microscopia óptica, de 5-20 μm de grosor), utilizando el MALDI-TOF o el MALDI-TOF/TOF. El mapa bidimensional se consigue haciendo incidir el láser (que «barre» la superficie de la muestra) del espectróme-tro sobre los cortes histológicos y analizando las proteínas que son vaporizadas. Típicamente aparecen 500-1.000 señales de proteínas indivi-duales en cada punto del tejido, con masas en-tre 2-70 kDa. De esta forma se obtiene la masa (m/z) de las moléculas (péptidos, proteínas) presentes en cada zona del tejido. Seleccionan-do una masa dada (m/z) en los distintos espec-tros de las diferentes zonas, se genera un mapa

bidimensional de la distribución de esa proteína (esa m/z) a lo largo del corte de tejido (a modo de cartografía proteica). Se pueden conseguir dos tipos de datos: perfiles proteicos (mediante una adquisición puntual) e imágenes (barriendo todo el tejido con el láser) (fig. 7).

Las imágenes son generadas mediante un software específico que clasifica y agrupa las proteínas y compara diversas muestras, permi-tiendo obtener imágenes tridimensionales de la distribución de las proteínas del tejido. Esta tecnología implica un tipo de información to-talmente nuevo para la descripción, clasificación y caracterización de muestras histológicas que está permitiendo la identificación de biomarca-dores, la localización de proteínas específicas y, en el campo de la oncología, la reclasificación de tumores, por ejemplo.

Una técnica muy similar (SIMS-TOF, Secon-dary Ion Mass Spectrometry) permite el análisis (identificación y caracterización) de moléculas de bajo peso molecular presentes en la super-ficie de una muestra (determinación del meta-boloma) hasta los 1.500 Da. Esta limitación en el reducido rango de masas analizado es com-pensada en parte por la alta resolución obte-nida (subcelular ; hasta 200 nm/pixel) y por no necesitar la utilización de ningún tipo de matriz (evitando interferencia y deslocalización de las muestras: se usa el tejido directamente), lo que

Figura 6. Representación de perfiles proteicos obtenidos por SELDI-TOF.

Rela

tive

inte

nsity

3325.1 4303.1

5392.1

6593.8

3,000 4,000 5,000 7,0006,000

3325.44303.1

5392.1

6593.8

9a edición del curso de Biotecnología Aplicada a la Salud Humana28

la convierte en una herramienta muy valiosa en patología. Además, como ésta técnica se aplica para localizar y mapear en el tejido moléculas pequeñas, particularmente fármacos (y su co-localización con proteínas), es de gran interés para la industria farmacéutica.

Chips (arrays) de proteínas

La obtención de perfiles proteicos, tanto de suero (u otros líquidos fisiológicos) como de cé-lulas o tejidos, también puede obtenerse a partir de la utilización de chips (o micromatrices) de proteínas. Éstos pueden clasificarse según mu-

chos parámetros (modo de fabricación, quími-ca de la superficie, especificidad, densidad, etc.), aunque es mejor sistematizarlos en dos grandes grupos, según lo que capturan o analizan.

Chips analíticos

Se utilizan para determinar las proteínas pre-sentes en una muestra (perfil de expresión) y su cuantificación. La disolución de la mezcla de proteínas a analizar se aplica sobre el chip, que contiene agentes de captura que actúan como sondas. Los agentes de captura más conocidos son los anticuerpos (Ab) en sus distintas moda-

Figura 7. Flujo de trabajo en el análisis de tejidos mediante MS-Imaging.

MS/MS spectrum

Mass spectra for each xy coordinate

Single m/z values Biocomputational analysis

Class A Class B0% 100%

Peptide fragments

Database search

Protein identification Protein images Classification images

Tandem MS

Tissue slide

Matrix application

Laser ablation

MS

Laser

Genómica, proteómica y medicina 29

lidades: monoclonales completos, Fab, scFv, afi-bodies (Ab sintéticos), dominios de Ab, etc. La utilización de Ab no está exenta de problemas: inespecificidad, reacciones cruzadas, orientación, afinidad, etc. Otra alternativa son los chips de antígeno para analizar el perfil sérico de Ab (y autoAb en enfermedades autoinmunes), como los chips de alérgenos para la detección de IgEs en respuestas alérgicas.

Recientemente se está generando una plétora de agentes de captura distintos a los Ab, como péptidos, moléculas orgánicas, polímeros sin-téticos, oligonucleótidos, aptámeros, ribozimas, trinectinas (derivados de la fibronectina), MIP (molecular imprinted polymers: compuestos que se polimerizan sobre las proteínas creando mol-des para su uso posterior), etc. A pesar de ésta diversidad, la captura de las proteínas (y los mé-todos de detección) constituye el gran problema de los chips proteicos: no existen todavía agentes de captura de alta calidad que puedan inmovili-zarse en la superficie de un chip y que permitan unir, detectar y cuantificar una mezcla compleja de proteínas. Este problema está retrasando no sólo el desarrollo de los chips proteicos sino de la industria proteómica en general.

Los chips de fase reversa son de especial re-levancia en medicina porque permiten determi-nar las proteínas implicadas en las rutas de seña-lización celular en las biopsias de los pacientes. En ellos, las biopsias (típicamente de tumores o cardiacas) se lisan y se depositan en dilucio-nes sucesivas como microgotas (utilizando los mismos robots que para la fabricación de los chips de ADN); posteriormente, son revelados con Ab validados (que reconocen proteínas fos-foriladas y cinasas, a fin de determinar el grado de activación de las diferentes rutas de señali-zación), obteniéndose información cualitativa y cuantitativa para cada paciente, lo que permite un tratamiento personalizado; actualmente exis-ten más de 1.000 Ab validados. Mediante estos arrays puede determinarse simultáneamente el estado de fosforilación de las proteínas impli-

cadas en las principales rutas de señalización intracelular. La utilización de los arrays de fase reversa permite así, obtener un tipo de infor-mación molecular único e individualizado de cada muestra y, por tanto, de cada paciente. Este nuevo tipo de array proporciona perfiles de señalización intracelular, incluyendo las modi-ficaciones postraduccionales, datos que no son accesibles mediante técnicas genómicas.

Chips funcionales

Se utilizan para determinar actividades bio-químicas e interacciones moleculares. Las pro-teínas de interés se inmovilizan en el chip y se analizan sus funciones biológicas e interacciones incubándolas con distintas moléculas (otras proteínas, metabolitos, sustratos de enzimas, ADN, etc.). Los dos problemas principales de estos chips son la producción de colecciones extensas de proteínas y su mantenimiento en forma activa en el chip. Sin embargo, para gru-pos de proteínas con características funcionales similares (factores de trascripción, receptores, cinasas) hay un gran campo por desarrollar en clínica humana.

ReferenciasAuffray C, Chen Z, Hood L. Systems medicine: the fu-

ture of medical genomic healthcare. Genome Med. 2009;1:2.

Personalized Medicine Coalition. The case for personali-zed medicine, 2009. USA. (www.personalizedmedici-necoalition.org).

Genomic Medicine, vol 1. Report of Science and Tech-nology Committee. House of Lords, 2009. London (http://www.parliament.uk/hlscience/).

Hamburg MA, Collins FS. The path to personalized me-dicine. N Engl J Med. 2010;363(4):301-4.

Evans JP, Dale DC, Fomous C. Preparing for a consumer-driven genomic age. N Engl J Med. 2010;363:1099-103.

Lotta LA. Genome-wide association studies in athero-trombosis. Eur J Int Med. 2010;21:74-8.

Focus on cancer proteomics. Nat Rev Cancer. 2010, septiembre;10:605-60.

Van Eyk J, Dunn M, editores. Clinical proteomics. From diagnosis to therapy. Wiley-VCH; 2008.