junio, 2020 - ujaen.es
TRANSCRIPT
Facultad d
e C
iencia
s E
xperi
menta
les
UNIVERSIDAD DE JAÉN Facultad de Ciencias Experimentales
Trabajo Fin de Grado
Alumno: Gloria Mª Chacón Ramírez
Junio, 2020
Estudio de alteraciones de la reproducción mediante
análisis informacional y de estructura de redes
2
Trabajo Fin de Grado
ESTUDIO DE ALTERACIONES DE LA
REPRODUCCIÓN MEDIANTE ANÁLISIS
INFORMACIONAL Y DE ESTRUCTURA
DE REDES
Alumno: Gloria Mª Chacón Ramírez
Jaén y Junio, 2020
3
ÍNDICE
ABSTRACT ........................................................................................................ 5
RESUMEN ......................................................................................................... 5
1. INTRODUCCIÓN............................................................................................ 6
1.1 Endometriosis ........................................................................................... 6
1.1.1 Definición ............................................................................................ 6
1.1.2 Prevalencia e incidencia ..................................................................... 6
1.1.3 Etiología .............................................................................................. 7
1.1.4 Tratamiento ......................................................................................... 8
1.1.5 Aspectos moleculares ....................................................................... 10
1.2 Biología de Sistemas .............................................................................. 12
2. OBJETIVOS ................................................................................................. 15
3. MATERIAL Y MÉTODOS ............................................................................. 16
3.1 Esquema general .................................................................................... 16
3.2 Obtención de datos ................................................................................. 17
3.2.1 Búsqueda de publicaciones .............................................................. 17
3.2.2 Recopilación de genes implicados en endometriosis........................ 17
3.3 Procesamiento de datos ......................................................................... 18
3.3.1 Análisis bibliométrico ........................................................................ 18
3.3.2 Redes biológicas............................................................................... 18
3.4 Construcción de mapas y redes .............................................................. 19
3.4.1 Mapa bibliométrico de autores .......................................................... 19
3.4.2 Mapa de palabras clave .................................................................... 19
3.4.3 Red de interacción proteína-proteína ................................................ 20
3.4.4 Red de expresión génica .................................................................. 20
3.5 Valoración del índice h ............................................................................ 21
4. RESULTADOS ............................................................................................. 23
4.1 Análisis bibliométrico ............................................................................... 23
4.1.1 Búsqueda de publicaciones .............................................................. 23
4.1.2 Mapa bibliométrico de autores .......................................................... 24
4.1.3 Mapa de palabras clave .................................................................... 25
4.1.4 Análisis del índice h .......................................................................... 26
4.2 Análisis de redes biológicas .................................................................... 28
4.2.1 Procesamiento de datos ................................................................... 28
4.2.2 Red de interacción proteína-proteína ................................................ 28
4
4.2.1 Red de expresión génica .................................................................. 31
5. DISCUSIÓN ................................................................................................. 32
6. CONCLUSIONES ......................................................................................... 37
7. BIBLIOGRAFÍA ............................................................................................ 38
8. ANEXO I ....................................................................................................... 43
5
ABSTRACT
Endometriosis is a gynecological disorder characterized by the presence of
endometrial tissue in extrauterine locations. This disease has a high prevalence
in reproductive age women given its dependence on estrogens. The etiology and
pathogenesis of this disease remain both uncertain. In this work, the genetics of
endometriosis has been studied from the global approach of Systems Biology, by
means of a bibliometric analysis and the study of biological networks (protein-
protein interaction and gene expression networks). After carrying out this study,
it was found that the proteins involved in this disease were related to: proliferation,
apoptosis, adhesion and invasion, angiogenesis and alteration of immune
function. Additionally, the most relevant genes were identified, all of them related
to carcinogenesis. In conclusion, our results give us an idea of the molecular
events that contribute to the development of this disease.
Keywords: Endometriosis – Systems Biology – Bibliometric analysis – Protein-
protein interaction - Genetic interaction – Biological networks
RESUMEN
La endometriosis es un trastorno ginecológico que se caracteriza por la
presencia de tejido endometrial en ubicaciones extrauterinas. Esta afección tiene
una alta prevalencia en mujeres en edad reproductiva puesto que es dependiente
de estrógenos. La etiología y la patogénesis de esta enfermedad siguen siendo
inciertas. En este Trabajo de Fin de Grado se ha estudiado la genética de la
endometriosis desde el enfoque global de la Biología de Sistemas, mediante la
realización de un análisis bibliométrico y el estudio de redes biológicas (redes de
interacción proteína-proteína y de expresión génica). Tras la realización de este
estudio se vio que las proteínas implicadas en la endometriosis estaban
relacionadas con: proliferación, apoptosis, adhesión e invasión, angiogénesis y
alteración de la función inmune. Asimismo, se identificaron los genes más
relevantes, todos ellos relacionados con la carcinogénesis. En definitiva, esto
nos da una idea de los eventos moleculares que contribuyen al desarrollo de esta
enfermedad.
Palabras clave: Endometriosis – Biología de Sistemas – Análisis bibliométrico
– Interacción proteína-proteína - Interacciones génicas – Redes biológicas
6
1. INTRODUCCIÓN
1.1 Endometriosis
1.1.1 Definición
La endometriosis se define como la presencia de tejido endometrial fuera
de la cavidad uterina (Burney y Giudice, 2012; Vercellini et al., 2014). Esta
enfermedad peritoneal es dependiente de estrógenos y se cree que deriva de la
menstruación retrógrada de células y tejidos endometriales, que se implantan en
las superficies peritoneales, provocando una respuesta inflamatoria (Giudice,
2010). Se trata de una enfermedad muy común que afecta a entre un 6-10% de
la población femenina (Bulletti et al., 2010). Los principales síntomas son el dolor
pélvico y la infertilidad (Olive y Pritts, 2001). En cuanto al diagnóstico, el test de
referencia es la inspección visual de la pelvis a través de laparoscopia (Kennedy
et al., 2005). Sin embargo, el diagnóstico definitivo de la endometriosis se asocia
con un retraso medio de en torno a 7 años desde que aparecen los síntomas
(Bougie et al., 2019).
1.1.2 Prevalencia e incidencia
La prevalencia de la endometriosis en mujeres en edad reproductiva es
de aproximadamente el 10% (Ballard et al., 2016). En mujeres que presentan
dolor y/o infertilidad, la frecuencia es del 35 al 50%. Alrededor del 25 al 50% de
las mujeres infértiles tienen endometriosis, y del 30 al 50% de mujeres enfermas
de endometriosis son infértiles (Bulletti et al., 2010).
La incidencia anual de la endometriosis es del 0,1% entre mujeres de 15
a 49 años (Vercellini et al., 2014). Más específicamente, la incidencia es mayor
entre mujeres de 25-29 años y menor entre mujeres mayores de 44 años, ya que
es una afección dependiente de estrógenos (Missner et al., 2004; Burney y
Giudice, 2012).
7
1.1.3 Etiología
La patogénesis de la endometriosis per se es incierta y controvertida (Kao
et al., 2003; Viganò et al., 2004). Debido a la complejidad que presenta, no existe
consenso sobre el origen de la endometriosis, de manera que se han postulado
varias teorías que intentan explicar la patogenia de esta enfermedad, de entre
las cuales la predominante es la de la menstruación retrógrada (Burney y
Giudice, 2012; Olive y Pritts, 2001). Algunos factores importantes en la posible
explicación de la patogénesis comprenden anomalías inmunológicas,
alteraciones endometriales y disfunción peritoneal (Olive y Pritts, 2001).
En primer lugar, el mecanismo de histogénesis de la teoría de
implantación o teoría de Sampson, establece que las lesiones endometrióticas
surgen del reflujo de tejido endometrial regurgitado durante la menstruación a
través de las trompas de Falopio, que posteriormente se implantaría en la
superficie endometrial u órganos pélvicos (Viganò et al., 2014). La unión de las
células endometriales desprendidas requiere la expresión de moléculas de
adhesión y sus correceptores, junto con factores de acomodación que permitan
la persistencia de las lesiones endometrióticas (Lebovic et al., 2001). El aumento
de volumen de líquido menstrual retrógrado aumenta el riesgo de implantación
de las lesiones. La teoría de Sampson también está apoyada por la observación
de factores que obstruyen la menstruación (Sourial et al., 2014). Esta hipótesis
ha sido probada para la endometriosis peritoneal y ovárica (Maruyama et al.,
2012; Hufnagel et al., 2015) y también explica cómo se originan los
endometriomas ováricos (Maruyama et al., 2012).
Por su parte, la teoría de la metaplasia celómica afirma que las lesiones
endometrióticas se originan cuando las células mesoteliales o celómicas del
peritoneo sufren metaplasia, siendo estimulada por factores hormonales o
inmunológicos (Leyland et al., 2010; Sourial et al., 2014). Esta teoría explica la
manifestación de endometriosis en adolescentes (Maruyama et al., 2012). La
formación del endometrioma y la endometriosis ovárica pueden surgir de la
metaplasia del epitelio celómico (Nisolle y Donnez, 1997).
8
Una ampliación de la anterior es la teoría de la inducción, que propone
que factores endógenos, bioquímicos o inmunológicos pueden inducir la
diferenciación de células indiferenciadas en tejidos endometriales (Vinatier et al.,
2001; Maruyama et al., 2012).
También, la teoría de los restos embrionarios sugiere que las células
residuales de la migración embrionaria del conducto de Müller son capaces de
convertirse en lesiones endometrióticas influidas por la presencia de estrógenos
(Burney y Giudice, 2012). Esta teoría explica los casos de endometriosis que se
han diagnosticado en hombres (Maruyama et al., 2012), cuya incidencia es
extremadamente rara (Jabr y Mani, 2004).
Una nueva hipótesis respalda que las células madre endometriales
pueden dar lugar a endometriosis. La evidencia sostiene la participación de las
células madre o progenitoras en la regeneración y diferenciación endometrial.
Esta teoría explica los casos excepcionales de endometriosis en sitios distantes
(Maruyama et al., 2012).
Por último, otra teoría, la de la metástasis benigna, postula que los
implantes endometrióticos resultan de la diseminación linfática o hematógena de
las células y tejidos endometriales (Burney y Giudice, 2012).
1.1.4 Tratamiento
Los enfoques terapéuticos, lejos de ser curativos, se encargan de paliar
los síntomas de la enfermedad en lugar de luchar contra esta. El tratamiento a
largo plazo consiste en continuos ciclos de terapia médica, quirúrgica o ambas
(Bulletti et al., 2010; Giudice, 2010).
En primer lugar, la terapia médica consiste en el alivio del dolor a través
de una serie de mecanismos que incluyen minimizar la inflamación, interrumpir
o suprimir la producción de hormonas ováricas, inhibir la acción y la síntesis de
estradiol y reducir o eliminar la menstruación (Giudice, 2010).
En cuanto a terapia médica, los medicamentos inflamatorios no
esteroideos (AINEs) son el tratamiento de primera línea (Olive y Pritts, 2011;
9
Kennedy et al., 2005). Los agonistas de la hormona liberadora de gonadotropinas
o GnRH resultan en un estado hipoestrogénico, atrofia endometrial y amenorrea,
con lo cual se recomienda su uso con terapias adicionales de estrógeno-
progestágeno (Giudice, 2010). Los anticonceptivos orales junto con bajas dosis
de monofásicos combinados de progestinas han demostrado buena eficacia
(Vercellini et al., 2014; Kennedy et al., 2005). El tratamiento exclusivo de
progestágenos puede ser mejor que el de anticonceptivos orales combinados
(Falcone y Flyckt, 2018).
Asimismo, la terapia quirúrgica se utiliza para tratar la endometriosis y
puede ser conservadora o definitiva. La cirugía conservadora tiene como objetivo
eliminar todas las lesiones endometrióticas y restaurar la anatomía pélvica
alterada. Por otro lado, la cirugía definitiva es de carácter extirpativo (Olive y
Pritts, 2001). El tratamiento quirúrgico es efectivo en cuanto a infertilidad, dolor
crónico o quistes ováricos (Falcone y Flyckt, 2018). La laparoscopia es la ruta
preferida para el tratamiento de la endometriosis y de la infertilidad debido a la
mejor visualización de las lesiones y mayor rapidez en la recuperación (Leyland
et al., 2010).
En las mujeres afectadas de endometriosis, la infertilidad es consecuencia
de la inflamación pélvica, las adherencias que alteran la anatomía pélvica y las
moléculas inflamatorias que crean un entorno adverso para la implantación
(Vercillini et al., 2014). El tratamiento de la infertilidad incluye el restablecimiento
de las relaciones anatómicas de la pelvis mediante cirugía y las técnicas de
reproducción asistida (Olive y Pritts, 2001). La laparoscopia es el enfoque
quirúrgico de referencia (Leyland et al., 2010). En pacientes con endometriosis
avanzada, la normalización de la anatomía distorsionada mejora la concepción,
mientras que en endometriosis mínima-leve la ablación de las lesiones mejora la
fertilidad (Ozkan et al., 2008).
Además, la infertilidad puede tratarse con técnicas de reproducción
asistida (Olive y Pritts, 2001). La inducción de la ovulación o estimulación ovárica
resulta efectiva para aumentar la fertilidad (Olive y Pritts, 2001). La fecundación
in vitro con transferencia embrionaria (FIV-ET) es una técnica efectiva que podría
ser la mejor opción (Bulletti et al., 2010). La fecundación in vitro (FIV) es
10
apropiada si la función tubárica está comprometida, si existe infertilidad por factor
masculino y/o han fracasado otros tratamientos, aunque esta técnica presenta
tasas de éxito inferiores en pacientes con endometriosis (Vercellini et al., 2014).
La inseminación intrauterina (UIU) junto con estimulación ovárica mejora la
infertilidad en la endometriosis mínima leve y es una buena opción cuando la
endometriosis ha sido previamente subsanada mediante cirugía (Ozkan et al.,
2008).
1.1.5 Aspectos moleculares
La patogénesis de la endometriosis es compleja y multifactorial, de
manera que implica componentes hormonales, genéticos, inmunes y
ambientales (Sourial et al., 2014). Desde un punto de vista patogenético, se han
identificado alteraciones moleculares que favorecen la implantación de
endometrio eutópico y/o ectópico tales como: moléculas apoptóticas, moléculas
de adhesión, factores de crecimiento, factores angiogénicos y mecanismos
involucrados en la alteración del sistema inmunitario (Viganò et al., 2004). A
pesar de todos los avances, la fisiopatología subyacente de la endometriosis
sigue siendo desconocida (Aznaurova et al., 2014).
Primeramente, la influencia de una alteración genética sobre la tendencia
a implantarse de las células endometriales puede ser hereditaria, puesto que se
ha establecido un componente genético de la endometriosis (Burney y Giudice,
2012). Se ha propuesto la hipótesis de que algunos cambios endometriales
podrían requerir de genes específicos, aunque las mutaciones somáticas
podrían aparecer como un segundo acontecimiento (Viganò et al., 2014). La
endometriosis posee un modo de herencia poligénico (múltiples loci) (Sourial et
al., 2014). Se han descrito varios genes regulados epigenéticamente en el
endometrio. Estas modificaciones epigenéticas llevarían a cambios funcionales
en el endometrio, alterándose y produciendo enfermedad (Altmäe et al., 2014).
Por último, existen algunos microRNAs (miRNAs) que desempeñan un papel
crucial en las actividades endometriales, relacionándose algunos de ellos con la
endometriosis (Aznaurova et al., 2014).
11
En adición, una disfunción inmunitaria también se ha relacionado con el
desarrollo de la endometriosis (Viganò et al., 2004). Las vías de señalización
implicadas en esta afección se dividen en proliferación y apoptosis, adhesión e
invasión, angiogénesis y función inmune (Aznaurova et al., 2014).
La endometriosis se contempla como una afección inflamatoria pélvica
(Burney y Giudice, 2012) en la que el sistema inmune ha de estar predispuesto
para posibilitar el desarrollo de lesiones endometrióticas (Aznaurova et al.,
2014). La regurgitación de las células endometriales inicia una respuesta
inflamatoria. Esta respuesta inflamatoria origina una “vigilancia inmunológica
deficiente” que imposibilita la eliminación de los desechos menstruales y
favorece la implantación y crecimiento de células endometriales en lugares
ectópicos (Sourial et al., 2014). Una desregulación en el sistema inmune conduce
a la propensión a la implantación y al desarrollo de las lesiones endometrióticas
(Burney y Giudice, 2012).
La apoptosis interviene en el mantenimiento de la homeostasis celular,
eliminando las células decrépitas de la capa funcional del endometrio. A
continuación, tiene lugar una proliferación de nuevas células de la capa basal.
En las mujeres con endometriosis, esto se ve perturbado, reduciéndose el
número de células que sufren esta muerte celular programada y elevándose el
número de células supervivientes (Viganò et al., 2004). Es fundamental que se
favorezca el fenotipo antiapóptótico y pro-proliferativo para el establecimiento de
depósitos ectópicos y el sostenimiento de las lesiones. La retracción de la muerte
celular programada se encuentra regulada por la activación de genes que
impulsan la inflamación, angiogénesis y proliferación celular (Sourial et al.,
2014).
Un carácter innato o adquirido del peritoneo puede incitar a la unión e
invasión transmesotelial por las células endometriales regurgitadas. El efluente
menstrual resulta perjudicial sobre el mesotelio y puede promover la
implantación, incitando a que se produzca una lesión (Burney y Giudice, 2012).
Para que tengan lugar las lesiones, las células han de invadir e implantarse
(Aznaurova et al., 2014).
12
La angiogénesis resulta un factor clave para la supervivencia y el
desarrollo de las lesiones endometrióticas (Aznaurova et al. 2014). La
vascularización es uno de los procesos primordiales para que tenga lugar la
invasión (Viganò et al., 2004). La neoangiogénesis y la incorporación de soporte
vascular se relacionan con las lesiones endometrióticas. Asimismo, la
angiogénesis suele ir acompañada de una neuroangiogénesis, que consiste en
el acompañamiento de nervios junto con los capilares, lo que contribuye al dolor
(Burney y Giudice, 2012).
Por último, una alteración hormonal puede respaldar la capacidad que
tienen las células endometriales para extenderse, unirse al mesotelio y/o escapar
del aclaramiento inmunomediado (Burney y Giudice, 2012). Las hormonas
esteroideas tienen un papel central en la endometriosis (Sourial et al., 2014). La
progesterona endometrial se caracteriza por la inhibición de la proliferación
estrógeno-dependiente de las células epiteliales, la maduración endocrina de las
glándulas y la conversión a células deciduales (Vercellini et al., 2014). La
resistencia a la progesterona determina la aparición de endometriosis (Viganò et
al., 2004). La aromatasa es una enzima que cataliza el paso limitante de la
biosíntesis de estrógenos, y cuya expresión anormal podría verse implicada en
la patogenia de la endometriosis (Viganò et al., 2004).
1.2 Biología de Sistemas
En relación al enorme progreso de la genética, la bioquímica y la biología
molecular, durante el siglo XX se permitió que tuviera lugar la revolución
científica del ADN. La finalización del Proyecto Genoma Humano promovió
mejoras tecnológicas. Por un lado, se acogieron las llamadas tecnologías
“-ómicas” que permitieron la generación de gran cantidad de datos biológicos.
(Medina, 2013). “-Ómica” hace referencia a la aplicación de técnicas de alto
rendimiento que analizan los cambios en el conjunto de genes (genoma),
modificaciones epigenéticas (epigenoma), transcritos (transcriptoma), proteínas
(proteoma) o metabolitos (metaboloma) en una muestra biológica (Altmäe et al.,
2014). Por otro lado, se han desarrollado nuevas herramientas computacionales
13
que han hecho posible gestionar los datos masivamente adquiridos (Medina,
2013). La biología molecular ha descubierto una multitud de hechos biológicos,
pero esto no es suficiente para comprender los sistemas biológicos (Kitano,
2002).
La integración de las técnicas “-ómicas” se conoce como “Biología de
Sistemas” (Altmäe et al., 2014). El desarrollo de las “-ómicas” y la bioinformática
se reconocen como la fuerza impulsora de la Biología de Sistemas (Simpson,
2016). La Biología de Sistemas se define en un sentido global como una
interdisciplina que defiende que las propiedades de los sistemas no pueden
reducirse a las de sus partes constituyentes (Medina, 2013). La Biología de
Sistemas lleva implícita la intención de estudiar a los organismos como una red
de partes que interaccionan entre sí y la validación de que los sistemas
biológicos complejos son dinámicos y que su comportamiento difiere en
condiciones variables (Simpson, 2016). La Biología de Sistemas ha surgido
como un enfoque sistémico para la gestión de la ingente cantidad de datos
proporcionados por la aplicación de las “-ómicas” y los grandes proyectos
genómicos (Medina, 2013), permitiendo así la incorporación de los métodos
clásicos y de alto rendimiento (Chuang et al., 2010).
La biología cuantitativa y holística de sistemas aplicada a la enfermedad
proporciona un enfoque único, permitiendo aprovechar al máximo el conjunto de
datos disponibles que se pueden usar para modelar predictivamente la expresión
de la enfermedad (Loscalzo y Barabassi, 2011). Un campo de la ciencia
cuantitativa es la bibliometría evaluativa, que determina la productividad en la
investigación empleando para ello métodos como el análisis de citas (Brandt et
al., 2019). Estos métodos se utilizan para evaluar publicaciones científicas dentro
de una especialidad. Los estudios bibliométricos son útiles para estimar la
importancia social y científica de una disciplina científica. Como herramientas
objetivas, pueden usarse para producir una valoración imparcial de la actividad
científica y su posible evolución y tendencias (Palacios et al., 2019).
Los avances recientes en técnicas de alto rendimiento (Chin et al., 2014),
junto con la caracterización morfofuncional de proteínas y metabolitos,
proporcionan una gran cantidad de información con un muy alto potencial para
14
esclarecer la complicada interacción de las redes moleculares que subyacen a
la función de un organismo en la salud y en la enfermedad (Altmäe et al., 2014).
La representación en forma de red constituye una forma útil de mostrar distintos
tipos de datos biológicos que engloban las interacciones proteína-proteína, las
regulaciones genéticas, las vías celulares y las transducciones de señales (Chin
et al., 2014). El estudio de redes requiere un enfoque sistémico y se puede incluir
en el marco de la Biología de Sistemas (Medina, 2013). Una extensión de esta
perspectiva es el reconocimiento de que los módulos de enfermedades son
interdependientes. Un módulo de enfermedad representa una subred en la red
molecular global que revela un conjunto de interacciones que contribuyen a un
fenotipo anómalo cuando algunos de sus componentes son disfuncionales
(Loscalzo y Barabasi, 2011).
El análisis de “-ómicas” bajo un enfoque de Biología de Sistemas puede
ser utilizado en la búsqueda de genes, identificación de biomarcadores,
clasificación y recurrencia de enfermedades, hallazgo de fármacos, estrategias
terapéuticas y en medicina predictiva y preventiva, entre otras aplicaciones
(Altmäe et al., 2014). Es indispensable un análisis más mecanicista basado en
sistemas para elucidar relaciones más complejas que involucren multitud de
genes para el descubrimiento de fármacos, el diseño de múltiples terapias
farmacológicas y rutas genéticas terapéuticas (Kitano, 2002). Otro objetivo es la
identificación de biomarcadores como grupos de genes o proteínas cuya
expresión explique las diferencias fenotípicas entre las distintas poblaciones de
pacientes. Estos marcadores proporcionan una fuerte interpretación biológica
que permite asociar un perfil de expresión con una enfermedad en particular
(Chuang et al., 2010). Las ventajas de utilizar un enfoque holístico basado en la
red hacen posible mover la medicina desde un campo reduccionista a otro que
contempla el poder de las redes moleculares sobre las que se basa la biología
humana para determinar la cura de las enfermedades (Loscalzo y Barabasi,
2011). En un futuro inmediato, el concepto emergente de medicina de red
proporcionará aportaciones de Biología de Sistemas que repercutirán sobre la
medicina molecular favoreciendo el establecimiento de la llamada nueva
Medicina de las 4P: predictiva, preventiva, personalizada y participativa (Medina,
2012).
15
2. OBJETIVOS
El principal objetivo que ha llevado a la realización del presente Trabajo
de Fin de Grado es estudiar, mediante un enfoque de Biología de Sistemas, el
componente del genoma que subyace a la etiología de la endometriosis, aún
desconocida dada la complejidad intrínseca de esta enfermedad.
Del planteamiento de este objetivo principal se derivan una serie de
objetivos específicos:
1. Aprender a utilizar las herramientas bioinformáticas propias de la Biología
de Sistemas.
2. Evaluar el estado actual de la genética de la endometriosis a través de un
análisis bibliométrico (autores destacados y términos más recurrentes en
publicaciones).
3. Analizar el impacto de los autores que publican sobre esta enfermedad.
4. Estudiar las redes de interacción proteína-proteína y de interacción
génica, a través del empleo de programas computacionales.
5. Integrar los conocimientos que se han ido adquiriendo durante el
transcurso del Grado.
16
3. MATERIAL Y MÉTODOS
3.1 Esquema general
El procedimiento secuencial que seguimos para la realización de este
Trabajo se muestra en la Figura 1. Esta figura nos proporciona una visión global
de lo que seguidamente desarrollaremos.
Figura 1. Esquema general del trabajo para el estudio de la endometriosis mediante un enfoque de Biología
de Sistemas. En rojo se muestran las etapas que se han seguido en este Trabajo de Fin de Grado; en azul,
las plataformas empleadas para cada tipo de análisis (tanto bases de datos como software) y, por último,
en naranja, los dos análisis en torno a los que se ha llevado a cabo este estudio.
17
3.2 Obtención de datos
La obtención de datos supone uno de los pilares de este Trabajo de Fin
de Grado y para la consecución de los mismos se utilizaron una serie de bases
de datos públicas que se irán detallando en cada uno de los subapartados
siguientes.
3.2.1 Búsqueda de publicaciones
Nuestro material de estudio se obtuvo de PubMed, que constituye un
motor de búsqueda gratuito, se trata de una base de datos de literatura
biomédica. Los términos de búsqueda que se utilizaron fueron los términos
MeSH (el acrónimo en inglés de Medical Subjects Headings) siguientes:
"endometriosis" AND ("genetics" OR "genes" OR "genome"). Con estos criterios
se recopilaron los artículos correspondientes al período comprendido entre 1957
hasta noviembre de 2019. Se incluyeron todas las publicaciones que resultaron
de esta búsqueda, sin aplicar restricciones.
3.2.2 Recopilación de genes implicados en endometriosis
Con el fin de obtener todos los genes que pueden estar implicados en
endometriosis se utilizó la base de datos Phenopedia, que es una extensión de
HuGE Navigator (Yu et al., 2010). Phenopedia nos ofrece una visión de la
enfermedad que se centra en los resultados procedentes de estudios de
asociación genética (conocidos como GWAS, siglas en inglés de Genome Wide
Association Studies). Para realizar una búsqueda basta con introducir el término
de una enfermedad concreta y el sistema asigna el texto de búsqueda a posibles
términos MeSH. Así, el sistema realiza una búsqueda multinivel en diferentes
bases de datos recopilando estudios de asociación genética basados en una
enfermedad específica (Yu et al., 2010), en nuestro caso la endometriosis.
18
3.3 Procesamiento de datos
3.3.1 Análisis bibliométrico
Previa construcción de redes bibliométricas es necesario procesar los
datos que se obtuvieron de la búsqueda de publicaciones en PubMed. Debido a
que el software que se utilizará como herramienta para la construcción de la red
del análisis bibliométrico lo precisa, los datos correspondientes a los artículos
recopilados en Pubmed se descargaron en formato MEDLINE, que es una base
de datos bibliográfica producida por la National Library of Medicine (NLM)
compilada en PubMed.
3.3.2 Redes biológicas
Como se ha comentado anteriormente, para la búsqueda de genes
implicados en la endometriosis utilizamos Phenopedia, que resume en formato
tabular los genes en relación con una enfermedad concreta, es decir, se presenta
una tabla con la lista de genes implicados en dicha afección en orden
descendente de la asiduidad con la que se ha estudiado su contribución a la
enfermedad (Yu et al., 2010).
Para facilitar el análisis, dado el gran número de genes que aparecen en
Phenopedia para la endometriosis, y antes de volcarlos para la construcción de
redes, se filtraron dichos resultados. Dado que esta plataforma nos provee del
nombre de cada gen y el número de publicaciones en las que aparece el mismo,
se procedió al cálculo de la media de publicaciones y se continuó el análisis
exclusivamente con los genes que superaban este valor medio.
19
3.4 Construcción de mapas y redes
3.4.1 Mapa bibliométrico de autores
En cuanto al mapa bibliométrico de autores, este se obtuvo empleando
VOSviewer. VOSviewer es una herramienta de software para construir y
visualizar redes bibliométricas (Van Eck y Waltman, 2010). Este programa se
enfoca en el análisis a nivel agregado; además, posee una técnica de
agrupamiento particular que establece la relación entre publicaciones acorde a
las relaciones de citas directas (Van Eck y Waltman, 2017). Por tanto, para la
construcción de mapas, VOSviewer se basa en datos de co-citación para llevar
a cabo el desarrollo de mapas basados en datos de coincidencia. Este software
utiliza la técnica de mapeo VOS, donde VOS significa mapeo de similitudes. Con
este programa informático se construyó un mapa de distancia en el que la
distancia entre dos términos refleja la fuerza de relación entre los mismos (Van
Eck y Waltman, 2010).
Para este caso concreto, el mapa bibliométrico de autores consiste en una
serie de nodos que se corresponden con el nombre de los mismos, conectados
todos ellos a través de un entramado que se basa en datos de coautoría, los
cuales se obtienen a partir de un análisis de las citas introducidas que realiza el
mismo software (Van Eck y Waltman, 2019).
3.4.2 Mapa de palabras clave
Para la construcción del mapa de términos, al igual que en el apartado
anterior, se utilizó VOSviewer. Este software puede utilizarse para realizar mapas
de palabras clave basados en datos de concurrencia (Van Eck y Waltman, 2010).
Para crear esta visualización, se analizan los títulos y resúmenes mediante
utilización de técnicas de procesamiento del lenguaje, identificando así los
términos que aparecen de forma recurrente en el título y resumen de la
publicación. Estos vocablos se visualizan en el mapa de palabras clave, lo que
nos indica los temas que cubre cada clúster (Van Eck y Waltman, 2017).
20
3.4.3 Red de interacción proteína-proteína
STRING es una base de datos cuyo fin es recopilar, calificar e integrar
toda la información de interacción proteína-proteína y suplementarla con
predicciones informatizadas en forma de red (Szklarczyk et al., 2019). La
finalidad de esta herramienta es obtener una red global integral y objetiva que
aúne tanto interacciones directas (físicas) como indirectas (funcionales).
STRING se dedica al estudio de las interacciones proteicas en el sentido más
amplio, incorporando interacciones primarias y pronosticadas (Szklarczyk et al.,
2019). Esta base de datos será la que utilicemos para la construcción de nuestra
red de interacción proteína-proteína.
En primer lugar, para llevar a cabo la construcción de la red, se importaron
en STRING los genes filtrados obtenidos de Phenopedia. Se modificaron
algunos de los parámetros asignados por defecto para simplificar la visualización
e interpretación de la red. Concretamente, se eliminó la asociación por
“Textmining” (minería de texto). A través de este parámetro, la plataforma
STRING identifica las principales proteínas relacionadas con un tema (en este
caso enfermedad) y conectarlas en la red (Ivanisenko et al., 2015).
Otra de las cuestiones en las que nos centramos fue en el análisis de
enriquecimiento funcional. Ya hemos indicado que STRING suministra datos
conocidos y pronosticados de interacciones proteína-proteína, incluidas
asociaciones funcionales con cálculos que cuantifican la confianza de la
correlación establecida entre los nodos (proteínas) (Doncheva et al., 2018). Esto
puede arrojarnos una idea de las principales funciones en que se encuentran
implicados los diferentes nodos.
3.4.4 Red de expresión génica
En cuanto a la construcción de la red de expresión génica, utilizamos
Cytoscape 3.8.0 (Shannon et al., 2003). Cytoscape es un software de código
abierto que permite incorporar redes de interacción biomolecular junto con datos
de expresión de alto rendimiento y otro tipo de datos moleculares. Cytoscape
21
muestra un gráfico de red bidimensional en el que las especies moleculares
aparecen representadas como nodos y las interacciones intermoleculares entre
estos como enlaces (Shannon et al., 2003). Para el análisis de redes complejas
es apropiado llevar a cabo la realización de un análisis topológico de un número
adecuado de métricas puesto que proporcionaría mucha información sobre el
sistema (Roy, 2012). Existen muchas medidas que proporcionan información
acerca de la “centralidad” de los nodos (Arenas et al., 2008). En nuestro caso, y
gracias al empleo de Cytoscape, analizaremos la centralidad de grado o degree
y la intermediación o betweenness. El grado (degree) hace referencia a la
cantidad de conexiones que un nodo establece con otros nodos y, se trata de la
métrica topológica más usual en las redes (Roy, 2012). La intermediación
(betweenness), por otra parte, que es otra de las medidas de centralidad más
utilizadas, representa el número de rutas más cortas entre cualquier par de
nodos que transita por un nodo en cuestión (este último sería un vértice que se
encuentra en el camino entre los otros 2) (Arenas et al., 2008).
En lo que a nuestro estudio se refiere, tenemos que la centralidad o
degree es la interacción que se establece entre un gen con otro/s gen/es. El
betweenness mide la relevancia de un gen que funciona como puente entre otros
dos, con un valor máximo de 1 (Boccaletti et al., 2006).
3.5 Valoración del índice h
Los indicadores bibliométricos tienen como objetivo el análisis cuantitativo
y cualitativo de las publicaciones científicas, partiendo del número de artículos
publicados por un mismo autor y el número de citas que estos reciben, es decir,
miden su impacto (Dorta-González y Dorta-González, 2010).
El índice h se ha convertido en uno de los indicadores más empleados
para medir el éxito y la producción científica de un investigador, tanto es así que
se considera una medida aproximada de la calidad del trabajo de un determinado
científico que puede ser juzgado por otros científicos (en función del valor de
dicho índice) en el campo de las ciencias biomédicas (Bornmann y Daniel, 2005).
Un investigador tiene un índice h cuando h de sus publicaciones han recibido al
22
menos h citas cada una, y el resto tiene h o menos citas por publicación (Hirsch,
2005).
En nuestro estudio, partiendo de la red bibliométrica de autores obtenida
a través de VOSviewer, consideraremos los investigadores más destacados de
cada cluster y buscaremos el índice h de cada uno de ellos utilizando SCOPUS,
que es la mayor base de datos de citas y resúmenes de literatura científica
revisada por pares.
23
4. RESULTADOS
4.1 Análisis bibliométrico
4.1.1 Búsqueda de publicaciones
De la estrategia de búsqueda que establecimos se obtuvieron un total de
3086 artículos. Todos estos artículos fueron seleccionados para llevar a cabo
nuestro análisis, ninguno fue excluido.
Como podemos observar en la Figura 2, la publicación anual de artículos
ha ido aumentando progresivamente en el campo de la genética de la
endometriosis. Este crecimiento ha sido más pronunciado a partir de 2002, lo
que coincide con la finalización del Proyecto Genoma Humano y la aparición de
las técnicas de alto rendimiento (“-ómicas”). En función de este resultado,
deducimos que nuestro tema de estudio es de creciente interés en investigación.
Figura 2. Gráfica en la que se muestra el desempeño en investigación sobre genética de endometriosis en
los últimos 20 años (desde comienzos de siglo). La línea de tendencia muestra que el número de
publicaciones sobre este tema va en aumento.
44 47 6385 74 85 99 91
108 113141
167 167 173 176199 201 201 199
245 244
0
50
100
150
200
250
300
Año
Nú
me
ro d
e p
ub
licac
ion
es
RESULTADOS POR AÑO"endometriosis" AND ("genetics" OR "genes" OR
"genome")
24
4.1.2 Mapa bibliométrico de autores
Tras la búsqueda bibliográfica, empleamos VOSviewer para la
construcción de un mapa bibliométrico de autores. Para la elaboración del mapa,
se aplicó un filtro (que ya venía seleccionado por defecto en los ajustes del
programa) y la representación del mapa bibliométrico se delimitó a artículos que
tuvieran como máximo 25 autores, quedando así desestimadas aquellas
publicaciones que no cumplían con este requisito. Se estableció un número
mínimo de 5 publicaciones por autor para que formase parte de la visualización,
de tal manera que, de 11163 autores, 535 eran los que sobrepasaban este
umbral y serían los elementos de nuestra red (nodos). De estos 535, dado que
algunos no estaban conectados entre sí y el conjunto más grande de elementos
conectados constaba de 361 elementos, estos últimos fueron los que tuvimos en
consideración para construir nuestro mapa bibliométrico.
Figura 3. Mapa bibliométrico de autores generado a partir de VOSviewer. Esta visualización muestra los
361 nodos de red que se han incluido finalmente en nuestro análisis. Al ser un mapa de distancia, la
distancia entre dos elementos refleja la fuerza de relación entre dos publicaciones: a menor distancia, mayor
relación, y viceversa. El tamaño de cada clúster refleja el número de publicaciones que pertenecen a este,
incluyendo así los grupos más grandes más publicaciones. La distancia entre dos grupos indica la relación
de los grupos en términos de citas.
25
4.1.3 Mapa de palabras clave
Mediante el uso de VOSviewer construimos un mapa de palabras clave.
El número mínimo de coocurrencia que establecimos para cada palabra clave
fue de 5 (cada palabra clave ha de repetirse como mínimo 5 veces en el conjunto
de resúmenes y títulos de los artículos que estamos considerando). De las 5467
palabras clave que se hallaron en la totalidad de publicaciones que
consideramos, 961 superaron el umbral y estas son las que aparecen
representadas en nuestro mapa (Figura 4).
Figura 4. Mapa de palabras clave generado con VOSviewer. Esta visualización se ha construido a partir de
las 961 palabras que superaron el umbral establecido. El tamaño del clúster de cada término refleja el
número de publicaciones en las que se halló el mismo y la distancia entre dos términos ofrece una indicación
aproximada de la relación entre ambos. Los colores muestran los grupos de términos que se relacionan
entre sí.
Como información adicional construimos una tabla que recoge las
palabras clave que aparecen con mayor concurrencia en las publicaciones sobre
las que centramos nuestro estudio (Tabla 1).
26
Términos más frecuentes en publicaciones
sobre genética de la endometriosis
1 Female
2 Humans
3 Endometriosis
4 Adult
5 Endometrium
6 Animals
7 Middle aged
8 Stromal cells
9 Infertility female
10 Genetic predisposition to disease
11 Case-control studies
12 Ovarian neoplasms
13 Inmunochemistry
14 Single-nucleotide polymorphism
15 Genotype
Tabla 1. Relación de los quince primeros términos que aparecen con mayor asiduidad en título y resumen
de las publicaciones sobre genética de la endometriosis. Estas palabras son las que presentan los clústeres
de mayor tamaño en el mapa de términos obtenido con Vosviewer.
4.1.4 Análisis del índice h
Tomando como referencia la visualización del mapa bibliométrico de
autores que hemos generado con VOSviewer, construimos una tabla que
muestra los 20 investigadores que se encontraban en un clúster de mayor
tamaño dentro de este junto con el índice h correspondiente de cada uno y la
subdisciplina sobre la que publican dentro de la genética de la endometriosis
(Tabla 2). La magnitud de los clústeres refleja la abundancia de publicaciones
que cada autor posee y, por tanto, evidencia en cierto modo la productividad
literaria de cada científico incluido en el análisis. Esta tabla también incluye el
índice h de cada autor, el cual se obtuvo mediante la búsqueda en SCOPUS.
Este índice nos aporta información valiosa, ya que, al ser un balance entre el
número de publicaciones y las citas que estas reciben, nos permite diferenciar
los investigadores que tienen mayor prestigio en el mundo científico. Por lo tanto,
27
este índice es, en último término, una medida de la calidad de la producción
científica de un autor.
Autor Subespecialidad sobre la que publica dentro de
la genética de la endometriosis
Índice h
Montgomery, Grant W Estudios de asociación genética (GWAS) 118
Giudice, Linda C Patogénesis, fisiopatología, expresión génica 85
Nyholt, Dale R Estudios de asociación genética (GWAS) 74
Bulun, Serdar E Metabolismo de los esteroides 72
Petraglia, Felice Aspectos clínicos, tratamientos farmacológicos 70
Saunders, Philippa K Papel de los estrógenos en el ciclo menstrual 68
Taketani, Yuji Inmunología y reacciones inflamatorias 67
Kennedy, S Genes de susceptibilidad a endometriosis;
diagnóstico y tratamiento
65
Taylor, Hugh S Tratamientos para el dolor pélvico asociado 65
Chapron, C Inmunidad; diagnóstico; tratamiento 63
D’Hooghe, Thomas M Tratamientos; impacto sobre la calidad de vida;
inmunología; búsqueda de biomarcadores
61
Taylor, Robert N Influencia de los estrógenos 60
Kyo, Satoru Papel de estrógenos y progesterona 58
Arici, Aydin Interacciones inmuno-endocrinas 58
Lessey, Bruce A Receptividad endometrial en endometriosis 56
Zondervan, Krina T Estudios de asociación genética (GWAS) 55
Fraser, Ian S Influencia de factores neuroendocrinos 54
Missmer, Stacey A Factores que afectan el riesgo de endometriosis 54
Kim, Sung H Tratamiento 53
Viganò, Paola Patogénesis; factores epidemiológicos 50
Tabla 2. 20 autores más sobresalientes que publican sobre genética de la endometriosis. Cada uno de ellos
se muestra con su respectiva área de estudio dentro de esta disciplina y su correspondiente índice h, todos
ellos aparecen ordenados de mayor a menor en función del valor de este índice.
28
4.2 Análisis de redes biológicas
4.2.1 Procesamiento de datos
Fruto de nuestra búsqueda en Phenopedia encontramos 320 genes
relacionados con la endometriosis (la lista completa se puede consultar en el
Anexo I), todos ellos dispuestos en un formato tabular que genera esta
herramienta de software en función del número de publicaciones en las que
aparece un gen en cuestión vinculado con dicha enfermedad. Para simplificar
nuestro estudio, se hizo la media del número de publicaciones en las que
aparecía cada gen y obtuvimos un valor aproximado de 3 (2,775), con lo que
para nuestro estudio solo se tuvieron en cuenta aquellos genes que aparecen en
un número de publicaciones igual o mayor a dicho valor. El número de genes
que se utilizó por tanto para la representación en forma de red es de 80 genes.
4.2.2 Red de interacción proteína-proteína
De los 80 genes introducidos en STRING, se encontraron registros de
interacción proteína-proteína para 76 de ellos (Figura 5). En esta red tenemos
un total de 871 conexiones o nexos entre los 76 nodos. En esta figura se han
mantenido los parámetros por defecto, con lo que su análisis e interpretación se
hace muy complejo.
29
Figura 5. Red de interacción proteína-proteína para la endometriosis creada con STRING, se muestran un
total de 871 conexiones entre las 76 proteínas relacionadas con la endometriosis.
Para una visualización avanzada de los elementos de la red se
modificaron algunos de los parámetros por defecto y se generó una nueva red
(Figura 6). En primer lugar, excluimos “Textmining” o minería de texto, lo que
reduce la densidad del entramado de conexiones que se evidenciaba en la red
anterior (Figura 5). Después de esto se detecta cómo la red queda con un menor
número de conexiones, ya que la función “Textmining” induce ruido y, con el
simple análisis de co-citas en los resúmenes de las publicaciones no es capaz
de discernir si dos proteínas aparecen relacionadas en estos por ser
antagonistas o por cualquier causa contraria a la que aquí se estudia.
Por otra parte, en el análisis de enriquecimiento funcional, en el apartado
de “Biological Process (GO)” o procesos biológicos marcamos los 10 primeros,
que son los que adquieren mayor relevancia en la progresión de la enfermedad
y, como vemos, a cada proceso se le asigna un color (Tabla 3). En la
representación, después de esta selección, veremos cómo cada nodo aparece
coloreado en correlación con la/s función/es biológica/s en la/s que se encuentra
involucrado. Esta red consta de 76 nodos y 168 conexiones.
30
Figura 5. Red de interacción proteína-proteína para la endometriosis, donde se muestran un total de 168
conexiones entre las 76 proteínas relacionadas con la endometriosis creada con STRING. Cada nodo
aparece coloreado en función del proceso biológico en el que participa (ver Tabla 3).
Tabla 3. Relación de procesos biológicos en los que se encuentran enriquecidos el conjunto de genes
utilizados para la construcción de la red de interacción proteína-proteína. Cada proceso se encuentra
representado por un color, de la misma manera que lo hacen los nodos correspondientes implicados en
dicho proceso.
31
4.2.1 Red de expresión génica
A partir de la información obtenida de la red de interacción proteína-proteína,
construimos con Cytoscape la red de expresión génica (Figura 6). En esta red tenemos
76 nodos, todos ellos conectados por un gran entramado de conexiones. El estudio de
esta red se centró en el análisis de dos parámetros de centralidad: grado o degree e
intermediación o betweenness (Tabla 4).
Figura 6. Red de expresión génica en endometriosis generada a partir de Cytoscape. Se muestran 76 nodos
en la red, todos ellos de un color determinado, desde morado hasta amarillo. El color asociado a cada uno
de los nodos se correlaciona con los valores de betweenness (a mayor oscuridad, mayor valor de dicho
parámetro). El tamaño de cada nodo (diámetro) se vincula con el valor de degree, de forma que, a mayor
valor de degree para un nodo, mayor tamaño presenta este.
Gene Name Degree Betweenness
TP53 Cellular tumor antigen p53 51 0.08712
IL6 Interleukin-6 49 0.04321
EGFR Epidermal growth factor receptor 47 0.03292
ESR1 Estrogen receptor 47 0.07758
VEGFA Vascular endotelial growth factor A 46 0.02493
Tabla 4. Parámetros de centralidad de los 5 genes más representativos en la red de expresión génica en
endometriosis. Para cada gen se muestran su nombre completo y los valores de degree y betweenness.
32
5. DISCUSIÓN
La endometriosis supone un importante problema de salud pública puesto
que afecta en torno al 10% de mujeres en edad reproductiva, lo que supone unos
2 millones de mujeres en España y 170 millones en todo el mundo. Se ha
desarrollado una dilatada investigación acerca de la etiopatogenia de la
endometriosis. Sin embargo, el origen y el mecanismo de desarrollo de este
desorden ginecológico sigue siendo hipotético. La evidencia ratifica la naturaleza
multifactorial de la endometriosis que involucra factores hormonales,
inmunológicos, genéticos, epigenéticos, de estrés oxidativo y ambientales
(Laganà et al., 2019). Dado que la fisiopatología de la enfermedad sigue siendo
imprecisa, hemos desarrollado este Trabajo de Fin de Grado con el objetivo de
dilucidar algunos de los aspectos que propician el desencadenamiento de esta
afección, en nuestro caso nos hemos centrado en la genética de la misma.
La realización de este Trabajo de Fin de Grado se ha llevado a cabo desde
un planteamiento de Biología de Sistemas, que defiende que el estudio
individualizado de un sistema no puede comprender un organismo en su
totalidad (Simpson, 2016). Este enfoque precisa de la integración de
investigación tanto experimental como computacional y tiene como objetivo el
entendimiento de los sistemas biológicos (Kitano et al., 2002). Este trabajo, por
tanto, consta dos partes, el análisis bibliométrico y de redes biológicas.
En los últimos años se ha desarrollado un creciente interés en la
bibliometría. Estos métodos heterogéneos de análisis bibliométrico son
indispensables (Brandt et al., 2019) para la identificación de las diferentes áreas
sobre las que se publica y sobre los campos de investigación emergentes
(Palacios et al., 2019). El análisis de red mediante el empleo de herramientas
bibliométricas puede ser de gran utilidad, ayudándonos así a completar un
análisis de red completo en el que se identifican tanto los grupos de investigación
e investigadores como las distintas áreas de conocimiento. La determinación de
los campos de estudio nacientes se define a través de los temas abarcados por
estos autores (Fahimnia et al., 2015). En nuestro caso, para la realización de
nuestro análisis bibliométrico se recopilaron un total de 3086 publicaciones
acerca de la genética de la endometriosis de PubMed. El software que utilizamos
33
para la construcción de mapas bibliométricos fue VOSviewer. Se construyeron
dos mapas: un mapa bibliométrico de autores y un mapa de términos. En cuanto
al primero, aparecen 535 autores en este mapa. Gracias al uso de esta
herramienta, pudimos conocer la identidad de los autores más destacados que
publican sobre la genética de la endometriosis, como por ejemplo Montgomery
GW, Giudice LC o Kennedy S, entre otros. La importancia de estos autores se
ha podido constatar ya que la mayoría de artículos sobre los que se erige el
trabajo se corresponden con publicaciones de dichos investigadores. Con
respecto al mapa de términos, se determinaron y clasificaron términos MeSH
que aparecen con mayor frecuencia en los resúmenes, en nuestro caso
encontramos: female, human, endometriosis, adult, etc. Además, junto con el
análisis bibliométrico, y aprovechando el mapa bibliométrico de autores que
construimos, valoramos el índice h de aquellos autores que vimos que tenían
más peso en el mismo, buscando el índice h de cada uno de ellos en SCOPUS.
En conclusión, este índice determina la importancia, la transcendencia y el
impacto de las aportaciones en investigación de cada científico (Hirsch, 2005).
Dentro de la Biología de Sistemas, la teoría de redes tiene un papel crucial
(Roy et al., 2012). Es por esto por lo que en nuestro estudio también se ha llevado
a cabo un análisis de redes biológicas. Este análisis puede dividirse en dos
partes en función de la red construida y los aspectos que se analizaron: la
primera es una red de interacción proteína-proteína de la cual estudiamos las
funciones biológicas desempeñadas por cada una de las proteínas; y, la otra, es
una red de expresión génica en la que se evaluaron los genes en función de los
parámetros de centralidad degree o grado y betweenness o intermediación. En
realidad, ambas redes pueden considerarse análogas, pues el conjunto de nodos
que se evalúan es el mismo; por tanto, estas redes solo se diferencian en función
de los parámetros que se analizan en cada una de ellas.
En primer lugar, la red de interacción proteína-proteína se realizó
utilizando la base de datos STRING y nos permitió representar un total de 76
nodos. Además, se realizó un análisis funcional con el objetivo de determinar las
10 funciones biológicas más representativas llevadas a cabo por el conjunto de
nodos. Algunas de las proteínas que más recurrentemente participaban en estos
importantes procesos biológicos son: TGFB1 (factor de crecimiento
34
transformante-β1), CDH1 (cadherina-1), ICAM1 (molécula de adhesión
intracelular), IL1 (interleucina-1), IL1R1 (receptor de interleucina-1), IL1B
(interleucina-1 β), IL4 (interleucina-4), IL10 (interleucina-10), TNF (factor de
necrosis tumoral), HLA-A (antígeno leucocitario humano A de tipo I), HLA-B
(antígeno leucocitario B de tipo I), MMP1 (metaloproteasa de matriz-1), MMP2
(metaloproteinasa de matriz-2), MMP3 (metaloproteinasa de matriz-3), MMP9
(metaloproteinasa de matriz-9) y TIMP2 (inhibidor de metaloproteinasas-2),
TP53 (proteína tumoral 53), ESR1 (receptor de estrógenos 1), VEGFA (factor de
crecimiento endotelial vascular), IL6 (interleucina-6), o EGFR (receptor del factor
de crecimiento epidérmico), entre otras. Estas cinco últimas se corresponden con
los cinco genes homónimos que adquieren mayor relevancia dentro de esta
afección. TNF, junto con IL-1, se caracterizan por desencadenar la cascada de
citocinas y mediar las respuestas inflamatorias (Lebovic et al., 2001). La proteína
IL6 tiene un papel señalado en enfermedades inflamatorias (Burney y Giudice,
2012). HLA-A y HLA-B son proteínas para las que se han constatado mayores
concentraciones en el líquido peritoneal de mujeres con endometriosis, lo que se
considera una estrategia en la evasión de la inmunovigilancia junto con la
inhibición de la citotoxicidad de las células NK (Natural Killer) (Symons et al.,
2018). La proteína ICAM1 participa en estos procesos de manera análoga
(Aznaurova et al., 2014). IL-6, junto con TGF-β1, además de favorecer una mayor
liberación de IL-10 y TGF-β, disminuyen también la actividad citolítica de las
células NK (Symons et al., 2018). TGF-β favorece la invasión (Burney y Giudice,
2012), desempeñando un papel crucial en la migración y proliferación para el
desarrollo de lesiones endometrióticas (Aznaurova et al., 2014). Por su parte,
MMP-1, MMP-2, MMP-3 y MMP-9 se encargan de la degradación de la matriz
extracelular para que posteriormente se produzca la adhesión del tejido
endometrial. Todas ellas presentan homología estructural, pero se diferencian
en la especificidad de sustrato, el tipo celular sobre el que actúan y el grado de
inducción (Laganà et al., 2019). Las proteínas TIMP, en cambio, son inhibidoras
de las anteriores, ayudan a modular su actividad. Respecto a CDH1, es
importante en los procesos de adhesión y mantenimiento estructural de los
tejidos (Aznaurova et al., 2014). EGFR se relaciona con el crecimiento
endometrial ectópico y la diferenciación (Burney y Giudice, 2012). ESR1 está
35
también involucrada en la proliferación, adhesión y angiogénesis de las lesiones
ectópicas (Symons et al., 2018). VEGFA adquiere especial importancia en
procesos angiogénicos (Viganò et al., 2004), y TGF-α se considera inductora de
los mismos (Aznaurova et al., 2014).
Por último, nuestra segunda red fue construida y analizada con
Cytoscape. En esta red de expresión génica, integrada por 76 genes, el análisis
se ha realizado atendiendo a la evaluación de los nodos, en función de los
parámetros de red o medidas de centralidad que determinan su importancia en
la disposición de la red desde diferentes perspectivas. Los parámetros de
centralidad que se han estudiado aquí son el degree o centralidad de grado y el
betweenness o intermediación. En función de los resultados de este análisis,
obtuvimos que los genes principales son: TP53 (guardián del genoma), IL6
(interleucina-6), EGFR (receptor del factor de crecimiento epidérmico), ESR1
(receptor de estrógenos 1) y VEGFA (factor de crecimiento endotelial vascular).
Numerosas mutaciones han sido identificadas en relación con genes de
supresión tumoral en lesiones endometrióticas, tales como las que se han
descrito en TP53, que es un regulador negativo del ciclo celular y que participa
en procesos de carcinogénesis (Krawczyk et al., 2016). Por otro lado, IL6 es el
gen que codifica para la interleucina-6 (IL-6) que es un mediador inflamatorio
(Viganò et al., 2004), como hemos comentado anteriormente. EGFR codifica el
factor de crecimiento epidérmico, el cual contribuye aumentando el potencial
proliferativo de las células presentes en las lesiones endometrióticas (Aznaurova
et al., 2014). ESR1 o receptor de estrógenos es un gen cuya metilación anormal
(Falcone y Flyckt, 2018), así como la presencia de polimorfismos, se asocia con
la patogénesis de esta enfermedad (Sourial et al., 2014). La actividad del
receptor de estrógenos favorece la angiogénesis, adhesión y proliferación de las
lesiones ectópicas (Symons et al., 2018). Por último, la expresión de VEGF en
implantes endometrióticos ha demostrado que se encuentra involucrado en el
proceso de neovascularización (Lebovic et al., 2001).
Partiendo de estos resultados, se pueden obtener ideas complementarias
acerca de los intereses vigentes y probables futuras direcciones en investigación
(Fahimnia et al., 2015). Por tanto, en futuros estudios sería interesante
determinar los puntos de control en el proceso que dan pie a que se establezca
36
la endometriosis, encontrar dianas sobre las que podrían actuar los agentes
terapéuticos, definir las funciones biológicas desconocidas todavía para algunas
de las proteínas que se asocian con esta enfermedad, estudiar las causas que
provocan la desregulación de genes supresores de tumores e incluso centrarse
en algunos aspectos muy novedosos como la implicación de los miRNAs o la
búsqueda de biomarcadores que facilitarían el diagnóstico de la enfermedad e
impedirían el retraso que se asocia con la misma.
37
6. CONCLUSIONES
- Se ha verificado la utilidad que proporcionan diferentes herramientas de
la Biología de Sistemas. Algunos ejemplos son las bases de datos tales
como Phenopedia, a partir de la cual obtuvimos los genes que se hallaban
implicados en endometriosis; STRING, que nos facilitó las proteínas
asociadas con dicha dolencia y con la que construimos una red de
interacción proteína-proteína; o VOSviewer y Cytoscape, herramientas de
software que nos han permitido construir mapas bibliométricos y redes de
expresión génica, respectivamente.
- Se han identificado los autores más relevantes que publican dentro de la
genética de la endometriosis y se ha evaluado mediante índices
bibliométricos (índice h) la transcendencia de sus publicaciones.
- Se han determinado las palabras que aparecen más frecuentemente en
los resúmenes de publicaciones sobre genética de la endometriosis.
- Se han descrito las proteínas más destacadas en el proceso de desarrollo
de la endometriosis, todas ellas involucradas en los procesos de
proliferación, apoptosis, adhesión e invasión, angiogénesis y, alteración
de la función inmune.
- Se han reconocido los genes que desempeñan un papel crucial en la
endometriosis, a través de parámetros de centralidad que se calcularon
para nuestra red de expresión génica.
- El abordaje de este Trabajo de Fin de Grado ha permitido la integración
de los diversos conocimientos adquiridos en las diferentes asignaturas
estudiadas durante el trascurso del Grado.
38
7. BIBLIOGRAFÍA
Altmäe S, Esteban FJ, Stravreus-Evers A, Simón C, Giudice L, Lessey BA,
Horcajadas JA, Macklon NS, D’Hooghe T, Campoy C, Fauser BC,
Salamonsen LA, Salumets A. 2014. Guidelines for the design, analysis
and interpretation of “omics” data: focus on human endometrium. Hum
Reprod Update; 20: 12-28.
Arenas A, Díaz-Aguilera A, Kurths J, Moreno Y, Zhou C. 2008. Synchronization
in complex networks. Phys Rep; 469(3): 93-153.
Aznaurova YB, Zhumataev MB, Roberts TK, Aliper AM, Zhavoronkov AA. 2014.
Molecular aspects of development and regulation of endometriosis.
Reprod Biol Endocrinol; 12: 50.
Ballard K, Lowton K, Wright J. 2006. What’s the delay? A qualitaty study of
women’s experiences of reaching a diagnosis of endometriosis. Fertil
Steril; 86: 1296-1301.
Boccaletti S, Latora V, Moreno Y, Chavez M y Hwang DU. 2006. Complex
networks: Structure and dynamics. Phys Rep; 424: 175-308.
Bornmann L, Daniel HD. 2005. Does the h-index for ranking of scientists really
work? Scientometrics; 65: 391-392.
Bougie O, Yap MI, Sikora L, Flaxman T, Singh S. 2019. Influence of race/ethnicity
on prevalence and presentation of endometriosis: a systematic review and
meta-analysis. BJOG; 126: 1104-1115.
Brandt JS, Hadaya O, Schuster M, Rosen T, Sauer MV, Ananth CV. 2019. A
Bibliometric Analysis of Top-Cited Journal Articles in Obstetrics and
Gynecology. JAMA Netw Open; 2(12): e1918007.
Bulletti C, Coccia ME, Battistoni S, Borini A. 2010. Endometriosis and infertility. J
Assist Reprod Genet; 27: 441-447.
Burney RO, Giudice LC. 2012. Pathogenesis and pathophysiology of
endometriosis. Fertil Steril; 98: 511-519.
39
Chin CH, Chen SH, Wu HH, Ho CW, Ko MT, Lin CY. 2014. cytoHubba: identifying
hub objects and sub-networks from complex interactome. BMC Syst Biol;
8(Suppl 4): S11.
Chuang HY, Hofree M, Ideker T. 2010. A decade of systems biology. Annu Rev
Cell Dev Biol; 26: 721-744.
Doncheva NT, Morris JH, Gorodkin J, Jensen LJ. 2018. Cytoscape stringApp:
Network analysis and visualization of proteomics data. J Proteome Res;
18(2): 623-632.
Dorta-González P, Dorta-González MI. 2010. Indicador bibliométrico basado en
el índice h. Revista Española de Documentación Científica; 33(2): 225-
245.
Fahimnia B, Sarkis J, Davarzani H. 2015. Green sypply chain management: A
review and bibliometric analysis. Int J Prod Econ; 162: 101-114.
Falcone T, Flyckt R. 2018. Clinical Management of Endometriosis. Obstet
Gynecol; 131(3): 557-571.
Giudice LC. 2010. Endometriosis. N Engl J Med; 362: 2389-98.
Hirsch JE. 2005. An index to quantify an individual’s scientific research output.
PNAS; 102(46): 16569-16572.
Hufnagel D, Li F, Cosar E, Krikun G, Taylor HS. 2015. The Role of Stem Cells in
the Etiology and Pathophysiology of Endometriosis. Semin Reprod Med;
33: 333-340.
Ivanisenko VA, Saik OV, Ivanisenko NV, Tiys ES, Ivanisenko TV, Demenkov PS,
Kolchanov NA. 2015. ANDSystem: an Associative Network Discovery
System for automated literature mining in the field of biology. BMC Syst
Biol; 9(Suppl 2): S2.
Jabr FI, Mani V. 2014. An unusual cause of abdominal pain in a male patient:
Endometriosis. Avicenna J of Medicine; 4: 99-101.
Kao LC, Germeyer A, Tulac S, Lobo S, Yang JP, Taylor RN, Osteen K, Lessey
BA, Giudice LC. 2003. Expression Profiling of Endometrium from Women
40
with Endometriosis Reveals Candidate Genes for Disease-Based
Implantation Failure and Infertility. Endocrinology; 144(7): 2870-2881.
Kennedy S, Bergqvist A, Chapron C, D’Hooghe T, Dunselman G, Greb R,
Hummelshoj L, Prentice A, Saridogan E. 2005. ESHRE guideline for the
diagnosis and treatment of endometriosis. Hum Reprod.; 20(10): 2698-
2704.
Kitano H. 2002. Computational systems biology. Nature; 420: 206-210.
Krawczyk N, Banys-Pluchowski M, Schmidt D, Ulrich U, Fehm T. 2016.
Endometriosis-associated Malignancy. Geburtshilfe Frauenheilkd. 76(2):
176-181.
Laganà AS, Garzon S, Götte M, Viganò P, Franchi M, Ghezzi F, Martin DC. 2019.
The Pathogenesis of Endometriosis: Molecular Cell Biology Insights. Int J
Mol Sci; 20: 5615.
Lebovic DI, Mueller MD, Taylor RN. 2001. Immunobiology of endometriosis. Fertil
Steril; 75(1): 1-10.
Leyland N, Casper R, Laberge P, Singh SS. 2010. Endometriosis: Diagnosis and
Management. J Endometr; 2(3): 107-134.
Loscalzo J, Barabasi AL. 2011. Systems biology and the future of medicine. Wiley
Interdiscip Rev Syst Biol Med; 3(6): 619-627.
Maruyama T, Yoshimura Y. 2012. Stem Cell Theory for the Pathogenesis of
Endometriosis. Front Biosci (Elite Ed.); 4: 2754-63.
Medina MÁ. 2013. Systems biology for molecular life sciences and its impact in
biomedicine. Cell Mol Life Sci; 70: 1035-1053.
Missner SA, Hankinson SE, Spiegelman D, Barbieri RL, Marshall LM, Hunter DJ.
2004. Incidence of Laparoscopically Confirmed Endometriosis by
Demographic, Anthropometric, and Lifestyle Factors. Am J Epidemiol;
160: 784-796.
41
Nisolle M, Donnez J. 1997. Peritoneal endometriosis, ovarian endometriosis, and
adenomyotic nodules of rectovaginal septum are three different entities.
Fertil Steril; 68(4): 585-596.
Olive DL, Pritts EA. 2001. Treatment of endometriosis. N Engl J Med; 345: 266-
275.
Palacios-Marqués AM, Carratala-Munuera C, Martínez-Escoriza JC, Gil-Guillen
VF, Lopez-Pineda A, Quesada JA, Orozco-Beltrán D. 2019. Worldwide
Scientific Production in Obstetrics: A Bibliometric Analysis. Ir J Med Sci;
188(3): 913-919.
Roy S. 2012. Systems biology beyond degree, hubs and scale-free networks: the
case for multiple metrics in complex networks. Syst Synth Biol; 6: 31-34.
Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin N,
Schwikowski B, Ideker T. 2003. Cytoscape: a software environment for
integrated models of biomolecular interaction networks. Genome Res;
13(11): 2498-2504.
Simpson MR. 2016. Systems biology: impressions from a newcomer graduate
student in 2016. Adv Physiol Educ; 40: 443-445.
Sourial S, Tempest N, Hapangama DK. 2014. Theories on the Pathogenesis of
Endometriosis. Int J Reprod Med; 2014: 179515.
Srinivasan S, Rindflesch TC, Hole WT, Aronson AR, Mork JG. 2002. Finding
UMLS Metathesaurus concepts in MEDLINE. Proc AMIA Symp; 2002:
727-731.
Symons LK, Miller JE, Kay VR, Marks RM, Liblik K, Koti M, Tayade C. 2018.The
Immunopathophysiology of Endometriosis. Trends Mol Med; 24(9): 748-
762.
Szklarczyk D, Gable AL, Lyon D, Junge A, Wyder S, Huerta-Cepas J, Simonovic
M, Doncheva NT, Morris JH, Bork P, Jensen LJ, von Mering C. 2019.
STRING v11: protein-protein association networks with increased
coverage, supporting functional Discovery in genoma-wide experimental
datasets. Nucleic Acids Res; 47: D607-D613.
42
Van Eck NJ y Waltman L. 2019. Manual for VOSviewer versión 1.6.10.
Universiteit Leiden.
Van Eck NJ, Waltman L. 2010. Software survey: VOSviewer, a computer program
for bibliometric mapping. Scientometrics; 84: 523-538.
Van Eck NJ, Waltman L. 2017. Citation-based clustering of publications using
CitNetExplorer and VOSviewer. Scientometrics. 111: 1053-1070.
Vercellini P, Viganò P, Somigliana E, Fedele L. 2014. Endometriosis:
pathogenesis and treatment. Nat Rev Endocrinol.; 10(5): 261-275.
Viganò P. 2004. Endometriosis: epidemiology and aetiological factors. Best Pract
Res Cl Ob; 18(2): 177-200.
Vinatier D, Orazi G, Cosson M, Dufour P. 2001. Theories of endometriosis. Eur J
Obstet Gynecol Reprod Biol; 96: 21-34.
Yu W, Clyne M, Khoury MJ, Gwinn M. 2010. Phenopedia and Genopedia:
diseasecentered and gene-centered views of the evolving knowledge of
human genetic associations. Bioinformatics; 26(1): 145-146.
43
8. ANEXO I
Database: Phenopedia in
PHGKB.CDC.GOV
Disease: Endometriosis
Number of genes: 320
Gene
Symbol
Number of
Publications
GSTM1 36
TP53 34
VEGFA 30
ESR1 27
GSTT1 25
PGR 23
CYP1A1 19
ESR2 17
CYP17A1 17
CYP19A1 16
TNF 15
WNT4 13
KRAS 11
PIK3CA 10
GSTP1 10
IL10 10
HSD17B1 9
PTPN22 9
MMP2 9
IL6 9
MMP9 8
ARID1A 8
HLA-DRB1 8
ICAM1 7
COMT 7
MMP3 7
PTEN 6
CYP1B1 6
CYP2C19 6
NAT2 6
FCRL3 5
ACE 5
AHR 5
IL1A 5
IL1B 5
FSHR 5
TGFB1 5
AHRR 5
BRAF 5
VDR 5
XRCC1 5
SERPINE1 5
VEZT 5
MMP1 5
ARNT 5
AR 5
LTA 4
PPP2R1A 4
VEGF 4
TIMP2 4
FN1 4
HLA-B 4
IL16 4
CDKN2B-AS1 4
GREB1 4
CDH1 3
CTLA4 3
CTNNB1 3
EGFR 3
ERBB2 3
IL4 3
IL1R1 3
IGF1R 3
IFNG 3
HLA-A 3
LINC00339 3
ERCC2 3
TLR4 3
ACP1 3
PTGS2 3
BRCA2 3
STAT4 3
PPARG 3
OGG1 3
FOXP3 3
MMP7 3
KDR 3
LHB 3
LHCGR 3
LIF 3
GSTK1 2
MLH1 2
NFKB1 2
MTHFR 2
NOS3 2
NRAS 2
ND5 2
BRCA1 2
TNFRSF1B 2
MUC16 2
XRCC4 2
CASP8 2
AKT1 2
FSHB 2
GALT 2
GC 2
AMH 2
AMHR2 2
GNRH1 2
GNRHR 2
HLA-C 2
HLA-DPB1 2
HLA-DQA1 2
MSH6 2
APEX1 2
HOXA10 2
ID4 2
HSD17B2 2
IL1RN 2
FAS 2
EPHX1 2
DRD2 2
AGTR1 2
CPB2 2
CYP2E1 2
TNFSF13B 2
PDCD6 2
CDC42 2
NFE2L3 2
PDE4DIP 1
CDH5 1
LOC10050688 1
HNRNPA3P1 1
CDK4 1
CDKN1A 1
CDKN1B 1
LILRB2 1
CDKN2B 1
PEMT 1
SLCO1B1 1
CTCF 1
CETP 1
LILRB1 1
STIP1 1
WDHD1 1
CHKA 1
CHRM1 1
CDKN2BAS 1
LOC10013053 1
CYP3A4 1
CYP3A5 1
TTC39B 1
CYP11A1 1
CYP11B1 1
CYP2D6 1
CYP1A2 1
CREBBP 1
FAM123B 1
PARP1P2 1
CCR2 1
CCR5 1
EGF 1
AGT 1
DNASE1L3 1
DNMT3A 1
DPP6 1
ERCC1 1
ARID2 1
AHSG 1
EMX2 1
ETS1 1
EXT1 1
FANCD2 1
FEN1 1
44
FGF1 1
FGFR3 1
FGFR2 1
KIFAP3 1
FLG 1
NUP210 1
ASTN2 1
KAZN 1
FMR1 1
SYNE1 1
IL12B 1
IL18 1
INSR 1
IRF5 1
FASLG 1
IL2RB 1
IGF2 1
IGFBP1 1
IGFBP2 1
IGFBP3 1
BIRC5 1
HSD17B3 1
OR14K1 1
IGF1 1
APOE 1
HRAS 1
HLA-G 1
FOXA1 1
FOXA2 1
DNMT3L 1
HLA-DQB1 1
HLA-DRA 1
ABO 1
GRB14 1
CCDC22 1
GNRH2 1
GSTA1 1
GNAS 1
GDF9 1
OR7A15P 1
ERCC5 1
ERCC6 1
BHMT2 1
ALOX15 1
RNF144B 1
LOXL4 1
MEGF10 1
FCRLA 1
HSD17B6 1
AKR1C3 1
IRS2 1
TNFSF10 1
CBS 1
TNFRSF10B 1
TNFRSF10A 1
FCGBP 1
CCNE1 1
NAT1 1
IL33 1
CD19 1
ZNF217 1
IL1R2 1
USP7 1
COL18A1 1
OR2G2 1
NRIP1 1
CLOCK 1
CD40 1
XRCC3 1
TNFRSF1A 1
VEGFC 1
ND3 1
STAT6 1
TAC3 1
TACR1 1
HNF1B 1
TCN1 1
TRB@ 1
TERT 1
RNF213 1
RB1 1
BRD2 1
RXRA 1
BDNF 1
S100A6 1
SCN5A 1
CCL2 1
BHMT 1
CCL5 1
CCL21 1
SLC6A4 1
SOD2 1
PTGDR 1
RHOJ 1
TGFBR1 1
TIMP1 1
C3 1
TRAF1 1
TSC1 1
C5 1
TYK2 1
RGPD2 1
UCHL1 1
NTRK1 1
NUMA1 1
NOTCH1 1
PCYT1A 1
PDGFRB 1
CAB39 1
MTR 1
MTRR 1
MUC2 1
MUC4 1
MYC 1
NF1 1
NGF 1
NME1 1
TNFRSF11B 1
PON1 1
ETAA1 1
PLAT 1
PLAUR 1
BCL11A 1
PLG 1
TET2 1
BNC2 1
PRKDC 1
PPP2R1B 1
FBXW7 1
CHDH 1
MMP12 1
MMP13 1
MPO 1
MSH2 1
COX2 1
MTHFD1 1
CYP4F3 1
MIR100 1
MIR126 1
MIR196A2 1
SMAD4 1
C10orf55 1
MBL2 1
MDM2 1
MDM4 1
MEIS1 1
MIF 1
RBM43 1
KCNQ2 1
KIR2DL4 1
KIR2DS5 1
KIR3DS1 1
LIPC 1
RND3 1
OR4N3P 1
LAMA5 1