como realizar un árbol filogenético.pdf

24
Instruc(vo para realizar un árbol filogené(co. Bioinformá)ca Tecnología Médica, Universidad Santo Tomás Profesor Alejandro Cuevas Villegas T.M. PhD(c)

Upload: alejandro-cuevas-villegas

Post on 26-Sep-2015

53 views

Category:

Documents


5 download

TRANSCRIPT

  • Instruc(vo para realizar un rbol logen(co.

    Bioinform)ca Tecnologa Mdica, Universidad Santo Toms

    Profesor

    Alejandro Cuevas Villegas T.M. PhD(c)

  • Paso 1: obtener las secuencias de nucle)dos o de protenas de la base de datos Nucleo(de de NCBI. Estas secuencias deben ser homlogas entre las especies a comparar (genes con similar funcin y/o estructura)

    Paso 2: realizar un alineamiento ml)ple u)lizando ClustalW u otro programa similar (MUSCLE, T-coee, 3D-coee, Probcons).

    Paso 3: hacer anlisis con alguno de los modelos logen)cos conocidos. Puede u)lizar soRware como PhyML (basado en Phylip), BioNJ, TNT, MrBayes, entre otros.

    Paso 4: Dibujar el rbol logen)co con los datos generados con los programas anteriormente mencionados. Puede u)lizar visores como TreeDyn, Drawgram, Drawtree o cualquier otro diseado para realizar diseo de rboles logen)cos.

  • Ejemplo: Para estudiar como han evolucionado dis)ntos organismos se podra usar el mRNA del gen de la Lactato deshidrogenasa (DNA es demasiado extenso. Podra u)lizarse tambin la secuencia de aminocidos) , comn entre organismos eucariontes y procariontes. Gen comn entre

    muchas especies

    PASO

    1

  • 1.- Abra un registro y visualcelo en formato FASTA

    2.- Luego seleccione y copie todo lo que est dentro del cuadro rojo, desde >gi|2915 hasta la l(ma base. Pguelo en un archivo de texto o directamente en ClustalW (online). 3.- Repita el procedimiento para cada una de las especies incluidas en el estudio.

    PASO

    1

  • Paso 1: obtener las secuencias de nucle)dos o de protenas de la base de datos Nucleo(de de NCBI. Estas secuencias deben ser homlogas entre las especies a comparar (genes con similar funcin y/o estructura)

    Paso 2: realizar un alineamiento ml)ple u)lizando ClustalW u otro programa similar (MUSCLE, T-coee, 3D-coee, Probcons).

    Paso 3: hacer anlisis con alguno de los modelos logen)cos conocidos. Puede u)lizar soRware como PhyML (basado en Phylip), BioNJ, TNT, MrBayes, entre otros.

    Paso 4: Dibujar el rbol logen)co con los datos generados con los programas anteriormente mencionados. Puede u)lizar visores como TreeDyn, Drawgram, Drawtree o cualquier otro diseado para realizar diseo de rboles logen)cos.

  • 1.- Click en online programs

    2.- Abrir ClustalW P

    ASO 2

    Ingrese a www.phylogeny.fr Si)o donde podr construir un rbol logen)co, slo u)lizando herramientas online.

  • 1.- Pegar secuencia del mRNA en formato FASTA dentro del cuadro.

    2.- Saltarse un espacio y pegar la siguiente secuencia inmediatamente despus.

    3.- Repe(r procedimiento para todas las secuencias

    4.- Click en SUBMIT

    PASO

    2 Al abrir CLUSTALW ver la siguiente pgina:

    NOTA: el smbolo > es necesario para que CLUSTALW reconozca que comenz una nueva secuencia.

  • Al terminar el alineamiento ver el siguiente cuadro.

    En la misma ventana, mas abajo, ver este men.

    Con el botn derecho del mouse, haga click sobre alignment Phylip format y descargue el archivo. Ese archivo lo usar en la siguiente etapa.

    PASO

    2

  • Paso 1: obtener las secuencias de nucle)dos o de protenas de la base de datos Nucleo(de de NCBI. Estas secuencias deben ser homlogas entre las especies a comparar (genes con similar funcin y/o estructura)

    Paso 2: realizar un alineamiento ml)ple u)lizando ClustalW u otro programa similar (MUSCLE, T-coee, 3D-coee, Probcons).

    Paso 3: hacer anlisis con alguno de los modelos logen)cos conocidos. Puede u)lizar soRware como PhyML (basado en Phylip), BioNJ, TNT, MrBayes, entre otros.

    Paso 4: Dibujar el rbol logen)co con los datos generados con los programas anteriormente mencionados. Puede u)lizar visores como TreeDyn, Drawgram, Drawtree o cualquier otro diseado para realizar diseo de rboles logen)cos.

  • 1.- click en online programs

    2.- abrir: PhyML, para analizar segn el mtodo

    de Mxima Verosimilitud (Maximun likelihood).

    BioNJ, para analizar segn el mtodo de unin de vecinos (Neighbor-Joining)

    MrBayes, para usar un mtodo bayesiano.

    Independiente del mtodo a elegir, debe usar el archivo descargado en el paso 2.

    PASO

    3

  • 1.- Haga click en examinar y busque el archivo descargado en el paso 2.

    2.- Selecciona un (po de inferencia estads(ca para dar fuerza a la deduccin de brazos en el rbol. En este ejemplo usaremos un test estads)co y no una simulacin (bootstrapping), por el )empo que demora la l)ma opcin.

    3.- Seleccione un modelo de subs(tucin

    4. Presione SUBMIT y espere.

    Si usa PhyML PA

    SO 3

  • 1.- Haga click en examinar y busque el archivo descargado en el paso 2.

    2.- Seleccione un modelo de subs(tucin

    3. Presione SUBMIT y espere.

    Si usa BioNJ PA

    SO 3

  • Independiente del mtodo, al terminar el anlisis aparecer el siguiente cuadro.

    En la misma ventana, ms abajo, encontrar el siguiente men. Haciendo click con el botn derecho sobre Tree in Newick format, descargue el archivo.

    PASO

    3

  • Paso 1: obtener las secuencias de nucle)dos o de protenas de la base de datos Nucleo(de de NCBI. Estas secuencias deben ser homlogas entre las especies a comparar (genes con similar funcin y/o estructura)

    Paso 2: realizar un alineamiento ml)ple u)lizando ClustalW u otro programa similar (MUSCLE, T-coee, 3D-coee, Probcons).

    Paso 3: hacer anlisis con alguno de los modelos logen)cos conocidos. Puede u)lizar soRware como PhyML (basado en Phylip), BioNJ, TNT, MrBayes, entre otros.

    Paso 4: Dibujar el rbol logen)co con los datos generados con los programas anteriormente mencionados. Puede u)lizar visores como TreeDyn, Drawgram, Drawtree o cualquier otro diseado para realizar diseo de rboles logen)cos.

  • Abra un visor de rboles. En este ejemplo usaremos TreeDyn.

    PASO

    4

  • 1.- Haga click en examinar y busque el archivo descargado en el paso 3.

    2. Presione SUBMIT y espere.

    PASO

    4

  • Filograma PhyML

    Filograma BioNJ

    TreeDyn generar logramas similares a los que se muestran a con(nuacin:

    PASO

    4

  • Adems, usted puede congurar la visualizacin de los rboles de acuerdo a las opciones que aparecen ms abajo en la misma ventana.

    Exportar el lograma a otros formatos (como PNG y PDF)

    Cambiar los nmeros de acceso (gi|) por los nombres de los organismos que vienen en el encabezado de la secuencia.

    opciones varias: cambiar colores, reordenar grupos, agregar notas

    Poner nombres personalizados a cada organismo o taxn.

    mostrar u ocultar valores calculados para cada brazo.

    cambiar )po de rbol.

    cambiar tamao de la imagen.

    Click en estos cuadros (y posteriormente el lograma) para ac)var opcin.

    PASO

    4

  • Filograma a par(r de anlisis BioNJ Y nalmente

    humanos y primates

    Mamferos acu)cos

    Caballo comparte ancestro con primates y mamferos acu)cos, pero no forma un clado con ninguna otra especie.

    Ratn comparte un ancestro comn mas lejano con otros mamferos.

    Aves

    Peces

    anbios

    Note que mamferos fueron bien agrupados, incluso formando clados de acuerdo a sus caracters)cas. Por otro lado, se observa que aves, peces y anbios )enen un ancestro en comn que los diferencia de los mamferos, estando los peces mas cercanos a los anbios que a las aves. Finalmente, las bacterias estn totalmente apartadas del resto y, evolu)vamente hablando, con una distancia considerablemente mayor.

    PASO

    4

  • Filograma a par(r de anlisis PhyML

    Observe que el lograma realizado por el mtodo de mxima verosimilitud (ML) muestra algunas diferencias notables respecto al lograma anterior. Con mayor claridad lo podremos observar en un CLADOGRAMA (ver diaposi)va siguiente)

    PASO

    4

  • Cladograma a par(r de anlisis PhyML

    El cladograma muestra la misma agrupacin que el lograma, pero no considera representar en el largo de los brazos la distancia entre las especies evaluadas, lo que nos ayuda a visualizar de forma mas ordenada las agrupaciones. Aqu podemos obsevar que la Orca (Orcinus orca) y el delfn (Tursiops truntatus) estn mas distanciados evolu)vamente del resto de los mamferos que la bacteria Bacillus thuringiensis (lo que a priori no )ene sen)do alguno). Adems, el mamfero acu)co manai (Trichechus manatus) no fue agrupado en el mismo clado del resto de los mamferos acu)cos y junto con el ratn (Mus musculus) fueron evolu)vamente mas cercanos a aves, peces y anbios que a otros mamferos.

    PASO

    4

  • Existen otras representaciones de la misma informacin.

    PASO

    4

    rbol radial a par(r de anlisis BioNJ

    En esta representacin se observa de forma mas clara la distancia evolu)va entre las dis)ntas especies evaluadas.

  • Existen otras representaciones de la misma informacin.

    rbol circular a par(r de anlisis

    PASO

    4

    Otorga la misma ventaja que el rbol radial, con la par)cularidad de que se puede obtener un diagrama en un espacio mas reducido..

  • Ahora le toca a UD

    Recuerde que lo que representa este ejemplo es la evolucin del gen de la LDH, el que se us como algo representa)vo de la evolucin de las especies.

    La seleccin de la secuencia que vamos a u)lizar es clave para poder hacer una inferencia correcta y debe depender de los obje)vos que se persiguen.

    Siempre los anlisis estn sujetos a errores. Se pudo observar que para el mismo set de datos, se encontr mas de una forma de agrupar las especies. Hay que seleccionar el anlisis mas apropiado para el )po de hiptesis que tenemos.