parsimonia - ccg.unam.mxvinuesa/tlem/docs/parsimonytlem.pdf · homoplasia sobre este árbol c b a d...

22
Taller Latinoamericano de Evolución Molecular, David Gernandt 1 Parsimonia ¨la cantidad mínima neta de evolución¨ Edwards, A.W.F., L.L. Cavalli-Sforza. 1964. The reconstruction of evolution. Annals of Human Genetics 27:105-106. Taller Latinoamericano de Evolución Molecular, David Gernandt 2 Relación entre métodos para reconstruir filogenias UPGMA Neighbour joining parsimonia máxima verosimilitud inferencia Bayesiana mínima evolución distancias sitios criterio de optimización algoritmo de agrupamiento Page y Holmes (1998) Taller Latinoamericano de Evolución Molecular, David Gernandt 3 La navaja de Ockham “For nothing ought to be posited without a reason given, unless it is self-evident....-William of Ockham (c. 1288 - c. 1348) Taller Latinoamericano de Evolución Molecular, David Gernandt 4 Willi Hennig Grundzüge einer Theorie der Phylogenetischen Systematik (Hennig, 1950) Phylogenetic Systematics (Hennig, 1966)

Upload: nguyentu

Post on 20-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 1

Parsimonia

¨la cantidad mínima neta de evolución¨

Edwards, A.W.F., L.L. Cavalli-Sforza. 1964. Thereconstruction of evolution. Annals of Human Genetics27:105-106.

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 2

Relación entre métodos para reconstruirfilogenias

UPGMA

Neighbourjoining

parsimonia

máximaverosimilitud

inferencia Bayesiana

mínimaevolución

distancias sitios

crite

rio d

eop

timiz

ació

nal

gorit

mo

de

agru

pam

ient

o

Page y Holmes (1998)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 3

La navaja de Ockham

“For nothing ought to be posited without areason given, unless it is self-evident....”

-William of Ockham (c. 1288 - c.1348)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 4

Willi Hennig

Grundzüge einer Theorieder PhylogenetischenSystematik (Hennig,1950)

Phylogenetic Systematics(Hennig, 1966)

Page 2: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 5

Principios Hennigianos

Los caracteres derivadoscompartidos-lassinapomorfías brindan laúnica evidencia para identificarrelaciones relativas (tiemporelativo en que se compartióun ancestro común)

Hennig, W. 1966. Phylogenetic Systematics. Trasdución por D.D. Davis & R. Zangerl.University of Illinois Press. 263 pp.

autapomorfíasinapomorfíaplesiomorfía

autapomorfía-estado derivado únicoplesiomorfía-estado ancestral

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 6

Un principio HennigianoSe buscará la conformidad máxima

entre evidencia (principio auxiliar p.121). Para escoger entre hipótesisalternativas (cladogramas), sedecidirá con base en cual presentala cantidad mayor de evidencia; elnúmero máximo de sinapomorfíasque pueden ser interpretadascomo homólogos

"checking, correcting and rechecking"

Hennig, W. 1966. Phylogenetic Systematics. Trasdución por D.D. Davis & R. Zangerl.University of Illinois Press. 263 pp.

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 7

aves

aletasantebrazos

alasalas alas

Shuh (2000)

dinos

aurio

spte

rodac

tilos

coco

drilos

larga

tijas

tortug

asmurc

iélag

ootr

os m

amífe

rosan

fibios

pece

s

Homologíaamnion

plumas

pelo

vejiga

no vejiga

exc. acído úrico

escamas

no escamas

no escamasmolleja

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 8

aves

aletasantebrazos

alasalas alas

Shuh (2000)

dinos

aurio

spte

rodac

tilos

coco

drilos

larga

tijas

tortug

asmurc

iélag

ootr

os m

amífe

rosan

fibios

pece

s

Homología transformacional

Page 3: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 9

Diferentes criterios de optimización

Optimización de Farris

Optimización de Fitch (parsimonia de Wagner)

Optimización de Dollo

Optimización de Camin y Sokal

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 10

Los caracteres multiestado se tratan como reversibles yno aditivos (desordenados)

0 a 1 vale un paso, 1 a 2 vale un paso, 0 a 2 vale unpaso

Estados no tienen que ser números enteros

cambios de 0 a 2 cuentan como 1 paso1 2

0

Optimización de Fitch(parsimonia de Wagner)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 11

Los caracteres multiestado se tratan como reversibles yordenados

0 a 1 vale un paso, 1 a 2 vale un paso, 0 a 2 vale dospasos

Estados no tienen que ser números enteros

¿inserciones y deleciones?

0 1 2

Optimización de Farris (1970)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 12

Parsimonia de Dollo"Ley de Dollo": Un carácter complejo puede evolucionar

(de la misma manera) una sola vez

Si se supone que 0 es el estado ancestral, el estadoderivado puede surgir una sola vez, pero se puedeperder múltiples veces

Se prohíbe el parelelismo—la homoplasia sólo se tratancomo reversiones

Se ha aplicado para sitios de restricción (unaderivación, pero múltiples pérdidas)

Page 4: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 13

Parsimonia de Dollo

Soluciones que no violan la restricción de Dollo

El estado 1 (derivado, en este caso) se pierde una, o múltiples veces

A B C D0 01 1

1

1

0

A B C D0 01 1

1

1

1

Swofford (1993) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 14

Parsimonia de Dollo

¿Cuál de las dos reconstrucciones viola la restricción de Dollo?

Swofford (1993)

0

0 0

01 1

1110 0 0

00

1 1

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 15

Dollo y sitios de restricción

Los sitios de restricción son más fáciles deperder por mutación que su ganancia.

HhaIGCGC

12 posibles mutaciones resultan en la pérdida del sitio

ACGCSolo 1 de 12 posibles mutaciones restaura el sitio

-1

+3

- +- 0 3+ 1 0

matriz de pasopara “Dollo relajado”

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 16

Camin-Sokal

se prohíbe la reversión---la homoplasia solopueden tratarse como paralelismos

supone que se sabe el estado ancestral

posible aplicación: deleciones pequeñas (queno sobrelapan)

poca relevancia actual

Page 5: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 17

Parsimonia de Camin y Sokal

Caminalcules: las mejores reconstrucciones minimizaron loscambios de estados; "parsimonia"

Camin, J.H. & R. R. Sokal. 1965. A method for deducing branchingsequences in phylogeny. Evolution 19:311-326 Taller

Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 18

ACCTRAN y DELTRAN

Cuando haya más de una optimización posible...

Swofford (1993)

A B C D0 01 1

ACCTRAN favorece reversiones

1->0

0->1

DELTRAN favorece paralelismos

0->1 0->1

A B C D0 01 1

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 19

Matriz de DNA

A ...CGAATGTCATCG...B ...CGGATGCGACCC...

C ...CGGGTGCGACTG...

D ...TGAACCTCATGG...

E ...TGAACGTCGTGC...

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 20

A ...000000000000...B ...001000110101...

C ...001100110110...

D ...100011000020...

E ...100010001021...

con pesos iguales

Page 6: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 21

Argumentación Hennigiana

los caracteres son polarizados0=plesiomórfico y 1=apomórfico

111 123456789012A 000000000000B 001000110101C 001100110110D 100011000020E 100010001021

B C

4

9

D E

15 7

810

3

2 nada

C

6

D E

11 11

12

B E

Se agrupan los taxacaracter por caracter

B C AD E

1

3

578

1011

41112126 9

Se ensambla el árbol

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 22

Optimización de Fitch

A B C D E

A - 5 6 4 5

B - 3 9 8

C - 9 10

D - 3

E -

Matriz de Manhattan

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 23

Optimización de FarrisMatriz de ManhattanA B C D E

A - 5 6 5 6

B - 3 10 9

C - 10 10

D - 3

E -

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 24

El Método de Wagner(Kluge y Farris 1969; Farris 1970)

algoritmo

conecta los taxones de uno en uno

se le añade lo que muestre el menor número de diferencias

taxa hipotéticos representan los sitios de bifurcación

produce un cladograma (no siempre el más parsimonioso)

polariza los caracteres mediante un ancestro hipotético o posteriormente con un grupo externo

Kluge y Farris (1969); Farris (1970)

Page 7: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 25

1 1 1

taxón 1 2 3 4 5 6 7 8 9 0 1 2A C G A A T G T C A T C G

B C G G A T G C G A C C C

C C G G G T G C G A C T G

D T G A A C C T C A T G G

E T G A A C G T C G T G C * * * * * * * * * * *

* * * * * * * *informativosvariables

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 26

El árbol más parsimonioso

C

B

A D

E

formato Newick: (((C,B),A),(D,E))

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 27

sitio 1

m: # mínimo de cambios = 1s: # cambios observados = 1

índice de consistencia (ic) = m/s

1/1 = 1

el caracter no presentahomoplasia sobre este árbol

C

B

A D

E

1

CT

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 28

sitio 4

m: # mínimo de cambios = 1s: # cambios observados = 1

índice de consistencia (ic) = m/s

1/1 = 1

el caracter no presentahomoplasia sobre este árbol, perotampoco es informativo--autapomorfía

C

B

A D

E

4

AG

Page 8: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 29

sitio 12

m: # mínimo de cambios = 1s: # cambios observados = 2

índice de consistencia (ic) = m/s

1/2 = 0.5

homoplasia: cuando un estado decaracter surge más de una vez

el caracter presentahomoplasia sobre este árbol

C

B

A D

E

12GC

12

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 30

el algoritmo de Fitch (1971)sitio 12

*cobra un paso

cobra 2 pasos para todos lossitios con el patrón:xyxxy

GC G CG

{CG}* {CG}*

{G}

{G}

S T = 0S T

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 31

el algoritmo de Sankoff (1975)

A -> C = 2.5+A -> A = 0

T -> C = 1+T -> A = 2.5

A C G T

Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 32

A C G T

A

C

A

G2.5

0

1

el algoritmo de Sankoff (1975)

Felsenstein (2004)

Page 9: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 33

el algoritmo de Sankoff (1975)

A C G T

A -> A = 2.5+3.5

G -> G = 3.5+3.5

Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 34SaimiriLemur Macaca

Hylobates

Tarsius

PanGorilla HomoPongo

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 35

ArchivoNEXUS

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 36

1 de 2AMPs

Page 10: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 37

2 de 2AMPs

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 38

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 39

consistencyindexci = m/s

homoplasyindexhi = 1-ci

retentionindexri = (g-s) / (g-m)

rescaledconsistencyindexrc = ci X ri

L= Longitud Length

m = pasos minMin steps

s = pasos árbolTree steps

g = pasos maxMax steps

des /diagnose

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 40

estados 111211222311311222322211311221frec estados men 0001003424004001

111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAATvariables * **** * ******* * **informativos (pics) **** * ****** * *

Page 11: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 41

g = pasos maxMax steps

c t t

t

c

c

c

c

c

c

c

c

posición 7

pasos mínimos: m=1pasos máximos: g = 3

c

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 42

111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT

pasos mínimos: m=1pasos sobre el árbol: s=1pasos máximos: g = 1

ri = (g-s)/(g-m)=(1-1)/(1-1)=0/0

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 43

111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT

pasos mínimos: m=1pasos sobre el árbol: s=2pasos máximos: g = 3

ri = (g-s)/(g-m)=(3-2)/(3-1)=1/2=0.5 Taller

Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 44

111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT

CI HIRI RC

pasos sobre el árbol = 3

Page 12: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 45

usertype 2_1 = 4 [weights transversions 2 times transitions]

a c g t [a] . 2 1 2 [c] 2 . 2 1 [g] 1 2 . 2 [t] 2 1 2 . ;

Hayasaka, K., T. Gojobori, and S. Horai. 1988. Molecular phylogeny and evolution of primate mitochondrial DNA. Mol. Biol. Evol. 5:626-644.]

2 2

1

a

c t

2 <= 2 + 1

Inequidad del Triángulod(ac) <= d(ct) + d(at)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 46

ctype 2_1:all;hs;1 AMP

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 47

Savolainen, V.J., M.W. Chase, S.B. Hoot, C.M. Morton, D.E Soltis, C. Bayer, M.F.Fay, A.Y. de Bruijin, S. Sullivan, Y.-L. Qiu. 2000. Phylogenetics of flowering plantsbased on combined analysis of plastid atpB and rbcL gene sequences. Syst. Biol.49:306-362. Taller

Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 48

Page 13: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 49

Pesos sucesivos

"Successive Weighting" (Farris 1969)

a posteriori

Se puede asignar pesos según CI, RI o RC en PAUP(hay que justificar porque se escoge uno de los tres!)

El resultado final depende mucho del árbol inicial

No se usa mucho actualmenteTallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 50

¿Porqué calcular todos los árbolesposibles?

Para espantar a los taxónomos.-Felsenstein (1978)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 51

A

B

C

A C

B D

A B

C D

A C

D B

A B

C D

6

710

8

9

A C

B D

1

25

3

4

A B

C D

11

1215

13

14

todos los posibles árboles bifurcadossin raíz

3 taxa

4 taxa

5 taxa

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 52

número de taxa número de árboles

número de árboles enraizados y bifurcados

1 12 13 34 155 1056 9457 10,3958 135,1359 2,027,02510 34,459,42511 654,729,07512 13,749,310,57513 316,234,143,22514 7,905,853,580,62515 213,458,046,676,87516 6,190,283,353,629,37517 191,898,783,962,510,62518 6,332,659,870,762,850,62519 221,643,095,476,699,771,87520 8,200,794,532,637,891,559,37521 319,830,986,772,877,770,815,62522 13,113,070,457,687,988,603,440,625 Felsenstein (2004)

Page 14: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 53

número de árboles bifurcados sin raíz

B (t) = (2i - 5)i = 3

t

IIB (t): número de árboles sin raíz para t taxa

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 54

ejemplo para 8 taxa

(2 x 3 - 5) x (2 x 4 - 5) x (2 x 5 - 5)x (2 x 6 - 5) x (2 x 7 - 5) x (2 x 8 - 5)

1 x 3 x 5 x 7 x 9 x 11 = 10,395

B (t) = (2i - 5)i = 3

t

II

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 55

Árboles etiquetados

• no enraizados• enraizados• bifurcados

– nodos internos con 3 grados• multifurcados

– nodos internos con >= 3 grados• forma

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 56

métodos de búsquedas

Aproximadas (heurísticas)empezar a partir de un árbol

predefinido (actual)NJescogido al azaradición secuencial

con el orden de agregar taxa 1) como tal, 2) más cerca, 3) más lejos,4) simple (Wagner), 5) al azar

intercambio de ramasnearest neighbor interchangesubtree pruning regraftingtree bisection reconnection

Exactasexhaustiva (hasta 11 taxa)branch-and-bound (hasta ca. 25 taxa)

Page 15: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 57

punto de inicio

óptima local óptima global

óptima local vs. óptima global

algoritmos codiciosos escogen la primera opción mejor que la actual

Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 58

nearest neighbor interchange (NNI)subárbol

disolver las conexiones de una rama interior

reformar las conexiones en una de dos maneras

tres topologías posiblespara 4 taxa

a

db

c

a

db

c

a

db

c a

db

c

Felsenstein (2004)

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 59

subtree pruning and regrafting (SPR)

disolver una rama interior, remover un subárbol

agrega el subárbol a otra rama (*)

el resultado

a

db

ce f

a

db

ce f

a

db

ce f4

32

1*

c

fd

ea b

Swofford (1993) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 60

tree bisection and reconnection (TBR)

separa un subárbol

conectar una rama, a la rama del otro

el resultado

a

db

ce f

a

db

ce f

disolver una rama

a

db

ce f

a

fe

cb d

Page 16: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 61

TBR puede considera más árboles queSPR y NNI

NNI: 2 (n - 3)

SPR: 4 (n - 3)(n - 2)

TBR: no hay formula exactanúmero máximo es (2n1 - 3)(2n2 - 3)

para n = 6 taxa,

NNI: 2 (6 - 3) = 6 vecinos

SPR: 4 (6 - 3)(6 - 2) = 48 vecinos Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 62

Nuevos métodos de búsquedasheurísticas

Matraca (parsimony ratchet; Nixon 1999)cada iteración aplica pesos a alguna proporción de los

caracteres

Fusión de árboles (Goloboff 1999)intercambia subárboles con los mismos taxa entre dos árboles

óptimos o casi óptimos

Búsqueda sectorial (Goloboff 1999)Deriva de árboles (Tree-drifting/Simulated Annealing;

Goloboff 1999)durante intercambio de ramas, se acepta árboles subóptimos

con una cierta probabilidad

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 63

Nixon, K.C. 1999. The parsimony ratchet, a newmethod for rapid parsimony analysis. Cladistics15:407-414.

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 64

branch-and-bound

5

7L=7

3L=9

límite superior

4L=9

empate límite superior

5L=9

6L=9

7L=11

8L=10

9L=7

10L=10

11L=8

12L=10

13L=11

14L=11

15 árboles posibles,evaluó 3 subárboles más 11 árboles

Page 17: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 65

Árboles de consenso

Para resumir clados compartidos entre árboles diferentes (p. ej.AMPs, muestreo de árboles Bayesianos)

Estricto: combina en un árbol aquellos componentes queaparecen repetidos en TODOS los árboles originales. Este árbolde consenso tiene menor resolución que todos los tipos deconsenso

De mayoría: árbol que incluye los componentes que aparecen enla mayoría de los originales (>50%; la mitad más uno). Esteárbol de consenso puede ser inconsistente con uno o más delos árboles originales

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 66

Árboles de consenso

321

B D E GF H IA C C D E GF H IA B C E B GF H IA D

B D E GF H IA

consenso estricto

C B D E GF H IA C

mayoría

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 67

D.S. Gernandt, S.A. Magallón, G. Geada López, O. Zeron Flores, A. Willyard y A. Liston.2008. Use of Simultaneous Analyses to Guide Fossil-based Calibrations of PinaceaePhylogeny. International Journal of Plant Sciences 169:1086-1099.

consenso estricto de 5 AMPs658 caracteres informativosL=2167, ICe=0.559, IR=0.676bootstrap/decaimiento

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 68

Bootstrap

Remuestreo (Felsenstein 1985)

Remuestreo con reemplazamiento de los datos originales

Cada replicado tiene la misma cantidad de caracteres (y taxa) peroalgunas caracteres están representados una o más veces yotros no aparecen

Con cada matriz se puede obtener diferentes árboles. El apoyo deuna rama será el porcentaje de veces que el grupo que defineaparece en el conjunto de árboles de las replicados debootstrap

Page 18: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 69

char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0

char 1 1 3 4 4 4 6 7 10 10 11 11A 1 1 0 0 0 0 1 0 1 1 1 1B 1 1 0 0 0 0 0 0 1 1 1 1C 0 0 0 0 0 0 0 0 1 1 1 1D 0 0 1 1 1 1 0 0 1 1 0 0E 0 0 1 1 1 1 0 0 1 1 0 0F 0 0 0 0 0 0 0 0 0 0 0 0

matriz original

matriz para una réplica de bootstrap

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 70

Se puede aplicar el bootstrap conpesos

char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0rep1 2 0 1 3 0 1 1 0 0 2 2 0rep2 0 1 1 2 2 1 2 0 1 0 0 2rep3 1 2 0 0 1 2 0 2 1 1 0 2rep4 1 1 0 1 2 0 1 1 2 2 0 1repn 0 2 2 0 1 1 2 0 1 1 2 0

pesosm

atriz original

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 71

Jackknife

char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0

char 1 2 4 5 8 12A 1 0 0 1 0 1B 1 0 0 1 0 0C 0 0 0 0 0 0D 0 1 1 0 1 0E 0 1 1 0 1 1F 0 0 0 0 0 0

50% jackknifesegundo orden = borrar caracteres

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 72

Decay Index

Bremer (1988)

Apoyo de Bremer o índice de descomposición

Examina cuantos pasos extra se requieren para que se pierda unarama que está presente en todos los AMPs

Page 19: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 73

Intentos de derivar parsimoniade máxima verosimilitud

Farris (1973, 1977)Felsenstein (1979, 1981)Goldman (1990)Ningún mecanismo en común (Penny et al.

1994 y Tuffley & Steel 1997)muchos parámetros, inconsistente

L = Prob (Datos Árbol) La verosimilitud (likelihood) mide la probabilidad de los datos dado el árbol

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 74

Parsimonia con pesos iguales

Se porta como máxima verosimilitud cuando las tasasde cambio en los caracteres son bajas

En otras palabras, el criterio de minimizar cambios(parsimonia) es adecuado cuando los cambios sonpocos

¿Entonces, qué hacer cuando las tasas son más altas?

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 75

El Modelo de Goldman

Goldman (1990)

produce resultados idénticos a parsimonia con pesosiguales

Supuestos:–la misma cantidad de cambio evolutivo (promedio)ocurre en cada rama del árbol–la verosimilitud depende en una combinaciónparticular de estados de caracteres

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 76

Propiedades estadísticas de métodosde reconstrucción filogenéticos

consistencia: converge en el parámetro verdadero alagregar más datos (al acercar a datos infinitos)

no sesgado: su valor promedio para muchos muestreosse centra en el parámetro correcto

eficiencia: la varianza de los muestreos converge a unvalor mínimo (encuentra la respuesta correcta conmenos datos)

robustez: si es consistente, no sesgado y/o eficientebajo un rango amplio de distribuciones de muestreo

Page 20: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 77

Atracción de ramas largas

consistente

inconsistente

“Zona de Felsenstein”

Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 78

¿Dónde fallan los métodos?

Huelsenbeck et al. (1996)

UPGMA Parsimonia

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 79

Simulaciones con longitudes deramas iguales

Huelsenbeck et al. (1996) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 80

Simulaciones con dos ramasexternas largas

Huelsenbeck et al. (1996)

Page 21: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 81Page & Holmes (1998) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 82

"Romper" ramas largas

Hillis (1996)

atracción presenta más problemas cuando las ramas largas están próximas

18S nrDNA228 angiospermas

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 83

Parsimonia y reconstrucción delongitudes de ramas

Muchas reconstrucciones más parsimoniosos son posibles sobreel mismo árbol

Mediante modelos probabilísticos, se ha calculado la frecuencia deerror en asignar estados a nodos internos mediante parsimonia(Maddison 1984)

Se puede calcular el promedio de longitudes pero depende de laposición de la raíz

los promedios subestiman el número de cambios trascurridos

métodos de distancia y de verosimilitud toman en cuenta laprobabilidad de cambios

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 84

“La zona de Farris”

Cuando especies hermanas tienen ramas largas,parsimonia converge en la solución correcta antesque verosimilitud

Felsenstein (y Swofford): "El sesgo inherente enparsimonia favorece la solución correcta"

No es la contraparte de atracción de ramas largas

Felsenstein (2004)

Page 22: Parsimonia - ccg.unam.mxvinuesa/tlem/docs/ParsimonyTLEM.pdf · homoplasia sobre este árbol C B A D E G 12 C Taller Latinoamericano de Evolución Molecular, 22 de Junio al 3 de Julio

TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México

David Gernandt 85

Parsimonia e inconsistencia: otrasconsideraciones

¿Es consistencia el criterio más relevante para escogerentre métodos?

¿Las condiciones que causan atracción de ramaslargas son comunes?

Parsimonia se parece a verosimilitud bajo muchascondiciones, pero mucho más rápido y más simplede entender y explicar