center for biological sequence analysis consensus trees anders gorm pedersen molecular evolution...

111
CENTER FOR BIOLOGICAL SEQUENCE ANALYSIS Consensus Trees Anders Gorm Pedersen Anders Gorm Pedersen Molecular Evolution Group Molecular Evolution Group Center for Biological Sequence Analysis Center for Biological Sequence Analysis Technical University of Denmark Technical University of Denmark [email protected] [email protected]

Post on 21-Dec-2015

223 views

Category:

Documents


0 download

TRANSCRIPT

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Consensus Trees

Anders Gorm PedersenAnders Gorm Pedersen

Molecular Evolution GroupMolecular Evolution Group

Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis

Technical University of DenmarkTechnical University of Denmark

[email protected]@cbs.dtu.dk

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Strict Consensus Tree

Hu Ch Go Or Gi Hu Ch Go Or Gi

Tree 1 Tree 3

Hu Ch Go Or Gi

Tree 2

Hu Ch Go Or Gi

Strict consensus

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

Hu Ch Go Or Gi Hu Ch Go Or Gi

Tree 1 Tree 3

Majority rule consensus

Hu Ch Go Or Gi

Tree 2

Hu Ch Go Or Gi

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** --

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** --

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- II

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- II

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- II

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIIIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIIIII

** -- -- -- ** ** II

** -- -- ** ** ** II

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIIIII

** -- -- -- ** ** II

** -- -- ** ** ** IIII

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF CountCount

** -- -- -- ** -- IIIIII

** -- ** -- ** -- IIIIII

** -- ** -- ** ** II

** -- ** -- -- -- II

** ** ** -- ** -- IIIIII

** -- -- -- ** ** II

** -- -- ** ** ** IIII

-- -- ** -- ** -- II

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- -- -- ** -- 6060

** -- ** -- ** -- 6060

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** ** ** -- ** -- 6060

** -- -- -- ** ** 2020

** -- -- ** ** ** 4040

-- -- ** -- ** -- 2020

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

E

A

B

D

F

C

60 60

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

AA BB CC DD EE FF FreqFreq

** -- ** -- ** -- 6060

** -- -- -- ** -- 6060

** ** ** -- ** -- 6060

** -- -- ** ** ** 4040

** -- ** -- ** ** 2020

** -- ** -- -- -- 2020

** -- -- -- ** ** 2020

-- -- ** -- ** -- 2020

E

A

B

D

F

C

60 60 60

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Majority Rule Consensus Tree

E

A

B

D

F

C

60 60 60

A

E

C

F

B

D

C

A E

B

D

FA

E

F

D

B

C

A

E

B

C

DF

C

E

A

B

D

F

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction

Anders Gorm PedersenAnders Gorm Pedersen

Molecular Evolution GroupMolecular Evolution Group

Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis

Technical University of DenmarkTechnical University of Denmark

[email protected]@cbs.dtu.dk

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Sankoff: length of 4 possible subtrees starting at internal node?

C A C A G

AA CC GG TT

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Sankoff: length of subtree having nucleotide “A” at internal node

C A

11

1 0

TTGGCCAA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Sankoff: length of subtree having nucleotide “C” at internal node

C A

11 11

0 1

TTGGCCAA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22

1 1

C A

Sankoff: length of subtree having nucleotide “G” at internal node

TTGGCCAA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 22

1 1

C A

Sankoff: length of subtree having nucleotide “T” at internal node

TTGGCCAA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

C A C A G

11 11 22 22

Sankoff: length of 4 possible subtrees starting at internal node?

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

C A C A G

Sankoff: length of 4 possible subtrees starting at internal node?

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

1

0

length of subtree = 1+0+1 = 2

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

1

1

length of subtree = 1+1+2 = 4

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

1

1

length of subtree = 1+1+1 = 3

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

1

1

length of subtree = 1+1+2 = 4

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

AA

C A C A G

Sankoff: length of shortest possible subtree having “A” at internal node?

1

0

length of subtree = 1+0+1 = 2

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

11 11 22 2211 22 11 22

22

C A C A G

Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees

11 11 22 2211 22 11 22

22 22

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees

11 11 22 2211 22 11 22

22 22 22 33

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees

11 11 22 2211 22 11 22

22 22 22 33

33 33 44 55

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees

11 11 22 2211 22 11 22

22 22 22 33

33 33 44 55

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA

AA

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA

AA

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AAAA

AA

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AAAA

AA

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step III: Placement of Changes

AAAA

AA

A A

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AAAA

AA

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA CCAA

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA CCAA

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step II: Backtracking

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step III: Placement of Changes

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step III: Placement of Changes

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction Step III: Placement of Changes

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral Reconstruction: State Sets

AA CCAA CC GG

AA CC

A A CC

C A C A G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral reconstruction: experimental analysis of extinct molecules

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral reconstruction

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral reconstruction: dinosaur night vision

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral reconstruction: thermostability of ancestral proteins

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Ancestral reconstruction: thermostability of ancestral proteins

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Phylogeny and ancestral reconstruction for manuscripts

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Branch Lengths

0.25 0.75

0

0.25

0.5

0

0.750.5

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Problems With Parsimony

Anders Gorm PedersenAnders Gorm Pedersen

Molecular Evolution GroupMolecular Evolution Group

Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis

Technical University of DenmarkTechnical University of Denmark

[email protected]@cbs.dtu.dk

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Phylogenetically Informative Sites

1 3

42

1 2

43

1 2

34

1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Phylogenetically Informative Sites

G C

CG

G G

CC

G G

CC

1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A

G C

C C

C C

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Not Informative

G C

TG

G G

TC

G G

CT

1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A

G G

G G

G G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Not Informative

G G

CG

G G

CG

G G

GC

1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A

G G

G G

G G

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Not Informative

G T

AC

G C

AT

G C

TA

1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A

C C

T T

C C

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Long Branch Attraction

1

2 3

4

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Long Branch Attraction

A

AA

A A

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Uninformative

A

AA

A A

AA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Uninformative

A

AA

A A

CA

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Uninformative

A

AA

A A

CG

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Misinformative

A

AA

A A

GG

CE

NT

ER

FO

R B

IOLO

GIC

AL

SE

QU

EN

CE

AN

ALY

SIS

Informative

A

AG

G A

AG