МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ...

35
МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших или возникших генов: регенерация тканей, развитие конечного мозга, долгожительство, неотения и т.д.

Upload: others

Post on 26-May-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

МОДЕЛЬ 7.

Гомологи, Ортологи и Парологи.

Поиск исчезнувших или возникших генов:

регенерация тканей, развитие конечного мозга,

долгожительство, неотения и т.д.

Page 2: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

наши дни

время послед. общегопредка видов 1 и 2

Г1 Г2 Г3⋯ ~ ⋯ ~ ⋯ ~ ⋯

Г1 Г2⋯ ~ ⋯ ~ ⋯

Г1⋯ ~ ⋯

ГЕН⋯ — ⋯

ВИД 1 ВИД 2

← относит сохранение

← изменение

← дупликация

Г0⋯ — ⋯

Г1⋯— ⋯

Г5 Г1⋯ ≈ ⋯ ~ ⋯

Г2 Г1⋯ ~ ⋯ ~ ⋯

× Г1⋯ ⋯ ~ ⋯потеря →

перенос →

видообразование →

дупликация →

Кстати, каким был LUCA?

Важно строить сценарий

эволюции (=какие эвол

события случились.

Page 3: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Биологически ортологи происходят в результате эволюцион-

ного события – видообразования (бывшего когда-то): в тот

момент весь геном разошёлся и затем каждый ген менялся по

своему. Гены-ортологи находятся в разных видах. Они отчасти

похожи по последовательности.

Бывают и другие эволюционные события, также приводящие к

похожести генов/белков. А именно, в том же самом виде ген

дуплицируется и каждая копия развивается по своему, обра-

зуются in-паралоги (=паралоги). Гены-паралоги находятся в

одном виде. Они также похожи по последовательности.

Ортологи и Парологи имеют разное происхождение; они отли-

чаются по функции!, хотя можно ожидать, что и в какой-то

мере сходны по ней.

Page 4: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Например, разные паралоги экспрессируются (читаются) в

разных условиях, в разных тканях, на разных этапах развития

организма, имеют разную экспрессию (уровни чтения) и т.д.

Ортологи и Паралоги (гены, белки) похожи (=гомологич-

ны) в какой-то мере по последовательности после вырав-

нивания. Пример на следующем слайде.

Orthologs and Paralogs are two types of homologous sequences.

Orthology describes genes in different species that derive from a

common ancestor. Orthologous genes may or may not have the

same function. Paralogy describes homologous genes within a

single species that diverged by gene duplication.

Page 5: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Пример паралогов, ортологов и гомологов:

Page 6: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Принципиально: всё это – умозрительные описания.

Как фактически определять:

кто есть ортологи и кто паралоги???!---------------------------------------------------------------------------------------------------------------

О другом:

ещё важное эволюционное событие – образование

out-паралогов (=горизонтальных переносов).

Ещё типы эволюционных событий:

потери и возникновения генов,

деление гена на части и объединение генов вместе

Page 7: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Таблицы ортологов и паралогов для многих видов

имеются в базе Ensembl, но это один из вариантов их

определения.

Мы это умеем делать и по другому: реконструкцией по

дереву хромосомных структур

ИЛИ даже ещё по другому при решении задачи о

потери генов, которая будет рассматриваться ниже.

Page 8: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Важнейшее понятие – «тот же самый» ген (= соответст-

вие генов в разных видах, =ортологичность). Оно часто

определяется по близости нуклеотидных последователь-

ностей после их выравнивания (двух или нескольких).

Часто учитывается ещё расположение интронов в

генах.

Или: по близости после выравнивания аминокислотных

последовательностей, кодируемых этими генами белков.

Но оказывается близости генов недостаточно для

решения вопроса, тот же ли это самый ген.

Что такое «тот же самый» ген (=белок)?

Page 9: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Итак, ген Х' – «тот же самый» в b, что и Х из а, если Х' и Х

не только похожи по последовательности, но в окрестнос-

тях Х' и Х фиксированного размера имеются: 2 гена около

Х соот-но похожих на 2 гена около Х' («свидетели» для Х).

[Наличие свидетелей называется синтенией: это – сохра-

нение совместной локализации генов у разных видов.]

В ходе эволюции переносы генов по хромосоме (трансло-

кации) могут лишить Х свидетелей или наоборот создать

их; в результате чего происходит потеря/возникновение

синтении.

Для эукариотических геномов мы не различаем направле-

ния генов (т.е. цепи ДНК) и расположения свидетелей.

Page 10: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Если в последовательности по некоторым

признакам похожей на ген много стопов-кодонов,

то это псевдоген!

У человека имеется псевдоген SMPD5P и ген

Smpd3. А у мыши оба они гены.

Каково их соответствие у человека и мыши

(не пользуясь именами)?

Свидетели помогают ответить на вопрос,

см. след слайд.

Page 11: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Ген Smpd5 мыши соответствует псевдогену SMPD5P челове-

ка (показан серым). Выравнивание локусов, содержащих эти

ген и псевдоген Smpd5 у мыши и человека. Сохранился сосе-

дний ген Oplah, как и другие гены-соседи.

Аналогичны и экзоны. На рисунках экзоны – толстые прямоу-

гольники

Page 12: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Выравнивание локусов, содержащих гены Smpd3 у мыши и

человека с сохранением соседних генов Slc7a6os и Prmt7.

Кроме того, в генах Smpd3 сохранились многие экзоны и

интроны.

Page 13: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Гены мыши Smpd5 (ENSMUSG00000071724) и Smpd3

(ENSMUSG00000031906) – паралоги, кодирующие белок

сфингомиелиназа (работающий в нейтральной среде).

Наибольшая экспрессия гена Smpd5 наблюдается в семенни-

ках, а у гена Smpd3 – во многих тканях, включая головной

мозг. [Сфингомиелиназа участвует в образовании пор из

церамида, через которые в синаптическую цель освобождают-

ся нейромедиаторы (Alessenko, 2013).]

Человек «после» мыши: у человека сохранился только ген

Smpd3, а на месте гена Smpd5 расположился псевдоген, не

кодирующий белок. Потеря гена Smpd5, а не его паралога

Smpd3, определяется по соседям= по геномному контексту =

по синтении.

[У мыши ген Smpd5 расположен на хромосоме 15, а ген Smpd3

– на хромосоме 8.]

Page 14: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших
Page 15: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Понятие синтении имеет несколько сходных трактовок, мы

рассмотрим одну из них.

Задача: для гена Х из вида а решить, сохранился ли он в

виде b; нужно среди многих его гомологов в виде b

найти ген Y с учётом свидетелей =сохранения

соседей = синтении у Х; при этом хорошо бы учесть

паралоги Х в а и Y в b.

Зачем?

Идея: найти гены Х в виде а, которые в период жизни а

и около того были, а после этого времени утратили-

сь! Сам этот момент выбирается на шкале времени.

Page 16: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Для этого проверяется «двухвидовое» условие :

а

b

Но как определять ортологи?

Page 17: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

выбирается вид а, который называется базисным

(например, лягушка или мышь).

В нём перебираются все белок кодирующие гены Х и для

текущего X в указанном другом виде b проверяется:

в b имеется ген X', похожий по последовательности на X;

а в окрестности X радиуса r имеется р различных генов-

свидетелей, например, Y и Z, у которых имеются

хорошие гомологи Y' и Z' в окрестности X' радиуса r'.

Это условие называется двухвидовым.

Итак, один из наших алгоритмов основан на:

Page 18: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Гены, утраченные в связи с ослаблением

регенеративной потенции и развитием конечного мозга

у плацентарных (=высших млекопитающих),

у млекопитающих против более ранних видов,

у амниот против анамниот (амфибий и рыб)

(см. слайд 14 –

там можно выбрать, где провести границу).

Page 19: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Роль генов Ag1, Ras-dva1 и Noggin4 в регенерации?

=амниоты

Page 20: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Ag1, Ras-dva1 и Noggin4 вызывают экспрессию регулятора (гена

FoxG1) вентральной (верхняя) области конечного мозга. Нервная

пластинка – зачаток ЦНС. Pallium – кора головного мозга.

контроль

FoxG1 ингибирует развитие дорсальной (задней) области конечного

мозга. Можно предположить: исчезновение Ag1, Ras-dva1 и Noggin4 у

предков высших позвоночных привело к снижению уровня

экспрессии FoxG1, что, стимулировало развитие дорсальной области

конечного мозга.

Page 21: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Подавление генов Ag1, Ras-dva1 или Noggin4 у эмбриона шпорцевой

лягушки вызывает ингибирование экспрессии гена FoxG1 и стимулирует

деление клеток, что приводит к увеличению размеров конечного мозга.

развитие

Эти данные согласуются с гипотезой о том, что исчезновение генов Ag1, Ras-

dva1 и Noggin4 у предков высших позвоночных могло быть одной из причин

увеличения у них дорсальной области конечного мозга.

Page 22: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших
Page 23: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Итак, ищем гены Х лягушки, представленные у рыб, но

утраченные (в той или иной мере) эволюционно выше.

Page 24: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Отбор только по сходству последовательностей

(по гомологии) недостаточен:

ближайшиегомологи

ближайшиегомологи

Отбор по гомологии с учётом свидетелей лучше:

Page 25: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Трёхвидовое условие: а – базисный вид (лягушка),

b – соседний к а вид (рыба), с – высший вид (homo):

а

b

c

Page 26: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Отрицание трёхвидового условия для поиска

утраченных генов:

ген Х со свидетелями не представлен «вверх»

(иначе – достаточно двухвидового условия), но Х

представлен в базисном виде а (лягушке) и ген U –

«заменитель» Х в рыбе b и U представлен «вверх» в

с (например, в человеке или морской свинки).

Пример – на след слайде с – морская свинка.

Page 27: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

ENSGACG00000007608

ENSGACP00000010090

fzd9b

Cavia

porcellus

Xenopus

tropicalis

Gasterosteus

aculeatus

ENSCPOG00000011826

ENSCPOP00000018492

FZD9

ENSXETG00000023966

ENSXETP00000051708

sfrpx

нет синтении с

млекопитающими

BBH

9.0E-104

BBH

4.0E-100

…23967

…51709

LRTOMT

…23968

…51710

folr1

…7832

…10380

LRTOMT

…7809

…10359

FOLR1

…174

…151

SERPINE1

…1746

…1577

ACHE

…7161

…9482

serpini1

…7230

…9613

BCHE

BBH

0

3.0E-59

3.0E-23

BBH

0

scaffold 30

groupI

GL174277.1

Трёхвидовое условие через BLAST

Page 28: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Ген ENSXETG00000023966 (sfrpx) потерян у птиц и плацен

млекопитающих, но имеет «заменителя» – ген fzd9b у рыбы

Gasterosteus aculeatus (трёхиглой колюшки), который

представлен как FZD9 у морской свинки Cavia porcellus (при

определённом понимании связей =стрелок).

Показан локус в геноме лягушки – базисный вид:

Этот ген сохранился у черепахи Pelodiscus sinensis,

лягушки, рыб. Он содержит богатый цистеином

экстрацеллюлярный домен (C6 box), типичный для

рецептора MuSK.

Page 29: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Гены, утраченные у видов с высокой

продолжительностью жизни (ПЖ)

и с подобными особенностями

Page 30: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Выполнен поиск генов мыши, которые сохранились

с учётом геномной синтении у грызунов или кролика,

а также у приматов с малой ПЖ, но пропали у голого

землекопа, дамарского пескороя, человека,

человекообразных обезьян и капуцина,

т.е. у видов с относительно высокой ПЖ.

Присутствие гена хотя бы у двух приматов

существенно, чтобы исключить гены, специфичные

для грызунов – родственников мыши.

Page 31: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Видовая продолжительность жизни (ПЖ) в годах

для некоторых видов с учётом их размера

Знак – показывает утрату найденных у мыши генов.

Знак + наличие этих генов. Сами гены не приведены.

Вид ПЖ

серая крыса 3,8 +

сирийский хомячок 3,9 +

домовая мышь 4 +

европейский кролик 9 +

дамарский пескорой 15,5 –

голый землекоп 32 –

Page 32: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Вид ПЖ

галаго Гарнетта 15,7 +

филиппинский долгопят 16 +

серый мышиный лемур 18,2 +

обыкновенная игрунка 22,8 +

белощёкий хохлатый гиббон 44,1 –

белоплечий капуцин 54,8 –

бонобо 55

суматранский орангутан 58 –

шимпанзе 59,4 –

западная равнинная горилла 60,1 –

человек разумный 122,5 –

Page 33: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Многие гены мыши, потерянные

у видов с высокой ПЖ, в

наибольшей степени

экспрессируются в семенниках.

Данные об экспрессии генов

приведены в базе данных

Expression Atlas

https://www.ebi.ac.uk/gxa/home

Page 34: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Но небольшой уровень экспрессии найденных генов

обычно наблюдается во многих органах. Эти гены

могут быть потенциально опасны, если соответству-

ющие белки накапливаются в течение длительного

времени. При этом онкологические и нейродегенера-

тивные заболевания развиваются достаточно

медленно, чтобы не оказывать существенного

воздействия на молодые организмы.

[Иными словами, можно предполагать обнаружение

новых примеров антагонистической плейотропии,

т.е. противоположных фенотипических эффектов

одного гена (Williams 1957).]

Page 35: МОДЕЛЬ 7 - lpcs.math.msu.sulpcs.math.msu.su/~lyubetsky/mfk2017/mfk17-18_7.pdf · МОДЕЛЬ 7. Гомологи, Ортологи и Парологи. Поиск исчезнувших

Ещё один ген Wap из нашей таблицы кодирует whey

acidic protein (WAP). Этот белок впервые описан в

молозиве коров (Bezkorovainy 1965). WAP в небольшом

количестве присутствует в молоке мышей и составляет

значительную долю белка в молоке кроликов. WAP

ингибирует рост бактерий Staphylococcus aureus, а

также ингибирует пролиферацию mammary epithelial

cells (Seki et al. 2012).

Возможно, потеря этого гена у видов с высокой ПЖ

связана с увеличением продолжительности кормления

детёнышей молоком.