С.А.Спирин, 13 .11.20 12
DESCRIPTION
Алгоритмы обработки пространственных структур макромолекул Поверхность макромолекул Гидрофобное ядро Выделение доменов. С.А.Спирин, 13 .11.20 12. I. Поверхность белковой молекулы. Миоглобин свиньи (1MNO). Поверхность РНК-зависимой РНК-полимеразы полиовируса. Product RNA. Fingers. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/1.jpg)
Алгоритмы обработки пространственных структур макромолекул
Поверхность макромолекулГидрофобное ядро
Выделение доменов
С.А.Спирин, 13.11.2012
![Page 2: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/2.jpg)
I. Поверхность белковой молекулы
![Page 3: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/3.jpg)
Миоглобин свиньи (1MNO)
![Page 4: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/4.jpg)
Fingers
Palm
Thumb
Template RNA
Product RNA
NTP
Поверхность РНК-зависимой РНК-полимеразы полиовируса
![Page 5: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/5.jpg)
Зачем нужна поверхность как отдельный объект?
• Для вычисления площади поверхности. Площадь поверхности контакта двух молекул позволяет оценить их взаимодействие и, следовательно, стабильность комплекса.
• Для визуализации на поверхности электростатического потенциала, гидрофобных областей и других характеристик.Помогает предсказывать области белка, взаимодействующие с другими молекулами, проверять корректность моделей.
• Для выявления полостей, каналов в белке, карманов и т.п.
![Page 6: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/6.jpg)
Зачем нужна поверхность как отдельный объект?
(продолжение)
• Для выявления остатков, экспонированных на поверхности белка.Следовательно, доступных для воды, ионов, лигандов.
• Для поиска сходных областей поверхности.Если в одном белке область важна для взаимодействия с другой молекулой, то для похожей области в другом белке можно предсказать подобное же взаимодействие.
• Для много другого (расчет энергии сольватации, симуляция молекулярной динамики, докинг, …)
![Page 7: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/7.jpg)
Три поверхности макромолекулы
• ван-дер-ваальсова поверхность (VdW)
• поверхность, доступная для растворителя (SAS)
• поверхность Конноли
![Page 8: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/8.jpg)
Что такое “поверхность”?
Ван-дер-ваальсова поверхность (схема)
![Page 9: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/9.jpg)
Ван-дер-Ваальсовы радиусы (Å) для атомов некоторых элементов (по Ли и Ричардсу)
S 1,80
P 1,80
O 1,52
N 1,55
C 1,70
H 1,20
(в литературе можно найти и другие значения)
![Page 10: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/10.jpg)
1MNO: миоглобин свиньи, натуральная модель (spacefill); видны сквозные просветы
![Page 11: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/11.jpg)
В геометрии поверхность тела – это граница между ним и внешней средой
В микромире “твердых тел” не бывает!
Нужно указывать для каких частиц непроницаема молекула – нейтрино? фотонов? электронов? протонов? других молекул (каких)?
![Page 12: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/12.jpg)
Поверхность фонтана (!?)
![Page 13: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/13.jpg)
Концепция поверхности белка (Lee, Richards, JMB 1971)
1. Ван-дер-Ваальсова поверхность
2. Поверхность, доступная для растворителя (воды) (SAS, solvent accessible surface)
SAS — это поверхность области допустимых положений центров молекул воды
![Page 14: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/14.jpg)
VdW поверхность и поверхность, доступная для воды
![Page 15: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/15.jpg)
Поверхность, доступная для воды, определяется аналогично VdW поверхности, но для условных радиусов (вместо ван-дер-ваальсовых):
усл. радиус = VdW радиус + радиус молекулы воды (1,4 Å)
Поэтому “для математика” поверхности VdW и SAS одинаковы (строятся по одному правилу)
![Page 16: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/16.jpg)
Поверхность, доступная для воды, используется, например, для того, чтобы показать, какие аминокислотные остатки чаще экспонированы – доступны для воды.
SAS не всегда применима, так как «раздувает» молекулу. Например, при контакте двух белков их SAS пересекаются:
Белок 1
Белок 2
SAS 1
SAS 2
![Page 17: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/17.jpg)
3. Молекулярная поверхность (MS, moleculare surface или Connolly surface)
(Richards, 1977; Connolly, 1983)
Поверхность контакта (contact surface) – зеленая
Дополнительная поверхность (reentrant surface) – синяя
![Page 18: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/18.jpg)
Три поверхности молекулы:- ван-дер-Ваальсова (vdWS)- доступная для воды (SAS)- поверхность молекулы (MS) или поверхность Конолли (Conolly surface)
![Page 19: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/19.jpg)
Поверхность молекулы (Connolly surface)
• Делится на две части:
– поверхность контакта с водой;
– дополнительная поверхность.
• Поверхность контакта образована точками ван-дер-ваальсовых сфер атомов белка, которых может коснуться ван-дер-ваальсова сфера молекулы воды
• Дополнительная поверхность образована поверхностью молекул воды, касающихся белка в двух или трех точках
![Page 20: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/20.jpg)
Молекулярная поверхностьсостоит из кусков трёх видов:
• кусок “выпуклой” сферы (жёлтая)
• кусок “вогнутой” сферы (синяя)
• тороидальная часть (зеленая)
Все куски соединяются гладким образом – без
углов
![Page 21: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/21.jpg)
Тороидальная поверхность заметается подвижным шариком (H2O), который вращается между двумя фиксированными шарами (CH3), все время касаясь обоих
CH3 CH3
H2O
H2O
![Page 22: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/22.jpg)
Вогнутая сфера получается в том случае, когда шар H2O касается одновременно трёх атомов белка
CH3
CH3
CH3
Точки касания
H2O
![Page 23: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/23.jpg)
Основные алгоритмы построения поверхности и вычисления её
площади
• Приближённые аналитические методы
(Richards&Lee, 1971; Wodak and Janin, 1980)
• Представление поверхности точками (Shrake&Rupley, 1973; Connolly, 1983)
• Точные аналитические методы (Gibson&Scheraga, 1987; Richmond, 1984)
![Page 24: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/24.jpg)
Метод срезов Ли – Ричардса для вычисления площади SAS
• Структура режется на «ломтики» фиксированной толщины
• Для каждого «ломтика» находятся круги от «срезов» атомов
• Вычисляется длина границы
• Умножается на толщину дольки
• Берется сумма по всем срезам
![Page 25: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/25.jpg)
Молекулярная поверхность: “Connolly dot surface algorithm”
• Контактная поверхность – на поверхности каждой VdW сферы
атома белка строится равномерная сеть точек;
– для каждой точки проверяется, что молекула воды, касающаяся этой точки, не пересекается с белком;
– если пересекается, то точка удаляется.
![Page 26: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/26.jpg)
Продолжение
• Дополнительная поверхность – тороидальная– Каждая пара соседних атомов определяет тороидальную
поверхность между ними– На этой поверхности строится равномерная сеть точек– Далее – как для контактной поверхности
• Дополнительная поверхность – сферическая – Каждая тройка соседних атомов определяет сферическую
дополнительную поверхность – ван-дер-ваальсову поверхность молекулы воды, касающейся этих атомов
– Если эта молекула воды не пересекается с белком, то на подходящей части этой поверхности строится равномерная сеть точек
![Page 27: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/27.jpg)
• Оставшиеся точки представляют поверхность молекулы белка
• Их число пропорционально площади поверхности. На этих точках может быть построена триангуляция поверхности для визуализации (или более точного подсчета площади)
Продолжение
![Page 28: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/28.jpg)
• Площадь SA ван-дер-ваальсовой сферы атома A равна 4πr2
• Нужно найти площадь (SA)0 области, не попадающей внутрь
сфер других атомов; тогда S=∑A(SA)0
• Для двух пересекающихся сфер площадь области на первой сфере, попадающей внутрь второй, вычисляется (в зависимости от радиусов и расстояния между центрами)
• Примерно так же может быть вычислена площадь более сложных пересечений и, следовательно, (SA)0
Аналитический метод определения площади
поверхности S (Kratky, 1981)
![Page 29: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/29.jpg)
Поверхность контакта двух молекул A и B
• Scont = (S(A) + S(B) – S(AB))/2
S – площадь молекулярнойповерхности или же SAS белка
Вклад взаимодействия макромолекул (или частей макромолекул) в энергию системы примерно пропорционален площади, «скрывающейся» при взаимодействии.
![Page 30: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/30.jpg)
Экспонированность аминокислотного остатка белка
• Для каждого остатка считается площадь, выходящая на молекулярную поверхность (дополнительная площадь делится между соседями)
• Эта площадь сравнивается с максимально возможной – при полностью раскрытой боковой цепи остатка того же типа в составе трипептида Gly – X – Gly
• Вычисляется процент экспонированности
![Page 31: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/31.jpg)
Экспонированность боковой цепи Leu(похожие графики у Val, Ile, Met)
0,%
10,%
20,%
30,%
40,%
50,%
60,%
70,%
80,%
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
Accessibility of Leu side chain (square A)
Fre
qu
en
cy
Frequency(%)
Integral (%)
Max=48Å2
90% Leu экспонированы на 38% или менее
![Page 32: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/32.jpg)
Экспонированность боковой цепи Lys (похожие графики у Arg, Gln, Glu, Asn, Asp)
Max=55Å2
0,%
10,%
20,%
30,%
40,%
50,%
60,%
70,%
80,%
90,%
100,%
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58
Accessibility of Lys side chain (square A)
Fre
qu
en
cy
Frequency(%)
Integral (%)
90% Lys экспонированы на 76% или менее
![Page 33: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/33.jpg)
Экспонированность боковой цепи Trp(похожие графики у Tyr, His, Phe, Pro)
Max=72Å2
0,%
10,%
20,%
30,%
40,%
50,%
60,%
70,%
80,%
90,%
100,%
0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72
Accessibility of Trp side chain (square A)
Fre
qu
en
cy
Frequency(%)
Integral (%)
90% Trp экспонированы на 36% или менее
![Page 34: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/34.jpg)
Экспонированность боковой цепи Cys
0,%
10,%
20,%
30,%
40,%
50,%
60,%
70,%
80,%
90,%
100,%
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38
Accessibility of Cys side chain (square A)
Fre
qu
en
cy
Frequency(%)
Integral (%)
Max=37Å2
90% Cys экспонированы на 22% или менее
![Page 35: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/35.jpg)
Ссылки
“Molecular Surfaces: A Review”, by Michael L. Connollyhttp://www.netsci.org/Science/Compchem/feature14.html
![Page 36: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/36.jpg)
II. Гидрофобные кластеры в структурах белков
![Page 37: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/37.jpg)
Гидрофобный эффект
Межмолекулярный уровень
Неполярные молекулы в полярном растворителе (воде) стремятся агрегировать так, чтобы минимизировать поверхность контакта с растворителем
![Page 38: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/38.jpg)
Неполярные молекулы (зелёные) в полярном
растворителе (оранжевый)
![Page 39: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/39.jpg)
вакуум
Гидрофобный эффект (наивное объяснение)
«Поверхностное натяжение» вытягивает воду из области между двумя гидрофобными поверхностями
![Page 40: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/40.jpg)
Вот что случается с гидро-фобными субъектами,которые не пожелали объединиться в гидрофильном окружении
Пабло Пикассо
![Page 41: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/41.jpg)
Гидрофобный эффект в белках
(и других макромолекулах)Внутримолекулярный уровень
Неполярные атомные группы (CH3 и др.) белка стремятся собраться внутри молекулы, чтобы минимизировать контакт с полярными группами и полярным растворителем (водой)
![Page 42: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/42.jpg)
4Ǻ срез структуры белка
Зелёные шарики = неполярные группы Красные = атомы кислорода Синие = атомы азота
Белые = углерод, связанный с полярным атомом Атомы водорода не показаны
![Page 43: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/43.jpg)
Гидрофобный эффект в белках
• Т.н. гидрофобное ядро дает существенный вклад в стабильность глобулы большинства белков
• Гидрофобные “ядрышки” могут служить зародышами в процессе правильной укладки полипептидной цепи
• Гидрофобный эффект важен для белок-белкового взаимодействия, взаимодействия белок-ДНК и других межмолекулярных взаимодействий
![Page 44: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/44.jpg)
Как измерять гидрофобный эффект in silico?
![Page 45: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/45.jpg)
Для межмолекулярного взаимодействия
Расчет площади поверхности (SAS), скрытой при взаимодействии, отражает вклад гидрофобного эффекта – это только число ( Å2), нет описания деталей!
Симуляция молекулярной динамики, конечно, отражает гидрофобный эффект…… но не локализует его. Кроме того, это вычислительно дорогая процедура.
![Page 46: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/46.jpg)
Подходы к локализации гидрофобного эффекта в белках и макромолекулярных комплексах
• Kannan & Vishveshwara, 1999
• Tsai & Nussinov, 1997
• Swindells, 1995
• Zehfus, 1995
• Heringa & Argos, 1991
• Plochocka et al., 1988
• Наша группа: Alexeevski et al,. 2003
![Page 47: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/47.jpg)
Swindells: группировка гидрофобно взаимодействующих неэкспонированных
остатков
• Отбираются остатки, которые– Слабо экспонированы (<7%)– Принадлежат спиралям или тяжам– Более 75% контактов их атомов с другими атомами
классифицируются как гидрофобные
Контактом считается сближение “тяжелых” атомов на сумму ван-дер-ваальсовых радиусов + 1Å
Гидрофобным контактом считается контакт атомов
углерода
![Page 48: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/48.jpg)
Два остатка из отобранных считаются взаимодействующими гидрофобно, если число гидрофобных межатомных контактов превосходит число иных межатомных контактов.
![Page 49: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/49.jpg)
Строится граф:
• Вершина – отобранный остаток
• Ребро соединяет вершины, если соответствующие остатки гидрофобно взаимодействуют
• Связные компоненты графа, содержащие 5 или более остатков, называются гидрофобными ядрами
![Page 50: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/50.jpg)
Граф гидрофобных контактов (пример)
![Page 51: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/51.jpg)
Zehfus: компактные группы боковых цепей остатков
• Вводится мера Z компактности набора остатков (отношение SAS к минимальной возможной поверхности)
• Выращиваются группы путем наращивания остаток за остатком (жадным алгоритмом)
• С помощью Z-score (который здесь назван ζ) по статистике кластеров из данного числа остатков выбираются наиболее компактные группы.
• Часто они состоят, в основном, из гидрофобных остатков
![Page 52: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/52.jpg)
Кластеры неполярных атомных группAlexeevski et al
• Элементарной единицей служат неполярные атомные группы (CH3 и т.п.) вместо аминокислотных остатков
• Алгоритм основан на делении целого, а не на наращивании из элементов
![Page 53: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/53.jpg)
В чем задача:
• Для данной структуры найти области пространства, заполненные только или преимущественно неполярными группами
![Page 54: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/54.jpg)
Неполярные группы в белках:• —CH
3
• —CH2—
• —CH<• —SH, —S —
не связанные ковалентно с полярными (N и O) атомами
Назовем такие группы ‘NP-атомами’
![Page 55: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/55.jpg)
“Гидрофобная область” в структуре (NP-область):
• NP-область заполнена преимущественно NP-атомами
• Каждый NP-атом в области имеет несколько гидрофобных контактов с другими NP-атомами из той же области
• Гидрофобное взаимодействие между разными NP-областями слабое
![Page 56: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/56.jpg)
Конфигурация HF-атомов на плоскости и что хотим в ней найти
![Page 57: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/57.jpg)
Шаги алгоритма (k,l)-разрезов
• Создание графа NP-атомов
• Нахождение всех (k,l)-разрезов графа
• Удаление всех (k,l)-разрезов из графа
• Нахождение кластеров, т.е. связных компонент полученного графа
![Page 58: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/58.jpg)
Граф контактов NP-атомов
• Вершина – один NP-атом
• Ребро соединяет два атома, если они контактируют
![Page 59: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/59.jpg)
• Ковалентные связи и, более обще, пары атомов на фиксированном расстоянии в силу форсмажора – стереохимических ограничений
• Гидрофобные контакты
Два типа ребер
C C C
![Page 60: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/60.jpg)
Критерии контакта
dm
d d0 ,
(d0 – порог, 4,5–5,4Ǻ)
m m0
(m0=d0/2)
![Page 61: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/61.jpg)
Что такое (k,l)-разрез графа?
• Определение: (k,l)-разрез графа – это k ребер, образующих связный подграф G такой , что l-реберная окрестность подграфа G после удаления его ребер распадается на две или более связных компоненты
![Page 62: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/62.jpg)
Подграф G1 (красные ребра) является (2,1)-разрезом
Подграф G2 (красные ребра) не является (2,1)-разрезом
G1 G2
![Page 63: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/63.jpg)
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 3
Cluster 4
Cluster 1
Cluster 2
Cluster 1’
Cluster 2
Cluster 3
Cluster 4
Cluster 1’’
Nonpolar atomsGraph of nonpolar atoms(1,1)-cuts (red edges)Clusters after (1,1)-cutting(2,1)-cut (red edges)Clusters after (2,1)-cutting
![Page 64: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/64.jpg)
Программа ‘ClusterDetector’ (CluD)
http://mouse.belozersky.msu.ru/npidb/cgi-bin/hftri.pl
(реализованы k=l=1)
![Page 65: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/65.jpg)
Each HF cluster is also presented as a list of atoms (.xls), rasmol script and whole cluster parameters (center of gravity, ellipsoid half-axis, etc.)
Пример результата программы CluD
![Page 66: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/66.jpg)
III. Домены белков
![Page 67: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/67.jpg)
Что такое “домен”?
Три определения:• По функции (функциональный домен)• По сравнению последовательностей (эволюционный домен)• По структуре (структурный домен)
![Page 68: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/68.jpg)
Функциональный домен (биохимия/биоинженерия)
Минимальная часть полипептидной цепи, которая:
• может автономно свернуться в правильную, нативную структуру
• сохраняет (in vitro) как минимум одну из активностей полного белка
![Page 69: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/69.jpg)
Derbyshire et al., PNAS, 94, 11466-11471(1997)“Genetic definition of a protein-splicing domain: Functional mini-inteins support structure predictions and a model for intein evolution”(http://www.pnas.org/cgi/content/full/94/21/11466)
Рекомбиназа A из Mycobacterium tuberculosis (790 а.о.) содержит интеин (440 а.о.), белок, обладающий способностью автономно вырезаться из полипептидной цепи белка-предшественника (явление белкового сплайсинга). Это – первая активность интеина.
интеин экстеин 2экстеин 1
экстеин 1 экстеин 2 интеин
![Page 70: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/70.jpg)
Этот интеин обладает также эндонуклеазной активностью (вторая активность).
По сходству последовательности этого белка с последовательностями других, более изученных интеинов, в т.ч. интеина с расшифрованной РСА структурой (1VDE), была высказана гипотеза о том, что за две разные активности отвечают разные домены.
При этом за белковый сплайсинг отвечает домен, который составлен из N-концевого и C-концевого участков полипептидной цепи
![Page 71: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/71.jpg)
Для проверки гипотезы авторы создали 21 конструкт генов интеина, в которых удалены разные внутренние участки полипептидной цепи.
Конструкты были встроены в ген другого белка (тимидилатсинтазы, TS) и экспрессировались в E.coli
Активность проверялась по наличию нативного белка TS (без вставки интеина)
![Page 72: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/72.jpg)
Результат: белковый сплайсинг сохранялся в тех случаях, когда удаленный участок не затрагивал первые 96 и последние 35 а.о.
Вывод авторов: функциональный домен автономного белкового сплайсинга состоит из остатков 1–96 и 406–440 (всего 131 из полных 440)
![Page 73: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/73.jpg)
Структура гомологичного белка PI-SceI – хоминг эндонуклеазы из дрожжей (PDB код 1VDE)
Интеин1–181,416–454
Эндонуклеаза186–405 Гидрофобные ядра доменов
![Page 74: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/74.jpg)
Последовательность интеина консервативна.
Об этом свидетельствуют доменные архитектуры трех белков из разных грибов, описанные в Pfam
Доменная структура полноразмерного белка PI-SceI
Доменная структура белка TFP1(аннотирован по сходству)
Доменная структура белка VMA1
Фрагмент, для которого решена структура
![Page 75: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/75.jpg)
Эволюционный домен (биоинформатика:
последовательности)
Достаточно длинный участок полипептидной цепи, который:
• эволюционно консервативен — существуют достоверно сходные участки в других белках
• замечен в перемешивании доменов (domain shuffling),то есть имеются примеры белков, где есть достоверно сходные с ним участки, но есть также несходные между собой (но эволюционно консервативные) участки
![Page 76: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/76.jpg)
Белки, содержащие два эволюционных домена: гомеодомени OAR домен (N-концевые участки не показаны)
![Page 77: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/77.jpg)
Гомеодомены активно перемешивались в эволюции.
Об этом можно судить по 65(!) различным доменным архитектурам гомеобелков, представленным в банке Pfam
Гомеодомен
Парный домен и гомеодомен
Lim домены и гомеодомен
Гомеодомен, продолженный лейциновой молниейPOU домен и гомеодомен
Два гомеодомена
PBX-домен и гомеодомен
![Page 78: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/78.jpg)
Структурный домен(биоинформатика 3D структур)
Обособленная в пространстве часть молекулы белка
![Page 79: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/79.jpg)
Пример
Транскрипционный фактор – пуриновый репрессор из E.coli (PDB код 1WET)
![Page 80: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/80.jpg)
Пуриновый репрессор димеризуется ….
![Page 81: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/81.jpg)
… связывает две молекулы гуанина, после чего связывается с ДНК.
Сайт связывания – палиндром.
Весь комплекс обладает симметрией 2-го порядка.
ACGAAAACGT TTTCGT
гуанин
![Page 82: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/82.jpg)
Очевидно выделяется домен, связанный с остальным белком гибким линкером.
ДНК-связывающий домен
Регуляторный домен
![Page 83: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/83.jpg)
То, что обычно называется регуляторным доменом – это один структурный домен или два?
![Page 84: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/84.jpg)
Если судить по гидрофобным ядрам, то два… Но обособлены они гораздо слабее.
![Page 85: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/85.jpg)
Структурный домен(биоинформатика: 3D структуры)
Обособленная в пространстве часть белка, его структурная единица, имеющая:
• сравнительно мало контактов с другими частями белка
• собственное гидрофобное ядро
![Page 86: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/86.jpg)
Домен белка XXX(жизнь)
Часть белка, названная доменом:
• Субъективизм• Образность• Традиция
![Page 87: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/87.jpg)
В полимеразах обычно выделяют три домена: fingers, palm, thumb
Fingers
Palm
Thumb
Template RNA
Product RNA
NTP
![Page 88: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/88.jpg)
Три определения доменов часто дают похожие
результаты!
Но не всегда…
![Page 89: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/89.jpg)
19–81
82–9091–142
«Парный» (“Paired”) домен из транскрипционного фактора PAX5 человека (PDB 1K78) – очевидно, два структурных домена
Эволюционный домен (PAX в Pfam)включает оба структурных домена(126 а.о.)
![Page 90: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/90.jpg)
Последовательности PAX/prd доменов консервативны по всей длине
![Page 91: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/91.jpg)
Забавно, что полипептидные цепи обоих структурных доменов имеют общую топологию (- одинаковое число спиралей, - одинаковые межспиральные взаимодействия, - одинаковый порядок следования спиралей вдоль цепи; * минорные элементы вторичной структуры не в счет!)
![Page 92: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/92.jpg)
N-концевой структурный домен парного домена хорошо совмещается с C-концевым
Синий – N-концевой
Зеленый – C-концевой
Совмещение – по двумспиралям, всего по 14 C атомам
Rmsd = 0.5 Å
Но достоверного сходства последовательностей не наблюдается
![Page 93: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/93.jpg)
Два структурных домена парного домена одинаково расположены на ДНК
![Page 94: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/94.jpg)
Структурные домены
Алгоритмы детектирования
![Page 95: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/95.jpg)
На чем основаны методы• Домен имеет собственное гидрофобное
ядро (пример: алгоритм DETECTIVE Swindells, 1995)
• Домен – это часть белка, внутри которой много контактов аминокислотных остатков, а между доменами – мало контактов (пример: алгоритм DOMAK, Siddiqui&Barton, 1995)
![Page 96: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/96.jpg)
Siddiqui&Barton, 1995: DOMAK
• Предпосылки: домен состоит из одного или двух непрерывных участков полипептидной цепи
• Число контактов между остатками внутри домена больше, чем число междоменных контактов
Сверху – вниз, от целого – к части!
![Page 97: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/97.jpg)
Формализация• Два остатка контактируют, если расстояние
между ними меньше 5Å• Если белок разбит на две части, A и B, то
определяется индекс разделенности:
SplitValue=(intA/extAB)∙(intB/extAB)
intA – число пар контактирующих остатков из A;intB – число пар контактирующих остатков из B;extAB – число пар контактирующих остатков, один из A, а другой – из B
![Page 98: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/98.jpg)
Пример. Структура 1CD4. Часть A: N-конец полипептидной цепи до остатка i; часть B – от (i+1) до C-конца
График зависимостииндекса разделенностиот номера граничногоостатка
![Page 99: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/99.jpg)
Деление по остатку 97 (пик на графике)
![Page 100: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/100.jpg)
В алгоритме DOMAK проверяются следующие разделения на части A и B
(1)
(2)
(3)
![Page 101: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/101.jpg)
Алгоритм• К полной цепи применяются методы 1 и 2. Выбирается
разделение с лучшим индексом• К полученным двум доменам применяется та же
процедура. В случае, когда домен состоит из двух сегментов, применяется также метод 3.
• Алгоритм останавливается в зависимости от пороговых значений:– MDS – минимальный размер домена (в числе остатков)– MSS – минимальный размер сегмента
• Отдельная процедура предусмотрена для сегментов, длина которых между MDS и MSS
• Найденные домены проверяются на “компактность”; некомпактные – сливаются в один
![Page 102: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/102.jpg)
Swindells, 1995DETECTIVE
Снизу – вверх, наращивание частей!
Предпосылка: каждый домен имеет свое гидрофобное ядро.
Этапы:1. выявление гидрофобных ядер в структуре2. «натягивание» доменов на гидрофобные ядра
![Page 103: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/103.jpg)
Гидрофобные ядра – еще не домены!
Для получения доменов применяетсямногоходовая процедура чистки-слияния
![Page 104: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/104.jpg)
Алгоритм демонстрируется на примере (см. рис.) (1) найдено 3 кластера – 1-й, 2-й и 3-й (2) остатки, окруженные “чужими” вычищаются (3) кластеры, включающие меньше пяти остатков, вычищаются (4) заливка некластеризованных остатков (5–6) оставшиеся некластеризованные остатки присоединяются
по контактам к кластерам предыдущего шага (7–8) опять прочистка, заливка и присоединение хвостов
![Page 105: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/105.jpg)
![Page 106: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/106.jpg)
Методы выделения доменов (из обзора Veretnik & Shindyalov, 2005)
Большинство методов основано на принципах, близких к DOMAK
![Page 107: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/107.jpg)
Сравнение методов
Критерии сравнения:• процент белковых цепей, для которых все домены выделены правильноЭта величина зависит от критерия правильности (при каком проценте совпадения выделенного и правильного домена они считаются одинаковыми?);• средний процент совпадения выделенного домена с ближайшим правильным;• …
Нужен “benchmark” (стандарт, мерило)
Есть специально посвящённые этому работы. В качестве правильных доменов принимаются домены, независимо и одинаково выделенные несколькими экспертами.
![Page 108: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/108.jpg)
Сравнение методов (по книге “Structural bioinformatics”, 2009)
![Page 109: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/109.jpg)
Figure 3. Benchmarking of automatic domain assignment methods.(A) Performance of DomainParser, PDP and PUU on consensus-based benchmark of 374structures, (B) evaluating tendency to partition domains into non-contiguous fragments.
Сравнение методов (по обзору Veretnik & Shindyalov)
![Page 110: С.А.Спирин, 13 .11.20 12](https://reader035.vdocuments.net/reader035/viewer/2022081418/5681528c550346895dc0b02a/html5/thumbnails/110.jpg)
Классификации структурных доменов
• SCOP (http://scop.mrc-lmb.cam.ac.uk/scop/)– ручная детекция доменов– 4 основных уровня классификации (класс, укладка, суперсемейство, семейство)
• CATH (http://www.cathdb.info/)– полуавтоматическая детекция доменов– 4 основных уровня классификации (класс, архитектура, топология, суперсемейство)
Об этом будет отдельная лекция