13 штокало ит в генетике
TRANSCRIPT
ИТ в генетике:от экспериментальных данных к
лекарственному препарату нового поколения
н.с. Дмитрий Николаевич Штокало
Новосибирск 2013
Процесс разработки лекарства обычно занимает более 15 лет
Поиск мишени (ген, белок, и др.)
Поиск действующего вещества
Поиск средства доставки
Преклинические испытания, тест на токсичность
Клинические испытания
GGGGAGATGGGCTCTGAGACTATAAAGACAGCGGGGGCCCAGC|AGCCCTCAGCCCTCCAGG
Ген инсулин
Неправильная буква «А»
Метод лечения диабета 1-го рода
GGGGAGATGGGCTCTGAGACTATAAAGСCAGCGGGGGCCCAGC|AGCCCTCAGCCCTCCAGG
Метод лечения диабета 1-го рода
Ген инсулин
Правильная буква «С»
http://webvision.med.utah.edu/wp-content/uploads/2012/10/600px-Drosophila_repleta_lateral.jpg
50 Гб данных
ACGTTGCGACCCGTAGGACAA
CGGGTTACAGGGGGGATT
GCTAGACAGTTTTTTTTAAA
ACGTCAGCGTACGA
CCGGCGCGCGCGCGCCGGGAG
...
HelicosTM
Секвенирование – прочтениепоследовательности ДНК или РНК
Приемлемого качества 30’000$ за 6 недельНизкого качества 5’000$ за 2 недели
Производительность секвенатороврастет экспоненциально
Стоимость прочтения генома пациента в 2013г.
Типы современных данных
ACGTTGCGACCCGTAGGACAACGGGTTACAGGGGGGATTGCTAGACAGTTTTTTTTAAAACGTCAGCGTACGACCGGCGCGCGCGCGCCGGGAGGCGCGTTTTAATATAGCGCCCGCGCGCCGGGAGTAGATATC
Последовательности ДНК, РНК
Пос
ле в
оспа
лени
я
До
восп
ален
ия
Bank1Cd52Cd79aCol3a1Gbp9H2-DMb1HraslsIkzf3Mbnl1Rps24S100a4Slamf9St8sia4Tap1Tnfsf10Upp1
Таблицы экспрессии
Графы взаимосвязей
Различные базы знаний и аннотаций
Пример результата анализа
Методы анализа• Сравнение больных и здоровых
• Сравнение последовательностей (выравнивание)
• Сравнение векторов экспрессий генов (кластерный, регрессионный анализы)
• Сравнение новых даных с существующими базами знаний (Enrichment)
• Моделирование физических свойств молекул
Анализ данных – искусство, основанное на знании и интуиции.
Задача ИТ:а)обеспечить инструментарием
доступа к знаниямб) визуализировать процесс для
возбуждения интуиции.
Основная проблема – жизнь шире и сложнее формальностей.
«Универсальные» технологии разработаные с нашим участием
ExPlain для BIOBASE GmbHSLI Environment
для St.Laurent Institute
Применяемые нами технологии(1. Выравнивание)
ACGTTGCGACCCGTAGGACAACGGGTTACAGGGGGGATTGCTAGACAGTTTTTTTTAAAACGTCAGCGTACGACCGGCGCGCGCGCGCCGGGAG
РеференснаяДНК
КусочкиРНК
Выравнивание на геном с помощьюHeliSphere software (Helicos BioScience)
Кусочки РНК
Применяемые нами технологии(2. Очистка сигнала от шума)
HeliSphere software +
фильтрация по похожести с мусорными последовательностями+
Нормализация
Применяемые нами технологии(3. Задачи распознавания)
Пакет R –для кластеризации, машинного обучения,
вычисления статистической значимости рез-тов.
Применяемые нами технологии(4. Поиск по литературе и базам
знаний )
Pathway Studio® (Elsevier Inc.)
ExPlainTM (BIOBASE GmbH)
0%
20%
10%
% А
попт
оза
клет
окБлокировка найденных нами
мишеней приводит к апоптозу 12% раковых клеток
Найдены биомаркеры предрасположенности к рецидиву
сужения кровеносных сосудов после вставки расширяющего стента
Другие ИТ технологии в процессе диагностики и разработки лекарств
Поиск мишени (FoldX, Ugene, BioUML)
Поиск действующего вещества (Docking, PASS, Lead Finder)
Поиск средства доставки (PASS, Lead Finder)
Тест на токсичность (QSAR, PASS, Lead Finder)
Клинические испытания
Спасибо за внимание!
Новосибирск 2013
Найдено 3000 сайтов редактирования РНК ферментом
ADAR у мухи
На данный момент наш список сайтов является наиболее полным