Вяххи Н. Обучение биоинформатике. Форматы и опыт
TRANSCRIPT
!Algorithmic+Biology+Laboratory,+St.+Petersburg,+Russia,++
(Founded+in+2011+by+Prof.+P.A.+Pevzner)+!
Number of people involved: 12 Main achievements: SPAdes – single-cell assembler QUAST – Quality Assessment Tool for Genome Assemblies Online bioinformatics platform Rosalind (http://rosalind.info) Computational mass spectrometry (Antibody sequencing) Expertise in the lab: -algorithm design -software design -genome assembly -data analysis needed to work with microbial, fungal and human related projects -computational and comparative genomics, statistical research and analysis
Community+feedback:!"I'd!like!to!thank!you!for!the!great!job!you!are!doing!with!SPAdes.!It's!a!very!useful!so>ware!”!!A !
!!!!!!!!!!!!!!!!!!!!!!Lionel!Guy,!Uppsala!University!“A!so>ware!called!SPAdes!is!proving!to!be!beIer!than!most!other!tools”!Manoj&&Samanta!
& & & & &&“I!have!a!lot!of!love!for!SPAdes!for!bacterial!genome!assembly”!Mick!Watson,!The!Roslin!InsOtute!
Main distinguishing factors of ABL : The combination of all skills, the expertise listed above and the ability to apply both research and customizing
approaches to individual NGS projects and pipelines.
Центр геномной биоинформатики им. Ф.Г. Добржанского СПбГУ
Создание программного обеспечения GWATCH для визуализации, анализа и распространения данных из исследований по полногеномному скринингу ассоциаций (ПГСА, GWAS).
Совместные с международными партнерами исследования по выявлению генов, вовлеченных в развитие или устойчивость к комплексным заболеваниям человека, в том числе изучение ВИЧ-СПИД в США и Ботсване, рака носоглотки в Китае, гепатита B и рака печени.
Исследования по генетической характеристике штаммов возбудителя туберкулеза в связи с их географическим распространением на территории России и создание базы данных GMTV для сбора, хранения и доступа к этим сведениям.
Построение генетической карты и проведение аннотации новой сборки генома домашней кошки, размещение результатов в общем доступе в с помощью разработанного в лаборатории геномного браузера GARField2.
Участие в ряде геномных проектов, в том числе получение хромосомных сборок геномов гепарда, льва, носорога.
Образовательная деятельность: проведение семинаров, открытого курса лекций по биоинформатике, практических тренингов по современным геномным и биоинформатическим технологиям.
An Explosion OfBioinformatics Careers
Big data is everywhere, and its influence and practical omnipresence across multiple industries will just continue to grow. For life scientists with expertise and an interest in bioinformatics, computer science, statistics, and related skill sets, the job outlook couldn’t be rosier.
But the subject has evolved from a service, like histology, to its own research arena…. Bioinformaticists are now the motor of the innovation.
June 13, 2014http://sciencecareers.sciencemag.org/career_magazine/previous_issues/articles/2014_06_13/science.opms.r1400143
Институтбиоинформатики
Подготовить новое поколение высококвалифицированных специалистов в области биоинформатики, популяризировать биоинформатику в России и содействовать становлению России как мирового исследовательского центра в области биоинформатики.
1. Алгоритмическая биоинформатика (2010)
2. Биоинформатика для биологов (2013)
Алгоритмическая биоинформатика
Анализ данных NGSСтатистикаМолекулярная биология БиотехнологииАлгоритмы в биоинформатикеCравнительная геномикаНаучный проект
Биоинформатикадля биологов
Дискретная математикаПрограммирование на PythonСтатистикаЯзык программирования RApplications in Genome BioInformaticsНаучный проект
Научные проекты
За учебный год студент участвует в двух проектах.
http://bioinformaticsinstitute.ru/projects
Часть проектов индивидуальные, часть – командные, рассчитанные, как правило, на команду из биолога и информатика.
Научные проекты
Научные проекты
Hmmer on GPU
VCF file storage
Assembly scaling bottlenecks
De novo assembly
Deep learning approach in genomics
Haplotype assembly in dipSPAdes
Immunoglobulin folding
Misassemblies detection without reference
Rearrangement-based fragment assembly
Repeat classification in mammalian genomes
Virtual target screening for KY0211 inhibitor
Polymorphism analysis in diploid genomes
Ragout - de Bruijn graph in reference-assisted assembly
Development of algorithms for Extension index data structure
Научные проекты
Working with synteny blocks of different resolution
Аннотация генов в геноме Cuban-Amazon
Естественный отбор и нейтральная эволюция в митохондриальной ДНК различных групп животных
Молекулярные аспекты создания лекарственных препаратов
Оценка качества транскриптомных сборок
Поиск корреляции между метилированием и социальным статусом в геноме человека
Поиск молекулярных маркеров и разработка диагностической системы предрасположенности к клинической депрессии на основе ПЦР
Поиск однонуклеотидных полиморфизмов штаммов Mycobacterium tuberculosis, распространенных в различных регионах мира
Научные проекты
Связь последовательностей с отклонениями в частотах аминокислот с белок-белковыми взаимодействиями
Скаффолдинг бактериальных контигов с использованием нескольких референсов и дерева на примере геномов Gluconacetobacter
Сравнительный анализ данных по РНК-секвенированию раковых клеток с использованием платформы Trinity
Приложение для клинической интерпретации онкоэкзома человека
Скаффолдинг контигов с использованием базы генов
Сборка модели центромерного района хищников
Сборка MHC региона у гепарда / тигра
Отзывы
“Мне кажется, что один месяц в Институте стоит года в бакалавриате биофака!”
“Огромное спасибо за этот учебный курс!”
“Здорово, что вы есть! Обязательно берите биологов на следующий год. Им тоже нужна биоинформатика и они нужны ей!”
“Печеньки, кофе и различные вкусняшки всенепременно радуют! Поднимают моральных дух :) “
“Мне очень нравится учиться в Институте биоинформатики, все читаемые здесь курсы кажутся мне очень осмысленными и интересными, спасибо!”
“Очень здорово получить опыт работы с биологами и информатиками. Курсы тоже классные!”
“Могу только высказать благодарности всем за замечательные учебные курсы и обстановку!”
“Печеньки какие-то странные и их мало.”
Проблемы
Кого учить?
Мало руководителей для начинающих студентов, но выпускники нарасхват
Большая разница в ожиданиях у студентов биологов и информатиков
Совместные занятия скучноваты
Летняя школа
Ежегодное мероприятие для ста студентов, аспирантов и молодых учёных математических, технических и биологических специальностей, интересующихся биоинформатикой.
Кроме лекций и мастер-классов от ведущих ученых, есть возможность выступить с докладом на мини-конференции и постерной сессии.
Летняя школа
Проблемы
Среди подающих на школу много состоявшихся специалистов и постдоков
Сложно балансировать программу
Rosalind
Rosalind is a platform for learning bioinformatics and programming through problem solving.
• Python Village – несколько задач по Python
• Bioinformatics Stronghold – основная, алгоритмическая биоинформатика
• Bioinformatics Armory – инструменты
• Bioinformatics Textbook Track – задачи к учебнику
• Algorithmic Heights – алгоритмы по Dasgupta et al.
http://rosalind.info
Rosalind
18807 пользователей решили ≥1 задачу
228 задач суммарно
292985 попыток решения задач
170655 успешных попыток
117 преподавателей / 1502 студентов
MOOC Bioinformatics Algorithms
Where Does DNA Replication Begin? (Algorithmic Warm-up)
How Do We Sequence Antibiotics? (Brute Force Algorithms)
Which DNA Patterns Act As Cellular Clocks? (Greedy and Randomized Algorithms)
How Do We Assemble Genomes? (Graph Algorithms)
How Do We Compare Biological Sequences? (Dynamic Programming Algorithms)
Are There Fragile Regions in the Human Genome? (Combinatorial Algorithms)
https://www.coursera.org/course/bioinformatics
MOOC
MOOC
MOOC
Благодарности
+ http://bioinformaticsinstitute.ru/teachers