hgp and computer

50
http://biohackers.net 휴휴휴휴휴휴휴휴휴 휴휴휴 Human genome project and Computer science 김김김 , Insilicogen, Inc.

Upload: hyungyong-kim

Post on 14-Jun-2015

1.176 views

Category:

Technology


4 download

DESCRIPTION

Human Genome Project and Computer

TRANSCRIPT

Page 1: HGP And Computer

http://biohackers.net

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer

science

김형용 , Insilicogen, Inc.

Page 2: HGP And Computer

순서 생물학 백그라운드 Genome 의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여

Page 3: HGP And Computer

Genome

게놈 ? 지놈 ? 유전자 (gene), 유전체 (genome)

Page 4: HGP And Computer

Great 3 books

우주 – 생명 - 인간

Page 5: HGP And Computer

Central Dogma of Molecular Biology

Page 6: HGP And Computer
Page 7: HGP And Computer

Protein structure

20 Amino acids Sequence specifies conformation RNase

Page 8: HGP And Computer

Life

DNA’s common method of producing more DNA

Review the life

Page 9: HGP And Computer

Evolution

Self replicator

Page 10: HGP And Computer

Chromosome

1 cM ~= 1 Mbps

Page 11: HGP And Computer

Gene structure

Page 12: HGP And Computer
Page 13: HGP And Computer

Junk DNA

전체 Genome 의 5% 만이 단백질이 되는 영역 . 그렇다면 나머지는 ?

Repetitive sequence LINE (>300bps) SINE (300bps), Alu (30000~50000 개 ) Microsatelite

Page 14: HGP And Computer

Human genome

3~4x1014 cells (~=245)

> 200 cell type

3x109 bps (3Gbps = 3Gbyte)

20000~25000 Genes

98% unknown functional DNA

0.1% difference with you

Information theory : 30Mbyte

Page 15: HGP And Computer

Human genome project DOE, NHGRI 에서 시작 . 2003 년 공식 완료 . 13 년 .

7 개국 참여 95% 나 되는 Junk DNA 를 꼭 그 많은 돈을 들여서

해야만 했는가 ? 목적

Human DNA 에서 모든 Gene의 동정 30 억 염기서열의 결정 Database에 결과의 저장 이를 분석할 수 있는 도구의 향상 관련 윤리적 문제의 연구

Page 16: HGP And Computer

History

PCR RFLP Genetic marker BAC Shotgun sequencing Whole genome shotgun

Page 17: HGP And Computer

Gel Electrophoresis 젤 ( 그물막 ) 에 전하를 띤 물질을 통과시킴으로 , 분리하는 방법 .

작을수록 멀리 ~ DNA, Protein

Page 18: HGP And Computer

PCR

Polymerase Chain Reaction

Page 19: HGP And Computer

Genetic marker

Polymorphic allele locus

Page 20: HGP And Computer
Page 21: HGP And Computer

Genetic map

Page 22: HGP And Computer

Cloning

무지 작은 저 분자를 하나씩 직접 읽을 수 없다 .

따라서 , “ 동일” 한 것들 여러 개를 갖고 실험

Page 23: HGP And Computer

Gene cloning Gene cloning 과정

1. Genome 상에서 원하는 영역을 정한다 . 2. 원하는 영역을 뽑아낼 수 있는 PrimerDesign 을 한다 . 3. PCR 로 해당영역의 major band 를 확인하고 , 추출한다 . 4. CloningVector 에 삽입한다 . 5. Selection 의 과정을 통해 , 해당 유전자가 삽입된 벡터가 들어있는

클론을 선발한다 . Cloning vector

Plasmid : Cosmid : 30 kb BAC : 350 kb YAC : 2 Mb 이상 PAC : 300 kb

Page 24: HGP And Computer

DNA sequencing

Page 25: HGP And Computer

DNA sequencing

Page 26: HGP And Computer

Frederic Sanger DNA, Protein 유효길이 700-800bp

DNA sequencing

Page 27: HGP And Computer

Shotgun sequencing게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤 ,

아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다 . 재조립하기 위해 파괴하는 것 , 그것이 분자생물학자들의 저주받을

운명이고 직업적 강박관념이다 . -- 다니엘코엥 , 휴먼게놈을 찾아서

Page 28: HGP And Computer

Genome sequencing

Clone by clone method Genetic marker 에

따라 BAC 선발 후 shotgun

Whole genome shotgun 무작정 shotgun Repeat 로 인한

조립에의 어려움 . 컴퓨터만 믿는다 .

Page 29: HGP And Computer

Current status (since 2003) Human Chromosome 4 Completed, April 2005. Human Chromosome 2 Completed, April 2005. Human Chromosome X Completed, March 2005. Human Chromosome 16 Completed, December 2004. Human Gene Count Estimates Changed to 20,000 to 25,000,

October 2004. Human Chromosome 5 Completed, September 2004. Human Chromosome 9 Completed, May 2004. Human Chromosome 10 Completed, May 2004. Human Chromosome 19 Completed, March 2004. Human Chromosome 13 Completed, March 2004. Human Chromosome 6 Completed, October 2003. Human Chromosome 7 Completed, July 2003. Human Chromosome Y Completed, June 2003. Human Genome Project Completion: 1990-2003 (April 2003)

Page 30: HGP And Computer

Genome browser

UCSC Genome browser NCBI Genome browser Ensembl VistaBrowser

Page 31: HGP And Computer

Genetic disease – before HGP

Page 32: HGP And Computer

Genetic disease – after HGP

Page 33: HGP And Computer

Comparative genomics Synteny (Gene order), Gene duplicati

on, Gene fusion

Page 34: HGP And Computer
Page 35: HGP And Computer

Comparative genomics

Page 36: HGP And Computer

SNP Single Nucleotide Polymorphism 종간 다양성 종내 다양성 염기변화 유전자내 아미노산변화

구조변화

Page 37: HGP And Computer

Haplotype

Page 38: HGP And Computer
Page 39: HGP And Computer

HapMap 일본 , 영국 , 중국 ,

캐나다 , 미국 , 나이지리아

Project 의 목표는 MinorAllele 의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60 만개 SNPs 을 genotype 하는 것

Page 40: HGP And Computer

Transcriptome, Proteome

EST DNA chip Proteomics

Page 41: HGP And Computer

EST Expression Sequence Tag

Page 42: HGP And Computer
Page 43: HGP And Computer
Page 44: HGP And Computer
Page 45: HGP And Computer

Transformational grammar Regular grammar : computer program Context free grammar : DNA

Palindrome, “ 다시 합창합시다” Context sensitive grammar Unrestricted Grammar : 자연어

Page 46: HGP And Computer

Sequence alignment

Page 47: HGP And Computer

Smith-Waterman algorithm

Page 48: HGP And Computer

BLAST

Unknown sequence

Known sequenceDatabase

Page 49: HGP And Computer

Object oriented programming

Computer programming paradigm 생명현상의 모델링

Page 50: HGP And Computer

마치며… Rosetta stone Programming