sinh hoc phan tu sdh - 2012-2013-1

Upload: thanh-nguyen

Post on 15-Oct-2015

198 views

Category:

Documents


3 download

TRANSCRIPT

  • I HC Y DC TP.HCM Khoa Dc

    SINH HC PHN T (TI LIU GING DY SAU I HC)

    Bin son: PGS.TS. Trn Ct ng

    TS. Nguyn T Anh

    2012

  • 3

    Mc lc Bi 1. Nghin cu sinh hc trong th k 21 7

    1.1. S bin chuyn ca sinh hc phn t 7 1.2. H gen hc - Genomics 7

    1.2.1. Khi nim................................................................................................. 7 1.2.2. Mt s cng c......................................................................................... 8 1.2.3. ng dng ................................................................................................. 9

    1.3. H protein hc - Proteomics 10 1.3.1. Khi nim............................................................................................... 10 1.3.2. Mt s cng c....................................................................................... 11 1.3.3. ng dng proteomics trong nghin cu pht trin thuc...................... 14

    1.4. H t bo hc - Cytomics 16 1.5. Sinh hc h thng 16

    Bi 2. ng dng sinh hc h thng trong tm kim thuc mi 19 2.1. Khi qut 19 2.2. Omics: To v khai thc d liu quy m ln 20 2.3. Cc m hnh my tnh: t cc qu trnh sinh hc n sinh l bnh 22 2.4. S dng cc h thng t bo phc tp th nghim v to m hnh sinh

    hc 24 2.5. Tng lai 28

    Bi 3. Tin sinh hc 30 3.1. Lch s 30 3.2. Cc nh ngha 31 3.3. Cc lnh vc nghin cu chnh 31

    3.3.1. Phn tch trnh t.................................................................................... 31 3.3.2. To m hnh cc h thng sinh hc ....................................................... 35 3.3.3. Phn tch hnh nh hiu nng cao .......................................................... 35

    3.4. Cng c 35 Bi 4. K thut xc nh kiu gen 37

    4.1. i cng 37 4.1.1. ngha v lch s ca vic nh typ vi sinh vt.................................... 37 4.1.2. Tiu ch ca mt phng php nh typ tt........................................... 37 4.1.3. Phn loi cc phng php nh typ phn t......................................... 38 4.1.4. La chn gen phn t bng phng php phn t............................ 38 4.1.5. Nhc im ca phng php phn t.................................................. 39

  • 4

    4.2. Du n da trn PCR ca nhim sc th vi khun 39 4.2.1. K thut chung .......................................................................................39 4.2.2. Phng php nh typ ribosom ..............................................................41 4.2.3. Rep-PCR.................................................................................................41 4.2.4. Th nghim RAPD.................................................................................43

    4.3. Cc phng php ct gii hn b gen 44 4.3.1. Cc vn chung....................................................................................44 4.3.2. Phng php RFLP kt hp Southern blot.............................................45 4.3.3. PCR-RFLP..............................................................................................46 4.3.4. AFLP ......................................................................................................47 4.3.5. CFLP.......................................................................................................48 4.3.6. Phn tch PFGE nhim sc th ...............................................................48

    4.4. nh trnh t DNA 50 4.5. Cc kha cnh thc tin ca vic nh typ bng phng php phn t 51

    Bi 5. ng dng cng ngh sinh hc trong tm kim thuc mi 53 5.1. Gii thiu 53

    5.1.1. Qui trnh tm kim thuc mi .................................................................53 5.1.2. Pht hin thuc mi bng phng php sng lc hiu nng cao ...........54

    5.2. Pht trin thuc mi da trn ng dng cng ngh sinh hc 55 5.2.1. K thut genomic ...................................................................................56 5.2.2. K thut proteomic .................................................................................57 5.2.3. K thut metabolomic ............................................................................58 5.2.4. Cng ngh sinh hc ng dng k thut nano .........................................59 5.2.5. Cc phng php sng lc......................................................................59 5.2.6. Antisense ................................................................................................60 5.2.7. iARN.......................................................................................................61 5.2.8. Biochip v microarray trong tm kim thuc .........................................62 5.2.9. ng dng tin sinh hc trong tm kim thuc..........................................63

    5.3. Kt lun 63 Bi 6. Hp cht thin nhin v ng dng k thut sinh hc phn t trong nghin

    cu 65 6.1. Hp cht thin nhin 65

    6.1.1. Khi nim ...............................................................................................65 6.1.2. Ngun gc...............................................................................................65 6.1.3. Bn cht ha hc ....................................................................................67

    6.2. Kh khn trong sn xut hp cht thin nhin 69 6.2.1. Kh khn trong chit xut ......................................................................69

  • 5

    6.2.2. Kh khn trong nui trng..................................................................... 69 6.2.3. Kh khn trong tng hp ....................................................................... 70

    6.3. Sn xut hp cht thin nhin bng cng ngh sinh hc 70 6.3.1. ADN ton phn ...................................................................................... 70 6.3.2. Thnh lp th vin gen .......................................................................... 71 6.3.3. Sng lc gen chu trch nhim sinh tng hp hp cht thin nhin ...... 71 6.3.4. D biu hin hp cht thin nhin.......................................................... 72

    6.4. Kt lun 72 Bi 7. ADN ti t hp v tnh an ton sinh hc 73

    7.1. Gii thiu 73 7.1.1. ADN ti t hp (Recombinant DNA = rDNA) ..................................... 73 7.1.2. ng dng ADN ti t hp ..................................................................... 73 7.1.3. Phn loi mc an ton sinh hc i vi phng th nghim .............. 73

    7.2. nh gi mc an ton sinh hc ca ADN ti t hp 74 7.2.1. i tng cn nh gi mc an ton ................................................ 75 7.2.2. nh gi mc an ton ....................................................................... 75 7.2.3. nh gi mc nguy him ca sinh vt bin i gen......................... 76 7.2.4. Qui trnh nh gi mc nguy him................................................... 77

    7.3. Cc bin php ngn chn nhm m bo an ton sinh hc 77 7.4. Cc th nghim phi tun th qui nh an ton sinh hc 78

  • 7

    BBii 11.. NNgghhiinn ccuu ssiinnhh hhcc ttrroonngg tthh kk 2211 Mc tiu:

    - Trnh by c vai tr, nhim v v s pht trin ca sinh hc phn t trong th k 21 - Trnh by c mt s phng php nghin cu ca sinh hc phn t hin i

    1.1. S bin chuyn ca sinh hc phn t Sinh hc lc khi u l mt khoa hc m t, cc nh sinh hc ch yu quan st v

    ghi nhn, so snh, phn loi v gii thch cc hin tng sinh hc n l, t mang tnh khi qut. n th k 19, Charles Darwin vi thuyt tin ha v sau Gregor Mendel vi cc nh lut di truyn th sinh hc mi bt u c ci nhn su rng hn vo c ch ca s sng mc h thng. n u th k 20, cc nh sinh hc bt u quan tm n cc quan st c tnh nh lng v nghin cu quan h nhn-qu trong sinh hc. Tuy nhin, sinh vt l mt h thng phc tp, nht l khi t n trong mi trng sng, cc quan h nhn-qu khng c kt ni mt cch trc tip m trong mt mng li a chiu vi cc kt ni chng cho nhau. Do vy, lm sng t v hiu c cc quan h phc tp ny cc nh sinh hc bt u vi cc h thng n gin, trong chui quan h nhn qu ngn hay trc tip. Cch lm vic vi cc h thng n gin hay chia nh cc quan h phc tp thnh tp hp cc quan h 1:1, c tnh lp li cao gip lm sng t nhiu qui lut t nhin trong sinh hc nh sao chp ADN, m di truyn, phin m, dch m,

    Tuy nhin, khi hu ht cc qui lut t nhin c lm sng t v b gen ca mt s sinh vt c gii m hon ton, ban u ch l cc vi sinh vt, nhng n nay b gen ngi cng c gii m xong, th cc nh sinh hc nhanh chng nhn ra rng cc h thng sng vi c ch iu ha nhiu lp v iu ha ngc tr nn qu phc tp c th c hiu theo kiu khoa hc chnh xc ca sinh hc phn t. Chng hn m di truyn ca sinh vt c chng minh l ph qut, nhng vic suy din kt qu thu c vi sinh vt cho cc sinh vt bc cao hn vn c th dn n nhiu sai lm, v cc sinh vt bc cao phn ln trnh t ca ADN tuy khng m ha cho protein nhng li c vai tr iu ha. Do nghin cu sinh hc cn cch tip cn c tnh ton th hn. iu may mn l t cui th k 20 n nay cng ngh in ton pht trin mnh m, cho php s dng my tnh phn tch cc quan h phc tp, nhiu tham s m trc y khng th thc hin c.

    S pht trin ca cng ngh in ton v s b tc ca ha sinh v sinh hc phn t khi vn dng cc qui lut gii quyt vn mc t bo dn n s ra i v pht trin ca cc ngnh nghin cu mi vi cch tip cn c tnh h thng nh h gen hc, h protein hc, h t bo hc v sinh hc h thng.

    1.2. H gen hc - Genomics 1.2.1. Khi nim

    B gen (genome) l tp hp y tt c cc gen ca mt sinh vt. Trc y khi ni n b gen tc l ni n cc nhim sc th nguyn vn, tuy nhin vi s ra i ca k thut nh trnh t gen vo nm 1975, ngi ta bt u lm vic vi cc on ADN c th hay cc gen. n nm 1997 b gen ca Bacillus subtilis v Escherichia coli c gii trnh t v cng b. Gen ngi u tin c to dng vo nm 1976, cc k thut knock-out v knock-in gen c a ra t 1986, n nm 1996, cc c s d liu pht trin n mc c th ng dng trong vic nghin cu b gen v nm 2006 trnh t ca nhim sc th cui cng ca ngi c cng b. Khoa hc v b gen, h gen hc (h gen hc) cng bt

  • 8

    u cng vi s tch ly trnh t cc gen c gii m. H gen hc nghin cu vic lp bn , gii trnh t, phn tch v ch gii b gen.

    Vic nghin cu b gen c th c chia thnh hai nhnh: cu trc v chc nng. H gen hc cu trc l pha khi u ca vic phn tch b gen, n kt thc vi vic xy dng cc bn v vt l, di truyn v phin m ca mt sinh vt. Cch tip cn ny tp trung vo vic tm hiu cch thc s thay i kiu gen dn n thay i kiu hnh, da trn bn vt l v di truyn v s a hnh v trnh t ADN. H gen hc chc nng (biu hin) da trn b su tp cc cADN. Cch tip cn ny cho php pht trin cc phng php h thng tm kim gen cn quan tm v xc nh chc nng ca chng. Cc gen c to dng v trnh t ADN tng ng ca chng cung cp cng c xc nh c im biu hin mt cch ton din ca mt h gen, v cc nghin cu thc nghim c h thng v chc nng ca cc sn phm gen. Do , h gen hc chc nng s dng cc thng tin ca h gen hc cu trc. 1.2.2. Mt s cng c 1.2.2.1. Gii trnh t b gen

    Trnh t b gen ca nguyn mt sinh vt c gii m, lp ghp v xy dng bn l bc u tin trong vic nghin cu b gen. i vi cc b gen n gin nh vi sinh vt, vic gii trnh t c th thc hin bng k thut shot gun, trong b gen c ct thnh cc mnh nh enzym ct gii hn, tng mnh c gii trnh t ring v vic lp ghp cc mnh li thnh b gen hon chnh da trn vic phn tch cc trnh t trng nhau gia cc mnh. Vi cc b gen ln v d ca ngi, cc nhim sc th s c ct thnh cc mnh khong 150.000 nucleotid v cc mnh ny li c ct v to thnh cc BAC (Bacterial Artificial Chromosome), sau cc BAC s c gii trnh t theo kiu shot gun v lp ghp ngc ln ti to b gen hon chnh. Cch tip cn ny rt tn thi gian. Gn y nh cc tin b v in ton, ngi ta c th gii trnh t v lp ghp cc b gen ln bng k thut shot gun. 1.2.2.2. ADN microarray

    ADN microarray c th c s dng nghin cu s thay i v mc biu hin ca gen, pht hin cc a hnh nucleotid n (single nucleotide polymorphism, SNP) , nh typ hay nh trnh t cc b gen t bin,

    Nguyn l chnh ca ADN microarray da trn k thut Southern blot, tc s lai ha gia cc ADN si n nh c tnh b sung cp base c hiu. Tuy nhin, thay v thc hin tng phn ng Southern blot n l ADN microarray s dng mt s lng ln cc on d khc nhau c gn trn mt vi chip theo trt t nht bit trc to thnh vi chip ADN, mu c lai ha vi vi chip ADN v cc v tr c xy ra lai ha s c c v gii m theo v tr (nh tnh) v cng tn hiu (nh lng). Mu s dng c th l ADN hoc ARN.

    Hnh 1.1. Tn hiu ADN microarray

  • 9

    1.2.3. ng dng

    1.2.3.1. H gen hc dc H gen hc dc nghin cu s lin h gia kiu gen ca mt c th v kh nng

    chuyn ha cc cht ngoi lai ca ngi . N c phm vi kh rng v tng t nh y hc phn t n nhm pht hin, theo di v x l cc nguyn nhn mc phn t ca bnh. H gen hc dc ng dng cc k thut nghin cu h gen nh nh trnh t gen, di truyn hc thng k v phn tch biu hin gen i vi thuc trong qu trnh pht trin v th nghim lm sng. V nhiu bnh pht ra do hu qu t s hot ng khng chnh xc ca mt nhm gen, h gen hc dc c th nhn din cc gen hay locus c lin quan khi xc nh s p ng vi thuc. Theo cch ny, c im di truyn ca mt dn s bnh nhn tr thnh mt phn tch hp ca tin trnh khm ph v pht trin thuc. H gen hc dc c th da trn cc hiu bit mi mc phn t ny pht hin cc ch tr liu v can thip mi v gp phn lm sng t nhm gen quyt nh tnh hiu qu v c tnh ca thuc. 1.2.3.2. nh hng i vi vic pht minh thuc v nghin cu lm

    sng Vic ng dng h gen hc dc trong cc c s th nghim tin lm sng c th gip

    khi u sng lc cc hp cht vi sai s thp nht gia cc c th. Nu gen ch c la chn, ngi ta c th tm c hp cht c tc dng tt nht vi tt c cc typ ca gen v chn th nghim su hn. Do , vic chn thuc s thay th cho vic chn bnh nhn, gim ri ro do p ng khc bit gia cc bnh nhn khi lp h s ng k v khi thng mi ha, cng nh gim nhu cu sng lc v di truyn. H gen hc cng c th c s dng d bo tc dng ph trc khi a vo th nghim lm sng. V d, kiu biu hin gen gan ca ng vt dng thuc c th ch ra cc chui gen c lin quan n c tnh c c khi ng hay khng. S bin ng v mc biu hin gen cng hu ch nh bin d di truyn trong vic d on p ng thuc bt k giai on th lm sng no v cng l mt du hiu chn on. D liu di truyn dc rt quan trng trong qu trnh pht trin mt hp cht c gii hn tr liu hp hay c chuyn ha t tin thuc, cc thng tin ny c th nh hng n quyt nh nn tip tc pht trin thuc hay khng hay thit k th nghim nhm nghin cu p ng lm sng cc i tng c s a hnh i vi enzym lin quan.

    Trong giai on tin lm sng, c nhiu vn thit yu cn c xem xt. Cc vn v ha hc ca thuc, bo ch thuc c hp thu thch hp, kiu chuyn ha, phn b, v o thi vn cn mang tnh kinh nghim. D sao, cc thuc phn t nh tc ng trn cc ch c pht hin bi h gen hc s nhanh chng chim a s cc thuc c a ra th trng trong thi gian ti.

    H gen hc dc hu ch trong nhiu giai on pht trin thuc. N nh hng ng k n thit k th nghim, ch yu thng qua vic ci thin cc tiu ch chp nhn/ loi b v nh gi chnh xc hn p ng ca bnh nhn. Cc gen c lin quan n chuyn ha thuc trong nghin cu tin lm sng c th c xc nh bnh nhn tham gia th nghim giai on I. Kiu gen c lin quan n tc dng ph cng c th c dng sng lc bnh nhn lin quan trong cc th nghim tip sau. Hn na, nu d liu v hiu qu c thu thp trong th nghim giai on I, s a hnh ca gen ch tc ng ca thuc c th c xc nh bnh nhn tham gia th nghim nh gi hay bin ng v p ng thuc. Phn tch ny c th c hiu chnh trong th nghim giai on II v cho php cng ty tin hnh th nghim giai on III trong mt nhm nh bnh nhn p ng tt v t gp tc dng ph. Kt qu l thuc khng ch c hiu qu tt hn m cn c h s an ton r hn.

    mc lm sng, trong khi cc triu chng ca bnh thng nht qun, cc khc bit v gen c th dn n hiu qu iu tr khc nhau gia cc bnh nhn. H gen hc dc c th

  • 10

    xc nh quan h gia s khc bit v gen vi s p ng thuc khc nhau, qua c th tng tc vic pht minh thuc mi mt cch ng k. Mt s thuc khng t yu cu trong cc th nghim trc kia c th c xem xt li s dng i vi mt nhm bnh nhn khc.

    1.3. H protein hc - Proteomics 1.3.1. Khi nim

    H protein hc, proteomics, c hnh thnh t nhng nm 1990, l ngnh khoa hc nghin cu h protein hon chnh (proteome) ca mt sinh vt hay mt t bo, tc nghin cu v kho st c im ca tt c protein bao gm s tng hp, bin i, chc nng v s tng tc ca chng. Mt cch c th hn proteomics:

    1. Xc nh cu trc v chc nng ca tt c cc protein c to ra bi b gen ca mt sinh vt, bao gm cc bin i hu dch m

    2. Xc nh tt c cc tng tc ca cc protein ny vi phn t ln hay nh khc 3. Xc nh s biu hin ca cc protein ny theo thi gian v iu kin sinh l 4. Phi hp cc thng tin ny thnh mt bn m t thng nht v nht qun ca sinh vt

    mc t bo, c quan hay sinh vt hon chnh. Vic xc nh cc protein c to ra bi t bo (proteome) c th phc tp v n qu

    ln. Cch n gin nht l nh cp 1:1 gia tng protein v gen ca n. iu ny c th thc hin d dng nhn nguyn thy v khng c ct-ni ARNm, nhng vn kh thi nhn tht. Cng cn lu rng mi gen c th khp vi nhiu protein do s bin i hu dch m hoc s ct-ni theo nhiu cch. Vic xc nh chc nng ca protein th phc tp hn. C th thc hin theo cch truyn thng nh t bin hay phn lp protein. Tuy nhin khi s protein bit r chc nng v cu trc tng ln, ngi ta c th s dng cc cng c tin sinh hc d on v do rt ngn qu trnh. Nghin cu s biu hin ca protein mc tng th, proteomics biu hin, hin nay cn gii hn vic chp nh proteome sau khi kch thch t bo mt cch thch hp. Vic phn tch cc nh chp ny tp trung trong 2 kha cnh: xc nh s thay i v mc (tng hay gim) v thay i v bin i hu dch m, thng l s phosphoryl ha protein. Cui cng cc thng tin c kt ni nh cc cng c in ton.

    S pht trin ca cc k thut phn tch v nhn din dn n s hnh thnh nhiu lnh vc c th hn ca proteomics nh proteomics biu hin v proteomics tng tc. Hn na, cc ng dng c th cng c hnh thnh nh proteomics lm sng v proteomics c tnh. Proteomics biu hin

    Proteomics biu hin c nh ngha l s xc nh, nh lng v phn tch mc ton b cc protein c biu hin ca mt sinh vt, m, hay t bo trong iu kin bnh thng hay cc iu kin khc nh bnh tt hay sau khi c x l vi mt cht no . Khi u, lnh vc ny ch yu da trn k thut in di 2 chiu (2-DE), nhng gn y cc k thut khng s dng gel c pht trin nh LC-MS v protein array. Proteomics tng tc

    Proteomics tng tc nghin cu s tng tc gia cc protein hay gia protein vi cc cht khc v nghin cu vai tr ca cc phc hp protein trong cc qu trnh sinh hc. Cc phng php c s dng nh l h thng lai i nm men (yeast two-hybrid system), hin th phage (phage display), protein array, v tinh ch i lc cc phc hp ri phn tch bng khi ph c p dng thnh cng trong nghin cu proteomics tng tc. Proteomics lm sng and Proteomics c tnh

    y l cc lnh vc ng dng ca proteomics biu hin trong lm sng. Proteomics lm sng bao hm vic xc nh cc du n sinh hc (biomarker) pht hin bnh hay tin trin

  • 11

    hay thm ch l s hi phc sau khi iu tr. Proteomics c tnh tp trung vo vic lm sng t tc ng c hay gy bnh tim tng ca cc cht hay yu t mi trng. 1.3.2. Mt s cng c 1.3.2.1. in di gel hai chiu (2D Gel Electrophoresis, 2-DE)

    2-DE l k thut c s dng rng ri nht trong nghin cu proteomics tch v phn tch protein. Trong 2-DE, protein c tch v hin hnh bng cc php nhum trc hay sau in di, nhum theo loi protein (v d protein c phosphoryl ha hay glycosyl ha), nhum hunh quang hay t x k vi cc protein c nh du phng x. Thng thng, 2000 n 3000 protein ca c phn gii trn mt gel 2-DE chun (Hnh 1.2). K thut ny c tnh lp li tt, nh lng c v kh n gin c th thc hin vi s mu phn tch ln.

    Hnh 1.2. Phn tch protein bng in di gel polyacrylamid hai chiu

    V k thut vic in di c tin hnh 2 ln, ln th nht mu c tch da trn in di ng in (isoelectric focusing, IEF), kt qu ca ln chy th nht c dng lm mu cho ln chy in di th 2 da vo k thut tch theo kch thc. 1.3.2.2. Khi ph

    Mt trong cc th thch ca nghin cu proteomics l xc nh trnh t protein c tch ra. Do s protein trong 1 sinh vt ln n hng nghn nn cc k thut nh trnh t protein thng thng khng p dng c. S pht trin ca k thut khi ph (mass spectrometry, MS) trn cc i phn t sinh hc gn y gii quyt vn ny vi nhy, chnh xc v kh nng x l s lng mu cao. Cc c im u vit ny cng vi s m rng ca d liu genomics, to ra mt cuc cch mng trong vic pht hin v xc nh protein. MS c dng xc nh protein c tch bi in di hay sc k (Hnh 1.3).

  • 12

    V k thut, protein cn phn tch bng khi ph s c ct thnh cc peptid ngn nh trypsin, cc peptid ny sau c ion ha dng kh, s khi ca cc ion c o v sau d liu s c phn tch da trn s khi ca cc mnh v d liu genomics vi s gip ca my tnh. Vic ion ha cc peptid c thc hin bng phng php ion ha mm, tc chuyn peptid thnh ion m khng lm gy cc lin kt ha hc ca n. Hin c hai k thut ion ha mem c s dng rng ri l phun in t (electrospray ionization, ESI) v gii hp bng laser c h tr bi cht nn (matrix-assisted laser desorption ionization, MALDI).

    Tch bng gel /sc k Mu protein Thy gii protein

    Tm vi c s d liu

    Tm vi c s d liu

    MALDI: du n khi ph ca peptid

    MS/MS: thng tin trnh t v s khi

    Lp li n ln

    Hnh 1.3. Xc nh protein t gel bng khi ph

    Vt protein quan tm trn gel c ct ra v x l vi trypsin thu c cc mnh peptid. C hai phng php c dng xc nh mt protein t cc petid thu c. Phng php th nht, s khi ca cc peptid c th c xc nh bng du n khi v so snh vi d liu b gen hin din trong c s d liu tin sinh hc. Phng php khc, tng ion peptid s c chn phn mnh - khi ph lin tip (tandem MS, MS/MS), v to ra thng tin trnh t mi. S t hp cc thng tin trnh t v s khi ca peptid c dng xc nh chnh xc protein bng cch so snh vi d liu b gen. Cc mu sinh hc thng cc k phc tp do d phn tch, khi ph thng c

    ghp vi sc k. Thng thng, sc k lng hiu nng cao pha o (reverse phase high performance liquid chromatography, RP-HPLC) c s dng ghp vi khi ph (LC-MS). Khi ph s nhn v phn tch cc peptid c gii hp tun t t ct sc k. LC-MS hot ng chm hn so vi MALDI, nhng cho d liu c cht lng tt hn. phn tch cc hn hp rt phc tp vi phn gii cc k cao ngi ta thng s dng cc k thut sc k hai ln kt hp vi khi ph lin tip (LC/LC-MS/MS), i khi cng c gi l k thut xc nh protein a chiu (multidimensional protein identification technology, MudPIT), has been established. Ln sc k th nht thng l trao i ion (IEC) v theo sau bi RP-HPLC.

    1.3.2.3. M ng v Ngi ta c th s dng cc ng v phng x nh du protein, peptide nhm phn

    bit chng khi phn tch khi ph. Vic nh du c th thc hin trong qu trnh nui cy hay khi ct protein bng trypsin trc khi phn tch. Cch tip cn ny cho php nh lng phn bit cc protein m phng php phn tch c khng lm c.

  • 13

    1.3.2.4. H thng lai i nm men H thng lai i nm men (yeast two-hybrid system) gip xc nh cc tng tc tim

    nng ca protein do cho php tm hiu su cc qu trnh sinh hc. Trong k thut ny, gen m ha cho protein hay on peptid cn nghin cu (cu) c ni vo vng m ha cho on gn ADN ca yu t phin m nm men (thng dng GAL4 hay LexA). Vng mu ha cho mt protein (mi) hay mt th vin protein t cc m khc nhau (th vin mi) c ni vo on hot ha phin m ca cng yu t phin m trn. Mt gen tn hiu c t di s kim sot ca yu t phin m ny. Nu cu v mi tng tc vi nhau (cn cu th yu t hot ha gn c vo trnh t hot ha kch hot s biu hin gen tn hiu. Cc gen tn hiu c s dng l cc enzym hay yu t tng trng do c th nhn bit kiu hnh d dng.

    Hnh 1.4. Nguyn l h thng lai i nm men

    Hnh 1.5. Protein array

  • 14

    1.3.2.5. Protein Array Cc protein, khng th hay phn t sinh hc khc nhau bit trc c gn theo trt t

    nht nh trn mt b mt rn rt nh to thnh protein chip, mu cha cc protein cn phn tch c cho tng tc vi protein chip theo nguyn l tng t ELISA (Hnh 1.5). Protein array c th dng phn tch s biu hin, tng tc hay chc nng ca protein. 1.3.3. ng dng proteomics trong nghin cu pht trin thuc

    Trong lch s, dc phm c pht trin ch yu thng qua vic phn tch ngu nhin hng ngn hp cht tng hp v sn phm t nhin. Phng php nghin cu dc phm truyn thng da trn l thuyt sinh ha v dc l v mt bnh no . Cc mc tiu c xc nh da trn l thuyt ny v hng nghin cu l mt s ngu nhin. Nghin cu c in bao gm phn lp v xc nh c im ca cc sn phm t nhin cng vi vi hot tnh sinh hc. Cc hp cht ny sau c tinh chnh li bng cch thit k li cu trc phn t ca n to ra cc cht mi c hot tnh sinh hc cao hn v t tc dng ph hn. Hn ch ch yu ca mt phng php nh vy l vic nghin cu sn phm t nhin vi hot tnh sinh hc xc nh v c bn l may ri v do n thiu mt c s hp l.

    Tin b ch yu u tin trong nghin cu dc phm l ha t hp, bao gm vic dng cc k thut c hiu nng cao chun b mt s lng ln cc hp cht cho vic sng lc trn cc i tng sinh hc khc nhau. Nhm khc phc cc kh khn trong nghin cu truyn thng, genomics c dng nh l mt phng thc tng cng hiu bit v bnh tt. Ngi ta hi vng rng nhng hiu bit ton din v cu trc di truyn ca sinh vt s dn n nhng nghin cu hiu qu hn. Mc d c ch, vic phn tch trnh t DNA n l khng gip xc nh mc tiu mi hiu qu, bi v ngi ta khng th d dng kt lun chc nng cc sn phm ca gen, hay protein, v cc con ng sinh tng hp protein t trnh t DNA. Cc giai on chnh trong nghin cu pht trin dc phm vi s tham gia ca genomics, proteomics v tin sinh hc gm cc bc nh sau:

    - Xc nh cc ch tc dng ca thuc mi t cc c s d liu trnh t protein - Xc nh c im chc nng sinh hc ca cc protein ch - nh gi liu php thch hp cc chc nng protein ch - Xc nh cc phi t bng cch tm kim cc tng tc protein-phi t - Pht trin cc th nghim in vitro - Sng lc tm cht c hot tnh (cc hit, cht c tim nng) - Chuyn cc cht tim nng thnh u thuc (lead) - Ti u ha cc lead bng cu trc 3D ca ch v/hoc thit k thuc da trn lead - nh gi cc lead ti u bng cc m hnh - La chn cc ng vin tin lm sng

    Pht minh thuc l mt qu trnh lu di v tn km vi s gii hn cc lead c trin vng. Genomics v proteomics chc nng cung cp mt s lng ln cc ch tc dng mi ca thuc. Sng lc hiu nng cao v cc th vin hp cht c to ra bi ha t hp lm tng s lng cc lead mi. Thch thc hin ti l lm tng hiu qu ca cc th nghim hiu lc v c lc. Trong thc t, iu ny khng d dng bi v v s cc gen, protein v cc phn t khc tng tc vi nhau qua cc con ng truyn tn hiu nh hng chc nng ca t bo. Nh nhng tin b ca k thut proteomic, n ngy cng c ng dng nhiu ci thin qu trnh pht minh thuc. Bi v hu ht cc thuc u tc ng ln protein, do vic tp trung nghin cu mc ny rt quan trng. 1.3.3.1. Protein v tc dng thuc

    Nhiu h thng iu ha quan trng i vi thuc hot ng thng qua protein (sau dch m). Nhiu loi thuc hot ng bng cch gn vi cc protein. VD mt loi thuc c ch

  • 15

    protease c thit k bt hot enzyme protease (mt protein gip virus nhn ln). Mt loi thuc c cu trc thch hp c th gn ln b mt ca protein protease, v ngn cn hot ng ca n. Nu protease b bt hot, virus khng th nhn ln, do gii hn s tn cng ca n. tm kim cc hp cht c li nh cht c ch protease virus, cc nh khoa hc cn hiu r cu trc v chc nng ca c hp cht v protein m n tc ng.

    a s ch tc dng ca thuc l cc protein c m ha bi cc gen biu hin trong cc m b nh hng ca mt bnh no . Ngi ta d on l c khong 10.000 enzym, 2.000 th th lin kt protein G, 200 knh ion v 100 th th hormon nhn c m ha trong b gen ngi. Cc protein ny l nhng thnh phn chnh trong cc con ng chuyn ha lin quan n bnh v do c kh nng l mt ngun cung cp ch tc dng ca thuc phong ph. Cc ch tc dng ca thuc c th nghim c nhng c im m ch c th c xc nh bng cch hiu r cc mc biu hin ca chng trong t bo ch khng th xc nh bng trnh t gen ca chng. Cc ch tc dng ca thuc (1) ch yu thng c biu hin trong cc m chuyn bit, cho php chn la tc dng thuc v lm gim nguy c phn ng ph v (2) thng biu hin mc thp trong t bo. Do , mt h thng pht hin ch tc dng hiu qu s kch hot vic d tm cc gen m ha cho protein biu hin trong cc m chuyn bit mc thp, t cho php nhanh chng xc nh cc protein c kh nng l ch tc dng cho s pht trin phng php chn on v cc liu php. V nhng l do , thng tin nghin cu xc nh cc protein mi chuyn t cc t bo dng sang s pht hin cc protein thay i trong cc m ngi thc s. 1.3.3.2. S tng tc ca protein

    Vic xc nh c tng tc hay gn kt ca mt protein cha bit chc nng vi mt protein khc bit ri chc nng hay c lin quan n mt qu trnh no s cung cp thng tin xc nh chc nng ca protein cha bit v hon thin cc qu trnh sinh hc. Vic lm sng t cc qu trnh sinh hc gip hiu r c ch bnh v do c th gip pht trin cc phng php iu tr hay thuc thch hp. 1.3.3.3. Cc du hiu sinh hc protein trong nghin cu lm sng v

    tin lm sng Cc du hiu sinh hc (biomarker) l cc biu hin c th o c c ca cc qu trnh

    sinh hc. Cc du hiu ny c th mc h thng, t bo hay phn t. Nghin cu proteomics thc y qu trnh xc nh cc biomarker protein ca nhiu qu trnh sinh hc khc nhau. Cc du hiu ny c th dng trong chn on, tin lng bnh, nh gi hiu qu iu tr v nh gi tc dng ph hay c tnh ca thuc. 1.3.3.4. Proteomics trong pht minh thuc tr ung th

    K thut proteomic c kt hp vi cc cch tip cn genomic cho nghin cu dc phm tr ung th v nh gi ch tc dng. Trong phn ln cc k thut proteomic c cho mc ch ny, k thut quan trng nht l s xc nh cu trc 3D ca protein, protein microarray, vi phu bng laser v nghin cu cc tng tc ca protein-protein v protein-thuc. Cc biomarker ung th v mt vi con ng chuyn ha t bo l ch tc dng quan trng ca thuc. Mt vi k thut c s dng c trong lnh vc nghin cu cng nh cng nghip v c kt qu ng khch l trong nghin cu dc phm ung th. 1.3.3.5. Proteomics trong pht minh thuc tc ng trn CNS

    K thut proteomic thch hp cho nghin cu m no v c th p dng cho vic khm ph ch tc dng ca thuc cha cc ri lon v thn kinh. Cc bnh c bnh hc lin quan n protein nh bnh Alzheimer c bit thch hp vi cch tip cn ny. Cc receptor

  • 16

    quan trng cho cc loi thuc CNS (h thn kinh trung ng) bao gm cc protein nh cc receptor cp i vi protein G, receptor ca N-methyl-D-aspartate v cc protein kinase. Cc chn on phn t c th c da trn cc protein c pht hin trong dch no ty, v cc protein tng t c th s dng nh l ch tc dng ca thuc. Proteomics s b sung cho pharmacogenomics v to iu kin cho s pht trin ca dc phm chuyn bit cho cc ri lon v thn kinh.

    1.4. H t bo hc - Cytomics B gen xc nh c im di truyn ca mt sinh vt, nhng khng phi ton b khng

    gian v thi gian ca t bo u c huy ng p ng vi cc thay i ca mi trng. Do ty tng thi im v iu kin mi trng m t bo s c tnh trng ng hc (cytome) khc nhau. Cytome c th c nh ngha nh l cc h thng t bo v cc thnh phn chc nng v tiu h thng ca c th. H t bo hc (cytomics) l khoa hc nghin cu kiu hnh phn t ca mt t bo n pht xut t kiu gen v di s nh hng ca mi trng vi kh nng truy xut thng tin mnh nh tin sinh hc. S iu ha cc chc nng t bo cc loi t bo khc nhau l mt qu trnh c bit ha cao v khng gian, thi gian v ng hc. Cc loi t bo khc nhau s dng cc c ch iu ha nhiu cp khc nhau ty bin cc thit lp ca b gen theo s thay i ca mi trng.

    Bnh tt hay thuc s can thip vo cc chc nng ca t bo v nh hng gy ra trn t bo khc nhau ty thuc loi v tnh trng chc nng ca n (v d s bit ha, chu k t bo, dao ng ngy-m). Trong nhng nm gn y, t bo c nghin cu nhiu nh l mt cng c iu tr cc bnh phc tp qua cc nghin cu v t bo gc v liu php gen. Nghin cu cytomics gip hiu c ng hc hnh vi ca t bo v nh ci thin c hi thnh cng.

    Vic sng lc cc ch chc nng trong pht minh thuc i hi iu kin mi trng ni bo nht nh. Chc nng ng ca mt protein ni bo ty thuc vo vic x l n v mi trng. Do tnh khng ng nht ca cc loi t bo v s khc bit v chc nng v cu trc gia cc t bo (v d t bo gan, t bo thn knh, ) tnh trng khe mnh v bnh tt, ta cn phi xem xt tnh khng ng nht ny v cu trc v chc nng. Kiu hnh nn trong mt protein c biu hin cn c xem xt khi nghin cu chc nng ca n trong qu trnh pht minh thuc.

    Cc tin b mi trong k thut o t bo da trn hnh nh v dng chy cho php nghin cu cc qu trnh t bo vi nhiu chi tit v t thu c nhiu thng tin v chc nng v cu trc ca t bo. Cc knh hin v laser qut v trng rng cho php nghin cu s nh v v ng hc ca cc phn t trong t bo v m. c im tc ng ca thuc c th c nghin cu mt cch chi tit nh knh hin vi k thut s nh lng. Trong nhng nm gn y, chng ta thy s pht trin ca cc nghin cu t bo nh lng qui m ln nh. Vic lp ghp cc c s d liu ca tin trnh t bo c thit lp qua D n H t bo Ngi (Human Cytome Project - HCP) c th gip chng ta ci thin hiu bit v tin trnh bnh v ng hc v khng gian, thi gian ca chng mc t bo. iu ny s to ra mt nn tng vng chc cho vic nghin cu pht trin v khm ph thuc mi.

    1.5. Sinh hc h thng Sinh hc h thng nghin cu mt sinh vt nh l mt h thng cc gen, protein v cc

    phn ng sinh ha thng nht v tng tc vi nhau to ra s sng. Thay v phn tch cc thnh phn hay kha cnh ring r ca sinh vt, nh s chuyn ha ng hay nhn t bo, cc nh sinh hc h thng tp trung vo tt c cc thnh phn v cc tng tc gia chng, tt

  • 17

    c nh l thnh phn ca mt h thng. Nhng tng tc ny chu trch nhim cui cng i vi hnh dng v chc nng ca mt t bo. V d, h min dch khng phi l kt qu ca mt c ch hay mt gen n l. ng hn l do s tng tc ca nhiu gen, protein, c ch v mi trng bn ngoi sinh vt to ra cc p ng min dch chng li s nhim trng v bnh tt.

    Sinh hc h thng xut hin nh l h qu ca "catalog" di truyn hc c cung cp bi d n b gen ngi (Human Genome Project), v s tng cng hiu bit v cch cc gen v sn phm protein ca chng to ra hnh dng v chc nng sinh hc. Vic nghin cu sinh hc h thng c tr gip ca internet cho php cc nh nghin cu lu tr v phn phi mt khi lng thng tin khng l, nhng tin b ca cc k thut nghin cu mnh m, v s kt hp gia cc nh khoa hc thuc cc lnh vc khc nhau nh cc nh khoa hc my tnh, nh ton hc, vt l, k s. Ti liu tham kho: 1. Szathmary, E., F. Jordan, and C. Pal, Molecular biology and evolution. Can genes explain

    biological complexity? Science, 2001. 292(5520): p. 1315-6. 2. Kellenberger, E., The evolution of molecular biology. EMBO Rep, 2004. 5(6): p. 546-9. 3. Westerhoff, H.V. and B.O. Palsson, The evolution of molecular biology into systems

    biology. Nat Biotechnol, 2004. 22(10): p. 1249-52. 4. Rheinberger, H.-J., Epistemology. What happened to molecular biology? B.I.F. FUTURA,

    2007. 22(4): p. 218-223.

  • 19

    BBii 22.. nngg ddnngg ssiinnhh hhcc hh tthhnngg ttrroonngg ttmm kkiimm tthhuucc mmii

    Mc tiu: - Nm c xu hng tm kim thuc mi hin nay. - Trnh by cch tip cn h thng trong tm kim thuc mi.

    2.1. Khi qut Trong Th k 20 chng ta c chng kin nhng thnh tu ni bc trong hiu bit v

    c im ca cc vt cht (vt l, ha hc v my mc) v s ha thng tin (khoa hc my tnh). Tuy nhin, nhiu ngi trong chng ta vn b bnh tiu ng, ung th v thoi ha thn kinh bi v y hc hin ti vn cha pht trin mt chin lc hiu qu tin on v ngn chn. y l s tht v nguyn nhn gy bnh chnh xc ca nhng bnh l phc tp ny, v l do ti sao mt vi ngi li d mc bnh vn cha hiu r.

    Th k 21 bt u vi vic gii trnh t hon ton b gen ngi, mt thnh tu to ra nn tng cho cho cuc cch mng sinh hc. Cc nh sinh hc c th c c m ngun ca bt k loi no. S gii m gen ca mt loi l im bt u cho sinh hc h thng. Nhng th nghim qui m ln vi nm men, rui gim, chut ch c th tng tng cch y vi thp k by gi c th c thc hin thng qui v chng ta bit c trnh t b gen.

    Tuy nhin, hy vng chuyn gen thnh thuc mt cch nhanh chng khng thnh v trn thc t sinh hc v bnh tt qu phc tp v vic pht trin thuc phi cn n s hiu bit su sc v cc p ng sinh hc. Sinh hc h thng hng n vic miu t v hiu c s hot ng ca h thng sinh hc phc tp v cui cng l pht trin m hnh d on bnh ngi. Mc d m hnh y ngha cp phn t v chc nng t bo v m ngi cn xa vi, nhng cc n lc ca sinh hc h thng ang nh hng n vic khm ph thuc.

    Vic pht minh thuc t bui s khai song hnh vi sinh hc h thng: cc thuc c truyn, thuc dc liu c khm ph nh s quan st quan h nhn qu ngi mang bnh. T th k 19-20, nh s tin b ca ha hc hng nghn hp cht t nhin hay dn xut ca n v cc cht tng hp mi c sng lc nhm pht minh thuc mi. Tuy nhin, sng lc thuc thi k ny vn c thc hin trong cc h thng phc tp, tc s dng ton b sinh vt, nhng thay con ngi bng ng vt th nghim. Hu ht cc thuc m ta c ngy nay u trc tip hay gin tip c pht minh nh cch tip cn sinh hc h thng ny. Nh nhng hiu bit mi v c ch ca cc qu trnh sinh hc v nhu cu tng tc sng lc, ngi ta thay th m hnh ng vt bng cc m hnh m (v d trng lc ca c mch mu v c kh qun), ri n cc m hnh da trn t bo (s phn bo hay to cytokin) v gn y nht l cc sng lc hiu nng cao hay siu nng cho php sng lc hng trm nghn hp cht mi ngy.

    Cch tip cn theo kiu p o s lng ny rt hu hiu khi ch tc ng c bit r (ngha l cc ch ca thuc c), nhng vi cc ch mi, t c hiu r hn v mt sinh hc (v d t b gen) th rt ng tht vng v ch rt t thuc mi c khm ph. Tham vng khai thc kho tng b gen phi i mt vi thch thc mi l vic bit r ch khng ging nh bit hot ng ca ch. Thc t, mc d vi s u t khng l vo genomics v k thut sng lc hn 20 nm qua, gi thnh ca vic khm ph thuc mi tip tc gia tng trong khi t l c cp php li gim. Vic sng lc da trn ch-ng vin tht bi do tnh phc tp ca bnh l. Do cn phi quay li vi sinh hc h thng, d nhin vi cch tip cn mi, hin i hn.

    Mc tiu ca sinh hc h thng hin i l hiu chc nng sinh l hc v bnh t mc con ng ha sinh phn t, mng li iu ha, cc t bo, m, c quan v cui cng l c c th. Hin ti, sinh hc h thng bao hm rt nhiu cch tip cn v m hnh khc nhau khm ph

  • 20

    v hiu s phc tp ca sinh hc, v nghin cu cc sinh vt t vi khun n ngi. V hc thut ch yu tp trung vo pht trin nhng cng c tin sinh hc v nn tng in ton tch hp cc d liu n gin (d liu v biu hin gen tng th, proteomic v metabolomic) vo cc m hnh mng li iu ha v hot ng t bo. Do tnh phc tp ca h thng sinh hc l mt hm m ca s thnh phn ca h thng v s tng tc gia chng v chng tng ln theo mc t chc (Hnh 2.1), nn cc kt qu hin b gii hn trong nhng sinh vt n gin hay vi cc con ng ha sinh c th trong mt t bo v iu kin mi trng rt c th cc sinh vt phc tp hn. Mt khc ngay khi c d liu mc phn t th gii hn ca cng ngh my tnh cng hn ch vic tch hp chng hiu mc t bo hay m. Do cn c phng php lc d liu.

    2.2. Omics: To v khai thc d liu quy m ln Cch tip cn omics i vi sinh hc h thng tp trung vo cc thnh phn cu to nn

    cc h thng phc tp (gen, protein v cc cht chuyn ha). Cch tip cn ny c ngnh cng nghip dc phm s dng trit nhm b sung cho cch tip cn truyn thng trong vic xc nh v thm nh ch thuc, cho vic pht sinh gi thuyt v cho cc phn tch thc nghim trong cc phng php da trn gi thuyt truyn thng. V d cc omics c th c dng tm ra gen, protein hay trng thi phosphoryl ha no ca protein c biu hin hay iu ha vt mc trong tin trnh bnh, a n cc gi thit c th kim chng v cc kiu iu ha quan trng trong vic cm ng hay tin trin ca bnh (Bng 2.1). S tch hp cc d liu genomic, proteomic v metabolomic trong iu kin gen c kim sot hay s ri lon do thuc trn t bo phc tp v ng vt (v trn d liu lm sng) l nn tng cho cc n lc ca sinh hc h thng ti mt s cng ty thuc bao gm Eli Lilly, ni h tng tc vic nghin cu cc tin trnh sinh l phc tp nh s bin dng ca xng.

    S phn loi omics v trng thi bnh c th a n nhiu ch tc dng hiu qu hn hay thm ch c th c nhn ha cc liu php bng cch xc nh qu trnh phn t c trng trong cc trng thi bnh nht nh v cc bnh nhn c th. Mt ng dng quan trng khc ca k thut l xc nh cc du hiu (marker) i din pht hin bnh, hoc theo di cc liu php iu tr. Mc d, tip cn omics tng tc s pht trin cc gi thit v c ch v thu hiu v lm sng, hiu bit mc h thng khng t nhin xut hin.

    Ngi ta n lc rt nhiu hiu cc con ng ha sinh chnh v p ng mc sinh vt bng cch da trn cc c tnh biu hin gene ton cc v d liu biu hin protein (ngha l c tnh ton h thng khng th c d on t cc b phn). cc sinh vt tng i n gin, cc nghin cu hp nht vic phn tch d liu hoc mARN b gen theo thi gian, phn tch stress v xc nh cc thnh phn c iu ha cng nhau trn din rng, v nghin cu tng tc protein-protein dn n nhim hiu bit mi v cc chc nng ca con ng ha sinh v s t chc ca mng li tn hiu trong cc tin trnh sinh hc c th, chng hn s tng sinh t bo hay p ng vi cc stress chuyn ha. D s phc tp trong bnh tt ca ngi cng nh cc gii hn v kinh t v in ton hn ch mnh vic ng dng omics nh l mt tip cn c lp hiu bit mc h thng, k thut omics s ng vai tr quan trng trong vic xy dng cc c s gip xc nh v gii hn cc pathway v kt ni kh d ca mng li tn hiu t bo trong m hnh t trn xung.

  • 21

    M hnh ha

    Th nghim h thng t bo phc Omics

    Phn t Con ng T bo M Ngi

    Mt Giy

    Hnh 2.1. Cc tip cn n sinh hc h thng trong ngnh dc Omics (kiu tip cn t di ln) tp trung vo vic xc nh v o c mc ton cc cc thnh phn phn t. M hnh ha (kiu tip cn t trn xung) to cc m hnh tch hp (xuyn qui m) v sinh l ngi v bnh, tuy nhin, vi cng ngh hin c, cc m hnh ny tp trung vo cc vn kh c th mt qui m no v d mc con ng ha sinh hay c quan. Kt ni hai cch tip cn ny c th l cc d liu lc ha (v d lc ha hot ng a thnh phn sinh hc, Biologically multiplexed activity profiling, BioMAP) ly t cc th nghim hiu nng cao c thit k hp nht tnh phc tp sinh hc nhiu mc : cc con ng hot ng a tng tc, cc kiu t bo giao tip a hng v nhiu kiu mi trng khc nhau. Cch tip cn h thng t bo phc tp nh vy nhm n nhu cu d liu v cc p ng t bo i vi cc kch thch sinh l v vi tc nhn thuc nh l mt b sung i vi ngi lm m hnh, v cng l mt cch tip cn thc t n sinh hc h thng mc mng li tn hiu t bo v qui m tng tc gia cc t bo. Bng 2.1. ng dng v thch thc ca mi cch tip cn sinh hc h thng

    Omics Cc h thng t bo phc tp* M hnh ha Hiu su mc h thng +/- + + Hnh thnh gi thuyt + + + Th nghim m hnh - + - Thm nh/xc nh ch + + +/- Thm nh hp cht +/- + - S ti u ha u thuc/SAR - + - Du hiu bnh/ thit k th nghim - +/- + Nng sut x l Chm Nhanh Rt chm

    Cc thch thc S lng d liu Cht lng d

    liu Cn trong bi cnh sinh hc

    S sn c ca cc loi t bo M hnh ha b gii hn ca cc tc ng c tnh

    h thng

    D liu b b qua hoc c sai

    s Kh khn trong thm nh m

    hnh

  • 22

    -: Khng gii quyt vn ; +: Gii quyt c vn ; +/-: Gii quyt c trong iu kin nht nh

    * xem BioMAP (Hnh 2.3) 2.3. Cc m hnh my tnh: t cc qu trnh sinh hc

    n sinh l bnh Mc ch ca vic m hnh ha trong h thng sinh hc l cung cp nn tng cho vic

    to gi thuyt v tin on da trn m phng in silico v sinh hc bnh ca ngi. n nay, mt m hnh tch hp tng qut v hnh vi t bo ngi vn cn xa vi, nhng cng c cc tin trin tht s trong n lc pht trin v th nghim cc phng php thc nghim v tnh ton i vi sinh hc h thng in silico nhiu cp khc nhau (Bng 2.2). Hn na, trong pht trin thuc, khng cn n cc m hnh ton din. Hin nay, cc m hnh chuyn su, nh hng n cc vn c th c nh hng n vic thm nh ch tc ng v cc quyt nh pht trin trn lm sng (Bng 2.1).

    Bng 2.2. Mt s v d m hnh in ton lin quan n sinh hc bnh ngi Cch tip cn H thng Nhn xt Sinh l hc bnh Tim Cc m hnh nh lng ca tim t gen n sinh l Diabetes M hnh bnh tiu ng Asthma M hnh ton hc trn my tnh ca bnh hen mn

    tnh d on p ng ca bnh nhn vi cc liu php khc nhau M hnh hen mn tnh d on s km hiu qu ca s c ch IL-5

    M hnh t bo tch hp

    Ung th M hnh mng li cha 1.000 gen/protein, 3.000 thnh phn c d on tc ng ca gim biu hin gen (gene knockdown)

    T bo c tim Kt ni cc m un (chuyn ha trung gian, sinh l in hc v c) pht trin m hnh in ton t bo c tim

    M hnh con ng ha sinh

    a h thng Cc c tnh tng ha (khong thi gian tn hiu c ko di, cc hnh vi ngng) ca s truyn tn hiu trong cc m hnh mng li

    EGFR/MAPK Cc m hnh in ton ca truyn tn hiu EGFR Tc thay i nng phi t so vi i lc trong kt xut xui dng Cc m t m hnh lun l thc thi c ca mng li EGFR

    NF-B Cc c tnh chm ca c ch nhn tn hiu v c tnh nhy cm ca cc thnh phn tn hiu Chng minh vai tr ca cc ng ng IB trong c tnh x l tn hiu song phng ca con ng truyn tn hiu NF-B

    M hnh trong pht minh v pht trin thuc phi m phng cc p ng qui m phc tp ca t bo, m hay c quan, tc l qui m biu hin ca bnh tt. ng thi m hnh cng phi chi tit truy xut cc im can thip cho vic pht minh thuc v c th m un ha in silico d on kt xut mc c quan. V d, m hnh gi lp s co tht c tim phi c lin

  • 23

    kt gia knh Na+/Ca2+ v s co tht c d on cc thuc tc ng trn cc knh ny. Kh khn xut hin khi m hnh c gng tch hp mt cch hiu qu cc mc t phn t n t bo v c quan. Bn cnh kh khn v cng ngh tnh ton, cc gii hn v kin thc t di ln v hiu bit v cc con ng ha sinh, cu trc mng li v cc tng tc cng nh thiu kin thc chun v cc p ng mc t bo v c quan i vi cc kch thch sinh hc c th thm nh m hnh l cc vn c bn v lu di, cn c gii quyt trc khi xem xt cc m hnh tch hp a qui m.

    Mt cch tip cn thc t gii quyt vn tnh ton l a vo mt khung mc c quan v gia tng tnh phc tp ca m hnh theo dng m un. V d, m hnh vim c th c bt u vi xem xt giao tip t bo-t bo qua mng li cytokin v tip n thay cc l trng bng cc m phng hnh vi t bo c m hnh ha t cc m un li (v d m hnh tnh di ng ca b khung t bo, cc p ng cytokin hay tng sinh) v cui cng thay cc m un con ng ha sinh cn trng bng cc tip cn t di ln.

    Cng ty Entelos pht trin cc m phng sinh l bnh phc tp s dng khung cc phng trnh vi phn quyt nh da trn d liu thc nghim ngi. Trong cc m hnh ny, cc con ng tn hiu ni b khng c m hnh ha mt cch r rng, t bo hay thm ch m c th hin di dng l trng p ng vi d liu nhp vo bng cch cung cp cc d liu xut c th thay i theo thi gian. S dng khung mc c quan nh vy, ngi pht trin cc m hnh ton hc ca bnh hen mn tnh tch hp cc tng tc gia cc t bo v mt vi mc phc tp cc p ng ca chng vi nhau v vi mi trng. Cc tham s ca m hnh c th c iu chnh t c cc im tham chiu trng thi n nh no , v d trng thi hen mn tnh (bao gm vim t bo a acid mn tnh, tc nghn ng th mn tnh, tng p ng ng th v tng mc IgE) hay trng thi tc nghn ng th do vn ng. p ng hen c m phng nh d on i vi nhiu thuc gm ch vn 2, glucocorticoid v i vn leukotrien. Hn na, bng cch m phng s gim interleukin 5 (IL-5) ph thuc khng th (cht dn d bch cu a acid trong bnh hen) m hnh ny c th d on s gim bch cu a acid trong ng h hp nhng t ci thin v thng ca ng th, cc d on ny ph hp vi th nghim lm sng s dng khng th chng IL-5 ngi ha trong bnh hen.

    Cc m hnh qui m t bo v c quan tng t v chuyn ha v cn bng ni m glucose xut pht t quan h n gin gia glucose v mc insulin trong tun hon v c pht trin thnh cc m hnh phc tp hn, tch hp cc p ng a m v vai tr ca chng trong chuyn ha glucose. M hnh ny c ng dng trong thit k th nghim pha I cho thuc tr tiu ng type 2. Nh c m hnh cc phn khc liu cng nh s bnh nhn cn thit c gim xung v do vy gim chi ph v tng tnh chc chn ca kt qu th nghim.

    Nhng hiu bit chi tit hn v hnh vi h thng trong cc con ng tn hiu lin bo, chng hn xc nh cc nt quan trng hay cc im iu ha trong mng li hay hiu r hn s lin h gia cc con ng, cng c th gip hiu ng ch tc ng ca thuc v ngha i vi sinh l mc c quan hay sinh vt. Theo hng ny, nhiu n lc tp trung vo cc con ng truyn tn hiu trong t bo (Bng 2.2). Cc m hnh ny c li t s lng ln cc d liu l thuyt v vic ha hn rng cc n lc v omics c th cung cp cc lin kt trn nhng qu trnh. Nh cc m hnh mc t bo v c quan, cc m phng v mng li truyn tn hiu ng vt c v thng da trn cc phng trnh vi phn ph thuc thi gian v lp m hnh con ng ha sinh trong trng thi c lp v di nhng iu kin rt c th (v n gin). Mc chi tit k tip tng cng tnh thit thc ca cc m hnh con ng ha sinh ny l s lin h gia cc con ng. Khi m hnh ha cc m un tn hiu v ngi ta nhn thy rng s kt hp cc m un gin n dn n cc p ng khng tuyn tnh hay cc c tnh tng ha ca h thng. Cc kt qu khng th nhn thy ny da trn tnh khng tuyn tnh ca con ng ha hn cho vic nhn dng v sp xp theo mc u tin cc im can thip trong mng li truyn tn hiu.

  • 24

    Kin trc ca cc con ng truyn tn hiu th hin s bo tn ng k trong qu trnh tin ha, kin thc ang c s dng xc nh v hiu v cc con ng truyn tn hiu trong t bo ng vt c v da trn tnh tng ng ca nhng con ng c xc nh r rng cc ng vt bc thp, v nm gia cc con ng lp li do tin ha ngi. Mc d cc tng ng ca con ng c th cung cp gi v s bo tn ca cc im then cht cho s can thip ha hc trong truyn tn hiu, tuy nhin, s phn ha cc chc nng ca con ng v cc tng tc iu ha l ph bin, do cui cng th khng th thay th cc nghin cu trong nhng h thng phc tp ngi.

    Cc n lc v m hnh d on hin ti d thnh cng n u, chng vn thch thc vic thm nh bng thc nghim (theo l thuyt, ch kh thi vi d liu ca ngi) v cc chu trnh ci tin tha hng n lc m hnh ha (Hnh 2.2). T quan im pht trin thuc, bt k thnh cng no cho n nay cng c th xem l giai thoi v cho n khi mt m hnh no chng t c kh nng d on thnh cng ngi, vic da vo m hnh a ra quyt nh pht trin c th l mo him. Tuy nhin, cc d on da vo m hnh chc chn s l mt trong nhiu tham s a ra quyt nh trong qu trnh pht trin thuc ca cng nghip dc.

    Omics Y vn

    M hnh in silico

    Phn tch BioMAP

    Thm nhNghin cu ex vivo M hnh ng vt

    Nghin cu lm sng

    D liu mc hp phn

    L thuyt / M hnh

    D liu p ng mc h thng

    Xc nh kin trc mng li chc nng

    Biu hin gen v protein

    Tng tc thc th

    Sai

    ng M hnh d on c

    Hnh 2.2. S pht trin ca m hnh in silico

    Hnh 2.2 minh ha chu trnh pht trin ca m hnh in silico tch hp s dng d liu p ng mc hp phn v h thng. Cc m hnh tch hp ca bnh c th c pht sinh t d liu l thuyt cng nh s biu hin protein v b d liu tng tc, c tim nng nhn thng tin bng cc tin on v t chc mng li chc nng v p ng t bo da trn cc th nghim phc tp trn t bo ngi (xem v d Hnh 2.3). Cc m hnh c th nghim lp i lp li v ci tin bng cch so snh cc d on vi cc p ng mc h thng (t bo, m hoc c th) o c bng thc nghim thng qua cc th nghim truyn thng hay t cc d liu c c t hn hp cc t bo ngi phc tp c hot ha trong nhng iu kin mi trng khc nhau. D liu omics mc hp phn c th cung cp khung, gii hn s m hnh kh d mc phn t.

    2.4. S dng cc h thng t bo phc tp th nghim v to m hnh sinh hc M hnh ha cc qu trnh sinh hc cho n gi vn cha lin kt tt vi sinh hc bnh h

    thng c nh hng ng k trn pht trin thuc. M hnh t trn xung mc t bo - c quan v c th c nhiu tim nng, nhng li ph thuc nhiu vo d liu p ng t bo theo

  • 25

    hon cnh. Hn na, lp khong trng gia omics v m hnh ha, cn phi c d liu sinh hc t bo dng tch hp s phc tp v cc c tnh tng ha ca h thng iu ha t bo v tt nht l c th lp li v thch hp lu tr thnh c s d liu, c th chia s v phn tch nh lng.

    Ti mt mc , cc p ng m ca ngi t chng c th c o ex vivo, mt cch tip cn c chng minh l hu dng trong vic xc nhn cc hp cht v cc mc tiu nht nh, mc d c gii hn v tnh c sn ca m ngi v v lp li. Tuy nhin, cc tip cn c lp li cao hay t ng ha i vi sinh hc t bo c gp phn vo cc phn tch chc nng gen v hp cht quy m ln m cng nghip dc mong mun v cn thit nh mt nn tng cho cc n lc m hnh ha. Tht vy, nhng h thng sng lc hiu nng cao da trn t bo, thng da trn cc th nghim v dng t bo pht tn hiu, c nhiu cng ty s dng mt cch c hiu qu xc nh cc hp phn ca nhng qu trnh sinh hc, sng lc cc hp cht c hot tnh v lp d liu thuc da trn tc ng ca chng ln qu trnh hay cc biu hin p ng kch thch n gin. Tuy nhin, nhng th nghim ny ni chung c thit k c lp cc qu trnh n l v gii hn tnh phc tp sinh hc v v th khng tn dng c cc thun li cng nh cung cp ci nhn thu sut vo cc c tnh tng ha ca h thng t bo. Kiu sinh hc thuc h thng ny tp trung vo cc qu trnh c n gin ha v th khc bit vi kiu sinh hc h thng tp trung vo cc c tnh tng ha v phc tp.

    Cng lc , mt vi nhm ang bt u nh gi cao tm quan trng ca cc c tnh tng ha trong pht trin thuc. V d nh cc nh nghin cu CombinatoRx (Boston, MA, USA) tm kim cc liu php kt hp mi bng cch li dng u th t hai tc nhn kch thch (phorbol myristate acetate - cht hot ha ca chui p ng protein kinase C, v ionomycin - cht hot ha truyn tn hiu ph thuc Ca2+). Cc kch thch ny khi ng cc qu trnh phc tp trong nhng t bo s cp tm kim cc cp hp cht c hot ng i khng khi kt hp (v d nh yu t hoi t khi u (TNF)-cht tit t t bo T hot ng), nhng khng i khng khi s dng ring l. ni khc, Rosetta Inpharmatics (Seattle, WA, USA) o c hng nghn gen u biu hin nm men, dng cc d liu p ng gen c c t cc ri lon do di truyn hay ha cht xc nh bng cch no cc gen tc ng ln s tng trng li khp vi cc con ng ha sinh v tm ra c ch hot ng ca cc hp cht. Nhng cch tip cn da vo thc nghim ny bt u c sc mnh ca sinh hc h thng, nhng cc h thng c nghin cu vn cn n gin mt cch c tnh, ch tp trung vo mt s u vo hoc u ra (CombinatoRx) hay mt trng thi sinh l n gin trn mt sinh vt m hnh (Rosetta). S phc tp l mt sn phm th cp, khng phi l thit k ca nhng cch tip cn ny.

    Cc c tnh phc tp v tng ha trong sinh hc bt ngun t mt vi thuc tnh: th nht, cc u vo phc tp kch hot nhiu qu trnh; th hai, nhiu u ra hp nht cc p ng mng li i vi cc u vo; th ba, s tng tc gia cc loi t bo; th t, nhiu bi cnh v mi trng cho mi loi t bo hay s kt hp cc loi t bo. Cng nghip pht hin thuc u t hng t USD vo cng ngh nh gi cc u ra, nhng kt hp cc s phc tp c lin quan n bnh vo trong khm ph thuc, cc n lc c ch cn phi c thc hin nghin cu cc t bo trong s phi hp gi lp tng tc t bo - t bo c tnh quyt nh n cc mng li iu ha in vivo v th nghim cc t bo trong nhng hon cnh mi trng phc hp khc nhau (trong cc kt hp khc nhau ca cc qu trnh c hot ha). Phn tch hon cnh song song hay a h thng quan trng bi v protein v cc qu trnh c tin ha kt hp cc u vo v u ra t nhiu hon cnh, v th hiu c tc ng ca thuc (hay ch), d liu phi c bt ngun t cc p ng t bo trong nhiu mi trng.

  • 26

    Thuc v/hay Gen

    Cc kt hp t bo s cp ngi Cc hon cnh bnh phc Hot tnh trn nhiu con ng

    c tnh tng ha Nhiu u vo

    Cc kt hp t bo v kch thch

    Nhiu u ra

    Cc h thng a hon cnh + t bo H 1 H 2 H 3 H 4

    Cc trng thi thuc hay di truyn Tng quan cp v nh gi a chiu

    Thuc

    Cc statin

    Glucocorticoid

    PI3K pathway Thuc tc ng trn

    pathway thng gp

    Cht c ch p38 MAPK

    Thuc tc ng trn ch thng gp

    Cht c ch Hsp90

    Pathway th th t bo T

    Tng quan cp v nh gi a chiu Gen

    Chia nhm theo chc nng gen

    NF-B

    IFN-

    PI3K

    Kin trc mng li v kt ni ng dng: Xc nh v thm nh ch T chc con ng/mng li

    Quan h cu trc tc dng ng dng: Thm nh ch v hp cht Ti u ha u thuc Thng tin con ng

    Chia nhm theo chc nng thuc

    Th th Cytokin

    Chemokin Enzym

    Cht nn

    Hnh 2.3. B d liu hot ng a sinh hc (BioMAP) trong pht minh thuc

    BioSeek (Burlingame, CA, USA) pht trin cc th nghim da trn t bo ngi nhm tch hp tnh phc tp nhiu mc , dng s thm d song song ca cc h thng t bo c chun ha (cc t bo cng vi mi trng) c thit k gi lp tnh phc tp sinh l bng cch bao gm mt hay nhiu kiu t bo s cp cng nh s kt hp cc t bo v cc con ng ang hot ng (Hnh 2.3a). Cc h thng t bo c thit k bao hm cc p ng lin quan n bnh cho vic phn tch chc nng sinh hc, m hnh ha v pht hin thuc. V d, mt nhm gm bn h thng t bo (cc kt hp ca cc t bo ni mc v cc t bo mu n nhn trong bn mi trng vim phc hp khc nhau) chng t n bao hm h sinh hc phc tp phn nh nhiu hp phn ring bit ca cc ch dc l lin quan n chng vim. Cc d liu c to thnh t khong 24-40 thng s protein (bao gm cc cytokin, chemokin, th th kt nh v cc cht trung gian gy vim khc) nh cc gi p ng ca cc h thng phc hp ny c th phn bit v phn loi hu ht cc con ng v c ch b tc ng bi cc cht iu bin bit ca chng vim, cng nh mt dy ng ngc nhin ca cc th nghim thuc v cc con ng khc (Hnh 2.3b). Quan trng hn, cc b d liu to ra t nhng hn hp phc tp t bo hot ha ny c tnh lp li, cho php lu tr trong c s d liu v tm kim v phn tch t ng bi tnh tng t ca b d liu hay cc c tnh khc (v d nh cc tc ng ln nhng thng s chnh lin quan n bnh).

    Hnh 2.3 minh ha cch thc hot ng ca B d liu hot ng a sinh hc (BioMAP) p dng vo chc nng gen, cu trc mng v cc mi quan h hot ng ca thuc. (a) Cc t

  • 27

    bo s cp (v d nh t bo ni mc v/hoc t bo bch cu) c kt hp v cho tip xc vi cc kch thch (v d nh cc cytokin, cc yu t tng trng hay cc cht trung gian ha hc) trong cc kt hp c lin quan n sinh hc bnh ang c quan tm (v d nh hin tng vim). Cc gi tr c c dng o c cc p ng ca h thng c th l cc protein, cc trng thi hot ha ca protein, gen hay cc hp phn a bo khc, hay cc c tnh chn lc lin quan n bnh (v d nh cc cytokin, cc yu t tng trng, cc th th kt dnh, l cc cht trung gian cui cng ca giao tip t bo v chc nng trong trng hp bnh) v s p ng vi mi trng v cc u vo dc l (ni dung thng tin). Cc ri lon trong cc h thng song song xc nh nhng d liu hot ng sinh hc ca thuc hay gen ang nghin cu. Vic kt hp nhiu kiu t bo v nhiu con ng hot ha to ra s iu ha mng li phc v cc c tnh tng ha lm tng nhy cm v kh nng ca h thng phn bit cc tc ng ln gen v thuc n nht. (b) Mt vi h thng t bo ngi phc hp (cc t bo hay cc kt hp t bo trong mi trng c lin quan n bnh) c xem xt cng vi cc gen (nh biu hin vt mc hay siRNA) hay thuc ang c quan tm v tc ng ln nng cc protein ch th la chn c xc nh, to ra mt b d liu c s dng nh l du n a h thng ca chc nng ca tc nhn th nghim. Cc o c thng k s ging nh ca d liu (ngha l cc tc nhn no cm ng cng mt p ng a h thng) c th c s dng nhm cc gen hoc thuc theo chc nng, v to ra mt miu t dng biu v mi lin h cc chc nng ca chng vi nhau). V d, tp hp cc b d liu cm ng bi biu hin qu mc gen (bn tri di) biu l cc mi quan h con ng chnh (v d Ras/MAPK, phosphatidyl inositol 3-kinase (PI3K), interferon- (IFN-y), v cc nhm lin kt NF-B) cng nh cc tng tc con ng-con ng trong mng li tn hiu kim sot p ng t bo ni mc trong s hin din ca cc cytokin vim khc nhau. Tp hp b d liu cm ng thuc t nhng h thng m hnh vim (bao gm cc s kt hp c hot ha ca cc t bo ni mc v cc t bo n nhn mu ngoi vi) pht hin v phn bit ng ca ca hu ht cc yu t bit ca chng vim cng nh mt lot cc mc tiu thuc v con ng khc, bao gm cc glucocorticoid, cht khng cytokin, v cht c ch ca HMG-CoA reductase, calcineurin, inosin monophosphat dehydrogenase, phophodiesterase, th th hormon nhn, phosphatidyl inositol 3 kinases, protein sc nhit 90, casein kinase 2, kinase 2 mt hot ha, v p38 MAPK (c minh ha pha trn bn phi). Thuc c hiu cho cc ch thng gp hoc cho cc ch trong con ng thng gp c nhm vi nhau, nhng cc hp cht c cc hot tnh ngoi ch khc nhau th c pht hin d dng (v d, cc b d liu ca 3 cht c ch JAK vi hot tnh th cp c bit; nh du hoa th). Tp hp cc d liu hot tnh t mt lot u thuc ha hc c th xc lp mi quan h cu trc - tc dng c hiu cho hp cht dng ti u ha u thuc (bn phi pha di; cc ng ng khc nhau c mu khc; kch thc vng trn phn nh nng ). Trong v d ny, tp hp BioMAP xc lp 2 loi hot tnh chc nng t cc cht c ch p38 MAPK c lin quan v cu trc.

    Cch tip cn ny, c tn l lp d liu hot ng a sinh hc (BioMAP), a vo s dng thnh cng trong cc nghin cu m hnh cho thy kh nng ng dng ca n trong mt s giai on ca qu trnh khm ph thuc (Bng 2.1). i vi xc nh v thm nh mc tiu, cc cch tip cn tin hc da trn tnh tng ng ca cc b d liu a h thng c lu tr trong c s d liu cho thy kh nng lin h nhanh chng gia gen hay hot ng ca thuc vi cc con ng bit hay mi, v d on cc con ng chc nng hay cc tng tc mng li (Hnh 2.3b). Cc b d liu a h thng c cm ng bi biu hin vt mc gen trong t bo ni mc trong bn mi trng cytokin khc nhau (v bn cht, cc du n a h thng ca chc nng gen) t ng kt cm thnh cc nhm phn nh cc mi quan h con ng bit vi tin cy ng ngc nhin. Hn th na, th biu din ca cc mi quan h tng t v chc nng (Hnh 2.3b) ch ra cc vai tr ring bit ca hai sn phm gen, MyD88 v IRAK, trong cc tng tc trung gian gia cc con ng yu t nhn B (NF-B) v protein kinase hot ha bi Ras/mitogen (MAPK). MyD88, trc y c bit l truyn tn hiu thng qua NF-B, c xc nh sau trong cc nghin cu v sinh ha l cng c vai tr kch hot con ng MAPK, lm c ch s hot ha ca NF-B trong vng phn hi m hot ha bi IL-1 m

  • 28

    khng phi bi TNF-. Cc b d liu p ng a h thng v kt cm, trong cc h thng c thit k bt cc c tnh tng ha, v th c th gip xc nh cu trc chc nng ca cc mng li truyn tn hiu, thng tin quan trng (trong s kt hp vi b d liu thng thng) cho vic thit k v th nghim cc m hnh in ton.

    i vi vic m t c tnh hp cht, cc b d liu gii hn, vic t ng ha v khi qut chc nng c th lm cho cc b d liu xut pht t cc hn hp t bo hot ha, phc tp tr thnh mt cch hiu qu sng lc cc th vin trng im cho cc tc ng ln sinh hc lin quan n h sinh hc lin quan n bnh phc tp, v quan trng hn na xp th t u tin kt qu t trong sng lc hiu nng cao truyn thng. Trong cc nghin cu m hnh, chng ti dng b d liu trong bn h thng phn loi cc kt qu t v u thuc theo hot tnh sinh hc ca chng, xc nh cc hp cht vi hot tnh trt ch (c th l ng mong mun hoc khng ng mong mun), phn bit dy u thuc p ng tt cho cc p ng sinh hc nht qun v theo di cc mi lin h chc nng cu trc nh mt hng dn ti u ha u thuc.

    Mt u th khc ca cch tip cn a h thng l cc h thng song song c th c thit k bt mt dy rng cc hot ng suy din ca con ng ha sinh v sinh hc (lin quan n bnh); v th, hiu qu ca thuc hay gen c th c nh gi ng thi i vi cc p ng sinh hc phc tp lin quan n nhiu bnh khc nhau v c th c dng sng lc cc ch th liu php iu tr mi. iu ny tri ngc vi hu ht cc n lc m hnh ha v thm ch cc th nghim ng vt hoc lm sng, vn thng c thit k cho mt mc tiu bnh duy nht. V d nh cc m hnh h thng t bo phc tp ca chng vim (Hnh 2.3) pht hin d dng cc hot ng ca nhng cht c ch 3-hydroxy-3-methyl-glutaryl-CoA (HMG-CoA) reductase (v d cc statin) trong truyn tn hiu vim. iu ny t ra cu hi rt ng quan tm l liu vic s bao hm cc phn tch h thng sinh hc phc tp trong s pht trin cc statin c tng tc s pht hin vai tr tim nng ca chng trong cc ri loi vim v t min hay khng?

    Omics c th v chc chn nn c p dng vo cc h thng t bo c thit k kt hp tnh phc tp sinh hc. Tuy nhin, nhiu nghin cu cho thy cc du n v chc nng c tnh thng tin cao i vi gen v cc tc ng ca thuc c th c to ra t s lng rt nh (mi) cc thng s quan trng sinh hc, khi chng c th nghim trong mt vi s kt hp t bo v mi trng phc tp khc nhau. iu ny cho thy tnh phc tp sinh hc c th n cha cc thng tin hu ch v chc nng protein v thuc, v n c th lm n by cho vic lp d liu chc nng quy m cng nghip mt cch thng minh hn, nhanh hn v r hn.

    T gc nhn kh st thc t, cc cch tip cn ny to ra c hi tch hp sinh hc h thng hiu qu v tit kim hn trong qu trnh khm ph thuc. T gc nn tng, cc c s d liu ca cc p ng sinh hc nh lng t bo ngi i vi cc bin i gen v thuc, di cc iu kin c chun ha v c th lp li c thit k bao hm tnh phc tp lin quan n bnh v nm bt cc c tnh tng ha, c th hu ch trong vic d on cu trc chc nng ca mng li iu ha phc v s cung cp mt cu ni cn thit cho vic tch hp d liu omics vo m hnh in silico ca hnh vi h thng t bo, cng nh mt bc kim tra cho nhng m hnh ny khi chng pht trin (Hnh 2.2).

    2.5. Tng lai Trong qu trnh pht trin thuc, cc quyt nh hng triu USD phi c thc hin

    thng xuyn s dng cc tiu ch khng hon chnh da trn kin thc sinh hc khng y : v d, mc tiu c u tin bi v chng c iu ha tng mc gen trong trng thi bnh (d iu ny khng ng vi nhiu ch bit r); cc hp cht c la chn do c hiu ha sinh (d thc t nhiu thuc c tc dng tt li khng c hiu); cc m hnh ng vt c xem nh yu t cn thit (d chng c bit d on thnh cng trn lm sng km). Hiu bit tt hn v sinh hc, nht l kin thc c lin quan n bnh ngi v c kh nng kt hp vo tin trnh khm ph thuc, rt cn a ra quyt nh. Mc d cc tip cn sinh hc h thng c

  • 29

    phc tho y vn cn s si, chng ng gp vo cc quyt nh pht trin thuc c ngha bng cch tng tc sinh hc nh hng gi thit, bng vic m hnh ha cc vn sinh l c th trong thm nh ch hoc trong sinh l lm sng v bng cch cung cp cc m t c tnh nhanh v din gii cc p ng lin quan n bnh mc t bo v h thng t bo.

    Cc tip cn ny hin nay c theo ui cc phng th nghim v cng ty ring l, r rng l chng b sung ln nhau v cui cng th chng phi c tch hp vi nhau sinh hc h thng pht huy c tim nng ca n. Cc nghin cu chc nng sinh hc v sinh hc t bo vn a chiu v a bin l nhng thch thc i vi tin sinh hc, vic tiu chun ha ca thit k th nghim v d liu l thit yu trc khi to c t ph trong sinh hc h thng. t c iu ny, cn c cc ngn ng nh du cho d liu biu hin gen, pht trin c s l lun mi chia s v tch hp cc loi d liu khc nhau ca omic v sinh hc thng thng, pht trin cc th nghim sinh hc h thng hiu nng cao c tiu chun ha v cc tip cn cng ngh thng tin lin quan.

    Ti liu tham kho: 1. Debouck, C. and B. Metcalf, The impact of genomics on drug discovery. Annu Rev

    Pharmacol Toxicol, 2000. 40: p. 193-207. 2. Ideker, T., T. Galitski, and L. Hood, A new approach to decoding life: systems biology. Annu

    Rev Genomics Hum Genet, 2001. 2: p. 343-72. 3. Ward, S.J., Impact of genomics in drug discovery. Biotechniques, 2001. 31(3): p. 626, 628,

    630, passim. 4. Cho, C.R., et al., The application of systems biology to drug discovery. Curr Opin Chem

    Biol, 2006. 10(4): p. 294-302. 5. Zhu, J., B. Zhang, and E.E. Schadt, A systems biology approach to drug discovery. Adv

    Genet, 2008. 60: p. 603-35.

  • 30

    BBii 33.. TTiinn ssiinnhh hhcc Mc tiu: - Hiu c cc khi nim c bn veef tin sinh hc - Trnh by mt s lnh vc nghin cu chnh ca tin sinh hc - Bit v s dng c mt s cng c ca tin sinh hc trong nghin cu. 3.1. Lch s

    T u nhng nm 1980, khi nim s dng my tnh thc hin cc tnh ton phc v nghin cu cc phn t sinh hc bt u, nhng khi nim tin sinh hc vn cha hnh thnh. Lc by gi cc nhm nghin cu v cu trc protein hay tin ha phn t m ch yu l nhng ngi tham gia v cc nhm nh trnh t ADN, c gng ng dng my tnh vo cng vic ca h, mc d cc n lc ny cn rt h , nhng cng cho thy tim nng to ln ca my tnh trong vic phn tch trnh t v dng m hnh phn t. Nhm cc nh sinh hc ny cng vi cc nh ton hc, tin hc, tinh th hc v vt l hc to ra cng ng tin sinh hc u tin.

    Nm 1985, Tp ch khoa hc u tin v lnh vc bt u xut bn (Cc ng dng ca My tnh trong cc Khoa hc Sinh hc Computer Applications in the Biosciences). Cc bi bo ch yu l v tin sinh hc, do vi nm sau tp ch i tin thnh Tin sinh hc. Lc ny Th vin d liu trnh t EMBL Heidelberg hot ng c 4 nm v mt th vin khc ca M, Ngn hng Gen (GeneBank), cng bt u. Nhng c s d liu trnh t u tin c n hnh di dng sch hoc bng t, v cho thy hon ton v dng v khng kh thi v thng tin v trnh t c tch ly qu nhanh.

    Trong thp nin 90, Tin sinh hc chuyn mnh mnh m, vt ngoi d on nh mt lot cc tin b. Trc ht l do s ra i v cng nhn ca internet nh l mt mng my tnh ton cu. Lc ny vic phn tch, dch v, c s d liu, c th thc hin d dng qua cc trang web. Th hai, cc tin b v k thut nh trnh t lm cho vic nh trnh t c mt loi tr nn kh thi, thng tin v b gen hon chnh qu phc tp v ch c th c tnh ton v lp ghp bi my tnh, do vy cch duy nht truy cp thng tin ny l dng my tnh. V thi i ca tin sinh hc bt u.

    Thng tin trnh t tng ln gp i sau mi 18 thng, do cc h thng my tnh cng nh thut ton phn tch cng phi pht trin tng ng. Gi phn mm Staden c pht trin bi Roger Staden, LMB, Cambridge (UK) c s dng lp ghp v phn tch trnh t ti phng th nghim ca Fred Sanger.

    Vic tm kim cc trnh t cng tr nn kh khn hn khi s lng thng tin tng ln. Ban u cc d liu trnh t c phn phi di dng cc tp n gin, khng c cu trc (flat file), cng vi cc thng tin ch thch nh loi, t kha. Do vy cch thc tm kim trnh t cn quan tm l dng cc trnh so snh chui hoc tm bng mt da trn bn in ra. Cc chng trnh tm kim da trn c s d liu flat file nh ACNUC, c pht trin vo gia nhng nm 80, v gn y hn l SRS.

    Mt vn khc do khi lng thng tin ln l thi gian tm kim. Cc thut ton c a ra t nhng nm 70 bi Smith v Waterman, chy trn cc main frame (my tnh ln), chy rt chm m khng phi ai cng c th s dng c v khng c cc main frame t tin. Nm 1985, thut ton mi c pht trin trong chng trnh FASTA, do David Lipman v Bill Pearson (US) pht trin da trn phng php ca Wilbur v Lipman vi thut ton do Dumas v Nino cng b. FASTA to ra mt cuc cch mng trong vic tm kim trnh t, v n r v nhanh, li c th chy trn cc my tnh c nhn r tin. Do cc nh khoa hc c th s dng d dng tm kim chc nng ca mt trnh t mi da trn cc protein c bit trc.

  • 31

    Nhng n 1990, FASTA cng khng nhanh, mc d cng ngh my tnh pht trin c cc trm lm vic ngy cng mnh hn. Mt chng trnh mi, BLAST (Basic Local Alignment Search Tool), ra i. N c vit bi cc nh sinh hc, ton hc v tin hc Trung tm Quc gia Thng tin Cng ngh Sinh hc (National Center for Biotechnology Information, NCBI - Hoa K). N chy nhanh hn FASTA nhiu kha cnh, ng thi cho php xp hng tm quan trng ca cc trnh t tm c.

    Cc chng trnh cng c pht trin d on v xy dng cu trc protein da trn thng tin v trnh t v c s d liu cc cu trc bit.

    Ngy nay khi m nhiu sinh vt c gii m di truyn hon chnh v to nn cc c s d liu lin thng gia nhiu trung tm trn th gii, vic tm kim v phn tch thng tin ca mt trnh t mi tr nn d dng hn bao gi ht. Vi mt trnh t no , ngi ta c th nhanh chng xc nh c chc nng, thm ch cu trc phn t da trn cc thng tin hin c trong ngn hng d liu. Nh m s pht trin ca khoa hc sinh hc c tng tc ln rt nhiu ln so vi thi k u.

    Hin nay v trong tng lai gn tin sinh hc s pht trin mnh c th thc hin khng ch tm kim phn tch thng tin sinh hc m cn c th cho php tin hnh cc th nghim in silico vi tin cy cao, tit kim nhiu thi gian v tin bc cho cc th nghim in vitro v in vivo, gp phn y mnh tc pht trin khng ch sinh hc m cn cc khoa hc ng dng ca n nh y hc, dc phm.

    3.2. Cc nh ngha Tin sinh hc hay sinh hc in ton bao hm vic s dng cc k thut ca ton hc ng

    dng, tin hc, thng k hc v khoa hc my tnh gii quyt cc vn sinh hc. Nghin cu v tin sinh hc thng chong lp vi cc nghin cu v sinh hc h thng. Cc cng vic nghin cu chnh gm c ging trnh t (sequence alignment), tm kim gen, lp rp thng tin b gen, ging cu trc protein, d on cu trc protein, d on biu hin gen v tng tc protein-protein, v dng m hnh tin ha. Thut ng tin sinh hc v sinh hc in ton thng c s dng nh ng ngha, tuy nhin, t sau nhn mnh v vic pht trin thut ton v cc phng php in ton, trong khi tin sinh hc bao hm c sinh hc, ton hc v khoa in ton. Mt s thut ng hp hn ch cc lnh vc nh trong sinh hc in ton nh b gen hc in ton (computational genomics), ha sinh hc in ton (computational biochemistry) v l sinh hc in ton (computational biophysics).

    Tin sinh hc (bioinformatics): Nghin cu, pht trin, hay ng dng cch tip cn v cng c in ton khai thc thng tin, d liu sinh hc, y hc, hnh vi hay sc khe bao gm thu nhn, tch ly, t chc, lu tr, phn tch, hay biu din cc thng tin ny.

    Sinh hc in ton (computational biology): Pht trin v ng dng cc phng php l thuyt v phn tch thng tin, dng m hnh ton hc v k thut m phng in ton nghin cu cc h thng sinh hc, hnh vi v x hi.

    3.3. Cc lnh vc nghin cu chnh 3.3.1. Phn tch trnh t

    Vic xc nh cc motif bo tn trong cc trnh t c th cung cp cc thng tin v cu trc v chc nng ca protein, v xc lp cc cn c phn loi. Thng tin t c s d liu s cp c hp l ha v gn thnh cc h. Cc c tnh chnh ca h c lc ra thnh cc bn m t trnh t c cha trong c s d liu th cp, bn m t ny c dng d on cc trnh t trong tng lai. Vic xc lp c s d liu th cp rt quan trng v c s d liu s cp tng ln rt nhanh v tr nn rt kh phn bit cc quan h xa vi cc nhiu nn.

  • 32

    T khi Phage -X174 c gii trnh t vo nm 1977, cc trnh t DNA ca nhiu loi sinh vt c gii m v lu trong c s d liu in t. D liu ny c phn tch xc nh nhng gen no m ha cho protein, cng nh nhng trnh t thng thng. S so snh cc gen trong cng mt loi hay gia cc loi khc nhau c th cho thy s tng ng gia cc chc nng ca protein, hay mi quan h gia cc loi (s dng phng php phn loi sinh hc xy dng cy pht sinh loi). Vi s gia tng lng d liu, ngi ta mt thi gian kh lu phn tch trnh t DNA bng cch th cng. Ngy nay, cc chng trnh vi tnh c dng tm kim hng ngn gen ca cc sinh vt, cha hng t nucleotid. Nhng chng trnh ny c th a vo cc t bin, (thay i, mt hoc thm base) trong trnh t DNA, nhm xc nh cc trnh t c lin quan, nhng khng ging. Mt bin th ca vic ging cc trnh t c dng trong qu trnh gii trnh t ca n. V d trong k thut gii trnh t shotgun (c s dng bi Vin nghin cu b gen (Institute for Genomic Research) gii trnh t gen vi khun u tin, Haemophilus influenza) kt qu thu c khng phi l cc danh sch lin tip ca trnh t nucleotid, m l trnh t ca hng ngn mnh DNA nh (mi mnh c chiu di 600 - 800 nucleotid). Cc u tn ca nhng mnh ny chng ln nhau v khi ging li ng cch th to thnh trnh t hon chnh. Gii trnh t theo kiu shotgun cho d liu trnh t nhanh chng, nhng cng vic lp ghp cc mnh c th rt phc tp i vi nhng b gen ln hn. Trong d n Bn gen ngi, mt khong vi thng x l my tnh (dng my tnh loi DEC Alpha vo nm 2000) lp ghp cc mnh. Gii trnh t theo kiu shotgun l phng php c la chn gii m cc b gen hin nay, v nhng thut ton lp rp b gen l mt lnh vc quan trng ca nghin cu tin sinh hc.

    Mt lnh vc khc ca tin sinh hc trong phn tch trnh t l t ng tm kim cc gen v cc trnh t iu ha trong b gen. Khng phi tt c cc nucleotid trong b gen l gen. Trong b gen ca cc sinh vt bc cao, phn ln cc thnh phn ca DNA khng mang ngha no c. Cc trnh t ny c gi l DNA tp, tuy nhin c th cha cc yu t c chc nng cha c bit. Tin sinh hc c th b tc cc thiu st gia nhng nghin cu v gen v protein, v d nh dng trnh t DNA xc nh protein. 3.3.1.1. Ch gii b gen: tm kim gen

    Trong phm vi ca khoa b gen hc, ch gii gen l qu trnh xc nh cc gen v cc c tnh sinh hc khc trong trnh t DNA. H thng phn mm ch gii b gen u tin c thit k bi Owen White vo nm 1995, l thnh vin ca nhm gii trnh t v phn tch b gen ca sinh vt hon chnh u tin c gii m, vi khun Haemophilus influenzae. Tin s White to mt phn mm tm gen (phn trnh t DNA m ha cho mt protein), RNA vn chuyn, v cc c tnh khc, v gn chc nng s b cho nhng gen ny. Hu ht cc h thng ch gii b gen hin ti lm vic tng t nhau, nhng nhng chng trnh c th phn tch DNA ang lun thay i v ci tin. 3.3.1.2. Sinh hc tin ha trn my tnh

    Sinh hc tin ha l ngnh nghin cu ngun gc v th h ca loi, cng nh s bin i ca loi theo thi gian. Ngnh tin hc gip cho cc nh sinh hc nghin cu v tin ha, n c kh nng:

    - theo du s tin ha ca mt s ln sinh vt bng cch xc nh s thay i trong DNA, hn l ch dng phn loi theo hnh thi hay quan st sinh l hc.

    - gn y hn, so snh cc b gen, cho php nghin cu nhiu bin c tin ha phc tp hn, chng hn nh s lp gen, s chuyn gen ngang, v tin on nhn t hnh thnh loi vi khun.

    - xy dng cc m hnh dn s phc tp trn my tnh tin on kt xut ca h theo thi gian

    - tm v chia s thng tin v mt lng ln loi v sinh vt Trong tng lai l xy dng li cy tin ha phc tp hn by gi.

  • 33

    Cc nghin cu trong khoa hc my tnh c s dng thut ton di truyn i khi b nhm ln vi sinh hc tin ha trn my tnh. Thut ton di truyn bao hm vic s dng phn mm my tnh c bit pht trin cc cng thc, thut ton, hay cc tit k mc tch hp ly tng t cc nguyn l tin ha nh l nhn bn, s a dng ha do s ti t hp hay t bin, ph hp, s sng st do s chn lc, v tc ng qua li, ni chung gi l c my Darwin. 3.3.1.3. Nghin cu tnh a dng sinh hc

    a dng sinh hc ca h sinh thi c th c nh ngha nh l tng cc thch nghi v mt b gen t tt c cc loi hin din i vi mt mi trng c th bt k mi trng l mt mng sinh thi hay m khai thc b hoang, mt git nc bin, mt nm t, hay ton b sinh quyn ca hnh tinh Tri t. C s d liu c dng thu thp tn loi, m t, s phn b, thng tin v gen, tnh trng v s lng dn c, mi trng sng cn thit, v cch mi sinh vt tc ng qua li vi loi khc. Cc chng trnh phn mm c bit c dng tm kim, hin th v phn tch thng tin, v quan trng nht l trao i thng tin vi ngi khc. Cc kiu m hnh trn my tnh nh ng hc qun th, hay tnh ton s tch ly gen tt ca tp hp con ging (trong nng nghip) hay qun th sp tit chng (trong bo tn). Mt trin vng ng quan tm trong lnh vc ny l trnh t ton b DNA, hay b gen ca nhng loi nguy c tuyt chng c th c lu gi trong my tnh (in silico) v c th c s dng trong tng lai, thm ch nu loi b mt i. 3.3.1.4. Phn tch biu hin gen

    Biu hin ca nhiu gen c th c xc nh bng cch o lng mRNA vi nhiu k thut nh microarray, EST (expressed cDNA sequence tag), SAGE (serial analysis of gene expression), MPSS (massively parallel signature sequencing), hay nhng ng dng khc ca s lai ti ch a gi. Tt c cc k thut ny c mc nhiu tp rt cao v/hoc gy ra cc sai s cho php o sinh hc, v mt lnh vc nghin cu chnh ca tin sinh hc l pht trin cc cng c thng k tch tn hiu ra khi nhiu tp trong cc nghin cu biu hin gen theo kiu hong lot (high-throughput). Nghin cu kiu hng lot thng c s dng xc nh nhng gen lin quan n cc ri lon: v d c th so snh d liu microarray t t bo biu m ung th vi d liu t t bo bnh thng xc nh protein iu ha dng hay m trong cc t bo ung th. 3.3.1.5. Phn tch iu ha

    S iu ha l s phi hp phc tp ca nhiu s kin bt u vi mt tn hiu bn ngoi bo v cui cng dn n tng hoc gim trong hot ng ca mt hay nhiu phn t protein. K thut tin sinh hc c ng dng khm ph cc cp khc nhau trong qu trnh ny. V d, phn tch promoter gm vic tm ra v nghin cu cc m thc trnh t vng xung quanh vng m ha ca gen. Cc nh hng ca nhng m thc ny th hin thng qua s phin m ca gen thnh mRNA. D liu v biu hin gen c th c dng suy ra qui lut iu ha gen: ngi ta c th so snh d liu microarray t nhiu trng thi khc nhau ca sinh vt hnh thnh gi thuyt v gen c lin quan mi trng thi. sinh vt n bo, ngi ta c th so snh cc giai on ca chu trnh t bo, song song vi nhng iu kin khc nhau (sc nhit, thiu dinh dng, ). Sau ngi ta c th ng dng thut ton t hp i vi d liu biu hin xc nh gen no c ng biu hin. Phn tch su hn c th theo nhiu hng khc nhau: mt nghin cu (2004) phn tch cc trnh t promoter ca cc gen ng biu hin tm cc yu t iu ha chung v dng k thut hc kinh nghim my xc nh cc yu t promoter lin quan n vic iu ha tng cm gen.

  • 34

    3.3.1.6. Phn tch biu hin protein Microarray ca protein v khi ph nhanh (HT MS - high throughput mass spectrometry)

    c th phn tch nhanh v s hin din cc protein trong mu sinh phm. Tin sinh hc c s dng rt nhiu trong vic phn tch d liu microarray ca protein v HT MS. 3.3.1.7. Phn tch s t bin trong ung th

    Nhiu n lc ln ang c tin hnh xc nh trnh t nhng t bin im cc gen ung th khc nhau. Khi lng d liu ln thu c cn h thng t ng c trnh t, v so snh kt qu nhng trnh t vi trnh t bit ca b gen ngi, k c a hnh nguyn thy bit.

    Microarray oligonucleotid, bao gm s lai ha vi b gen so snh v dy a hnh nucleotid n (single nucleotid polymorphyism array), c th d cng mt lc vi trm ngn v tr trn b gen ang nghin cu xc nh s tng hay gim ca nhim sc th trong ung th. Phng php phn tch im thay i v m hnh Hidden Markov ang c pht trin suy ra s bn bin i thc t d liu cha thng nhiu tp. 3.3.1.8. D on cu trc

    D on cu trc protein l mt ng dng quan trng na ca tin sinh hc. Trnh t amino acid ca mt protein, gi l cu trc s cp, c th xc nh d dng t trnh t trn gen m ha n. phn ln trng hp, cu trc s cp ny quyt nh cu trc c nht ca protein trong mi trng t nhin. (d nhin, c ngoi l, v d nh trong bnh b in - prion bnh c cu trc khc cu trc t nhin). Bit c cu trc ny th mi hiu chc nng ca protein. Thng tin v cu trc thng c phn loi theo cu trc bc hai, ba v bn. Gii php chung ng tin cy d on vn cn l vn cha gii quyt. Cho n nay, hu ht cc kt qu c c u da vo kinh nghim.

    Mt trong nhng cch gii quyt chnh trong nghin cu tin sinh hc l khi nim v tnh tng ng. Trong phn ngnh b gen ca tin sinh hc, tnh tng ng c dng d on chc nng ca gen: nu trnh t ca gen A, m chc nng bit, tng ng vi trnh t gen B, chc nng cha bit, ngi ta c th suy ra rng B c th mang chc nng ca A. Trong phn ngnh cu trc ca tin sinh hc, tnh tng ng c dng xc nh phn no ca protein l quan trng trong vic hnh thnh nn cu trc v tng tc qua li vi cc protein khc. Trong k thut gi l dng m hnh tng ng, thng tin ny dng d on cu trc ca protein khi cu trc ca protein tng ng bit. K thut ny hin nay vn l cch duy nht ng tin cy d on cu trc protein.

    V d cho k thut ny l tnh tng ng protein gia hemoglobin ngi v hemoglobin cy h u (leghemoglobin). C hai gi cng chc nng vn chuyn oxy vo sinh vt. Mc d hai protein ny c trnh t amino acid khc nhau, cu trc protein ca chng th gn nh ng nht, phn nh cc chc nng gn ging nhau.

    Nhng k thut khc cho d on cu trc protein gm c dng m hnh da vo protein threading v de novo t thng tin vt l. 3.3.1.9. Khoa b gen hc so snh

    Ct li ca phn tch b gen so snh l vic thit lp s tng ng gia cc gene hay cc c tnh b gen khc cc sinh vt khc nhau. Chnh cc bn so snh gia cc b gen ny cho php chng ta truy tm qu trnh tin ha chu trch nhim i vi s phn ha ca hai b gen. Nhiu s kin tin ha hot ng nhiu mc t chc khc nhau quyt nh s tin ha. mc thp nht, cc t bin im nh hng n tng nucleotid. mc cao hn, cc on nhim sc th ln b lp, b chuyn ngang, nghch o hay chuyn v, b mt hay chn. Cui cng, c b gen tham gia qu trnh lai to, s to th a bi v ni cng sinh, thng thng dn

  • 35

    n s hnh thnh loi mi nhanh chng. Tnh phc tp ca tin ha b gen l nhng th thch ln i vi vic pht trin cc m hnh ton hc v thut ton.

    Nhiu nghin cu trong s ny da trn vic pht hin tnh tng ng v tnh ton cc h protein. Cc nhm PhIG (Phylogenetically Inferred Group - Nhm suy lun v pht sinh loi) gn y pht trin phng php tch hp cc tn hiu sinh loi vo vic xy dng cc cm gen s dng trong b gen hc so snh. 3.3.2. To m hnh cc h thng sinh hc

    Sinh hc h thng bao gm vic s dng cc m phng my tnh cc h thng di t bo (nh l mng li cht trao i v cc enzym to thnh s trao i cht, cc con ng truyn tn hiu v mng li iu ha gen) phn tch ln biu din cc mi quan h phc tp ca cc qu trnh t bo ny. S sng nhn to hay s tin ha o ang n lc hiu r v cc qu trnh tin ha thng qua vic m phng trn my tnh nhng th sng n gin (nhn to). 3.3.3. Phn tch hnh nh hiu nng cao

    K thut my tnh cng c dng tng tc hay t ng ha vic x l, nh lng v phn tch lng ln hnh nh sinh y hc c mang nhiu thng tin. H thng phn tch hnh nh hin i to kh nng o c hnh nh ln v phc tp, do tng s chnh xc, tnh khch quan, v tc . H thng phn tch c pht trin hon chnh c th hon ton thay th ngi quan st. Trong khi nhng h thng ny khng phi ch lin quan n hnh nh sinh hc, nhng ng dng ca chng trong sinh hc vn cung cp cc gii php v nhng thch thc, do nhiu ng dng phn tch nh c coi nh ng dng ca tin sinh hc. Cc h thng ny ang tr nn quan trng hn trong chn on v nghin cu.

    3.4. Cng c Cng c cho sinh hc my tnh ni ting c l l BLAST, mt thut ton tm kim d liu

    trnh t ln (protein, DNA). NCBI cung cp cng c thng thng tm kim d liu trnh t ca h.

    Ngn ng my tnh (Perl, Python) thng dng phn tch d liu sinh hc v phn tch d liu ra t cc chng trnh tin sinh hc.

    Nhng phng tin tm kim tin sinh hc ln (Entrez, Bioinformatic Harvester) gip tm kim thng tin t mt s c s d liu.

    Nhng ngi thit k chng trnh cho m ngun m nh EMBOSS, Bioconductor, BioPerl, BioLinux, BioPython, BioRuby, v BioJava m c th pht trin v sp xp cc i tng (nh program modules) v cc cng c chia s d dng phn tch hn.

    VigyaanCD l mt phn mm min ph mnh cho tin sinh hc v sinh hc my tnh. Cc b phn thng mi nh DNAStar (Lasergene), Informatix, Discovery One, Virtual

    Cloning, cung cp kh nhiu cng c phn tch hu ch v tin dng, tuy nhin gi thnh ca chng l mt vn ln, ch nhng phng th nghim ln mi c th mua v s dng c.

    Mt s a ch website hu ch v tin sinh hc: - NCBI (Trung tm CNSH Quc gia M): http://www.ncbi.nlm.nih.gov/ - GenBank (NCBI) - Ngn hng gen:

    http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Nucleotide - Ngn hng gen Nht: http://www.ddbj.nig.ac.jp/ - BLAST (NCBI) - so snh, tm kim trnh t : http://www.ncbi.nlm.nih.gov/BLAST/ - SubtiList - tm kim gen ca Bacillus subtilis : http://genolist.pasteur.fr/SubtiList/

  • 36

    - Signal Peptide Server - tm kim trnh t xut ca protein: http://www.cbs.dtu.dk/services/SignalP/

    - LipoP Server - tm kim trnh t xut ca protein v lipoprotein: http://www.cbs.dtu.dk/services/LipoP/

    - CLUSTALW (so snh trnh t ADN v protein): http://align.genome.jp/ - CLUSTALW (so snh trnh t protein):

    http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl - Bng s dng m: http://www.kazusa.or.jp/codon/ - C s d liu trnh t iu ha: http://wwwmgs.bionet.nsc.ru/mgs/systems/geneexpress/

    Ti liu tham kho: 1. Bansal, A.K., Bioinformatics in microbial biotechnology--a mini review. Microb Cell Fact,

    2005. 4: p. 19. 2. Teufel, A., et al., Current bioinformatics tools in genomic biomedical research. Int J Mol

    Med, 2006. 17(6): p. 967-73. 3. Glossary of bioinformatics terms. Curr Protoc Bioinformatics, 2011. Appendix 2: p. A 2 1-

    13. 4. Aliferis, C.F., et al., Trends and developments in bioinformatics in 2010: prospects and

    perspectives. Yearb Med Inform, 2011. 6(1): p. 146-55.

  • 37

    BBii 44.. KK tthhuutt xxcc nnhh kkiiuu ggeenn Mc tiu: - Trnh by c cc tiu ch ca mt phng php nh typ tt. - Trnh by v vn dng c mt s phng php nh typ da trn acid nucleic. 4.1. i cng

    S bng pht ca cc bnh truyn nhim thng xut pht t vic tip xc vi mt ngun ly chung ca tc nhn gy bnh. Ni chung, tc nhn gy dch li xut pht t mt c th m con chu ca chng c s tng ng hoc c quan h gn v mt di truyn. Theo thut ng dch t hc, cc vi sinh vt lin quan n cn dch c quan h dng, hay ni cch khc chng c cng ngun gc. Cc vi sinh vt c quan h dng l thnh vin ca cng mt loi c chung cc thuc tnh sinh ha, yu t c lc v c tnh di truyn. Tuy nhin, c s a dng mc loi cc vi sinh vt phn lp c t cc ngun khc nhau, thi gian khc nhau v v tr a l khc nhau c th c phn bit hay phn loi thnh cc typ hay chng. 4.1.1. ngha v lch s ca vic nh typ vi sinh vt

    Vic nh typ c ngha quan trng trong dch t hc nhn bit cn dch, pht hin s ly truyn cho ca tc nhn trong bnh vin, nhn din cc chng c c lc c bit v theo di cc chng trnh tim chng.

    T thi ca Pasteur, cc tip cn dch t hc lin quan n vic nh typ v phn bit cc vi khun u da ch yu vo cc phng php kiu hnh hay hiu sinh hc. Cc phng php ny c gng xc nh v sp xp vi khun theo mt trt t kiu Linne. Tuy nhin, quan im loi c in dng nh khng thch hp phn loi vi khun. Gn y, cc nh ngha loi bng hnh thi hc c thay th hon ton bi vic so snh trnh t ca 16S rADN. Chng thng c hiu trong ng cnh ca s a dng v nucleotid khng c hiu c lin quan n mt s kiu hnh (v d tnh trng v kh nng gy bnh). Du sao, cc phng php kiu hnh vn cn rt quan trng i vi cc phng th nghim vi sinh hc. Mt s phng php ny hin nay c bao gm c du n v chuyn ha, phn tch v thnh phn acid bo, cc bin th cu trc trong cc c tnh v hnh thi trn b mt vi khun. Phng php nhum Gram c s dng xc nh v phn bit vi khun, tuy nhin, vi nhiu l do n tr nn khng ng tin cy. Cc thay i nh trong iu kin nui cy, s thiu ht mt s c tnh kiu hnh v s hi t tin ha gia cc c tnh ny c th hy hoi cc kt lun v dch t hc ca mt v dch. 4.1.2. Tiu ch ca mt phng php nh typ tt

    Ni chung cc phng php nh typ phi p ng mt s tiu chun nht nh c th c p dng rng ri. Trc ht tt c cc vi sinh vt trong mt loi u phi c th nh typ c bng phng php c chn. i vi mt s phng php, v d da vo khng th hay s hin din ca th th thc khun, th cc c tnh ny c th khng c trong tt c cc chng ca loi. Typ huyt thanh c gn cho chng ch khi c s hin din ca cc du hiu huyt thanh hc c th no . V d, 10 - 15% cc chng Mycobacterium avium khng th nh typ huyt thanh c v chng khng phn ng vi bt k khng huyt thanh no hin c. Tng t, typ thc khun cng thng c dng cho Staphylococcus aureus, S. aureus khng c th th ca thc khun th khng th b nhim c v do khng th nh typ c.

    Cc phng php nh typ cng phi c kh nng phn bit cao. N phi c kh nng phn bit r rng cc chng khng c lin quan, v d cc chng c ngun gc a l hon ton khc, ng thi phi chng minh c quan h ca cc chng c phn lp t cng mt ngun gc.

  • 38

    lp li c bit quan trng khi xy dng c s d liu ca cc chng bit dng so snh vi cc chng cha bit. S biu hin kiu hnh khng n nh, v d biu hin gen c lc khng lin tc, c th gy kh khn cho vic lp li

    Cui cng tnh d dng v gi thnh ca phng php cng c vai tr quan trng khi la chn phng php inh typ.

    Cc phng php nh typ da trn kiu hnh ni chung khng p ng c ht cc yu cu trn, trong khi cc phng php da trn trnh t ADN hay kiu gen cho php khc phc cc yu im ny. Cc k thut ny c nhiu u im so vi phng php truyn thng nh trnh c nhu cu v mi trng nui cy, tng nhy v n nh ca cc th nghim, rt ngn thi gian. Cui cng, vic nh typ phn t xut pht t du n ADN hay trnh t nuclceotid thu c nhiu thng tin. V d, php phn tch du n vi cc mi ERIC, REP v BOX c th to ra hng chc sn phm khuch i cha thng tin v mt chng c th, trong khi trnh t ca mt gen ompA c th cung cp hng trm c im a hnh. 4.1.3. Phn loi cc phng php nh typ phn t

    Cc phng php nh typ phn t c th c chia lm ba nhm: a) Phn tch du n nhim sc th s dng k thut khuch i gen b) Ct gii hn nhim sc th vi khun c) Khuch i mt gen v phn tch trnh t Trong qu trnh thc hin, c nhiu ci tin hay bin th ca cc chin lc c bn trn. V

    d, cc phng php du n da trn PCR c th khai thc nhiu nhm mi lp khc nhau nh REP, cc trnh t xen gia rARN, cc trnh t ADN a hnh khuch i ngu nhin (RAPD). Chin lc da vo s a hnh di cc on ct gii hn (RFLP) c th c phn tch gin n vi gel agarose nhum ethidium bromid hay c th c chuyn ln mng v lai vi cc on d nh du. Vic khuch i mt gen v phn tch trnh t c th khc nhau do gen c chn khc nhau, hay do vic s dng thng tin trnh t thu c trc tip hay gin tip thng qua vic dch thnh protein.

    Cc k thut du n da trn PCR hin ang s dng phn bit cc chng gm du n PCR vi mi lp (REP-PCR), PCR ca vng xen gia 16S v 23S rDNA (ribotyping), v PCR ADN a hnh khuch i ngu nhin (RAPD-PCR). 4.1.4. La chn gen phn t bng phng php phn t

    Vic phn tch chng t cc trnh t nucleotid hin mnh phn bit cc vi khun c th, khi phi hp vi PCR mt on gen vi nh trnh t t ng, n c th cung cp thng tin chi tit v kiu gen mt cch nhanh chng. Vic phn tch trnh t nucleotid tr thnh mt nhnh ph ca khoa h thng v phn loi hc vi khun. Cc trnh t ADN ribosom c chng minh l hu hiu trong vic phn bit cc nhnh sinh loi ca cc h vi khun c quan h xa. Cc trnh t rARN ca tiu n v nh, c chng minh rt hu ch trong vic gii quyt cc quan h tin ha trong ngnh khun lam. Tuy nhin, tc thay th cc k chm trong cc gen rARN nh tin cho vic s dng chng trong vic phn gii cc n v phn loi c quan h gn (v d loi v chng). Do , mt s gen m ha cho protein vi khun c nghin cu s dng lm cy sinh loi ca cc chng c quan h rt gn. Tnh hiu qu trong vic phn bit ca cc gen s dng trong nh typ cc chng khc nhau thng c xc nh mt cch thc nghim trong mt h vi khun c th. Trong mt s trng hp, vi locus khc nhau c th c dng pht hin lm tng chnh xc ca vic nh danh v tng phn gii gia cc chng. Cc tip cn kiu ny c p dng hiu qu trong vic nh typ cc vi khun ng rut. v d, trnh t nucleotid ca gapDH v ompA chng minh cc chng phn lp hin nay ca Escherichia vulneris khng c cng mt nhnh phn loi, nh trc y, v do khng nn xem xt cc chng ny trong cng mt loi. Ni chung, c nhiu yu t bn trong cc

  • 39

    gen m ha ca vi khun c th dn n vic xem xt chng hu dng nh l du ch phn t phn bit chng:

    a) Mc bin thin ca trnh t nucleotid vt xa cc trnh t rADN tiu n v nh v ln.

    b) Protein c m ha c chc nng c bo tn xuyn sut trong nhiu chi, chng t gen s ton vn trong cc loi c lin h xa.

    c) V tr vt l ca gen trn nhim sc th vi khun chng t c s iu hng gia cc n v phn loi khc xa nhau.

    4.1.5. Nhc im ca phng php phn t Mc d cch tip cn di truyn phn t t ra mt cng c phn tch hiu qu nht xc

    nh v theo di cc chng vi khun, chng khng phi khng c sai lm. Vic s dng cc on d phn t v cc locus nhim sc th khc nhau phc ha kiu gen ca vi khun c th pht sinh sai st. Gen c s dng phn bit loi ny c th khng cha trnh t bin thin cn thit phn bit vi cc chng ca mt loi khng lin quan khc. Vic xc nh hiu qu nh typ thc nghim i vi mt n v phn loi c th i khi rt tn km v thi gian v tin bc. V d, cc trnh t rADN tiu n v c dng hiu qu trong vic phn bit cc Pseudomonas nhng li thiu cc on cn thit phn bit vi cc loi khc trong ng rut nh l mt s Escherichia hay Erwinia. Hn na, c tnh siu nhy ca cc k thut nh typ phn t, nht l cc k thut c lin quan n PCR, lm cho vic phng trnh ngoi nhim tr thnh mt vn ln.

    Vi cc tin b gn y v k thut phn tch trnh t ADN v lai ha, hu ht cc phng php hin dng u khng c nh du bng phng x nh trc. Mt s qui trnh ngy nay cho php nh danh v phn bit hiu qu, kinh t v an ton cc chng dng trong th y, y hc, nng nghip.

    4.2. Du n da trn PCR ca nhim sc th vi khun 4.2.1. K thut chung

    C nhiu phng php lm du n b gen vi khun da trn phn ng khuch i. Phn tch du n bng PCR mi lp, rep-PCR, da vo mt s nhm trnh t c bo tn

    ca cc yu t ADN lp c phn b trong nhim sc th vi khun. Tng t nh phn tch VNTR nhn tht, cc oligonucleotid c s dng trong rep-PCR pht hin s a hnh kch thc bng cch khuch i cc vng nhim sc th nm gia cc yu t lp. Bng cch ny, s cc mnh khuch i lm mt hm s ca v tr vt l ca yu t lp trn nhim sc th.

    Phn tch PCR ca vng xen gia 16S v 23S, ribotyp, cng cho thng tin v kiu gen ca chng di dng s a hnh kch thc. Mi oligonucleotid c thit k t u 3 ca 16S rADN v u 5 ca 23S rADN khuch i vng xen gia (IGS) hai tiu n v rARN.

    Phn tch ADN a hnh khuch i ngu nhin (RAPD-PCR), s dng phn ng khuch i cc phn bt k ca ADN nhim sc th nh mt hay nhiu on mi ty ngn. Phn tch trn gel agarose cho mt ph cc sn phm khuch i thng c trng cho mt chng c th.

    S a hnh chiu di on khuch i (AFLP) l mt k thut hiu qu khc phn bit cc chng vi khun c lin quan gn da trn PCR. AFLP khuch i ADN sau khi ct vi enzym gii hn. Mt cch vn tt, ADN vi khun c ct trc vi enzym gii hn (v d EcoRI v MseI) to ra mt hn hp cc mnh ADN c chiu di khc nhau. Cc on ni oligonucleotid si i lc ny c ni vo cui cc mnh ADN trn. Cc on mi c hiu vi on ni vi cc nucleotid chn l