genomika uvod vkmge
Post on 28-Jan-2017
228 Views
Preview:
TRANSCRIPT
genomika ....uvod
• Termin genom prvi put koristi nemački botaničarHans Winker, 1920. godine kao skup gena u haploidnom setu hromozoma
• odnosi se na ukupnu DNK ćelije • 1986 genetičar Thomas Roderick koristi izraz
genomika za “mapiranje, sekvenciranje i karakterisanje genoma”
• novi termini vezani za genomiku:funkcionalna genomika, transkriptomika, proteomika, metabolomika (omics)
• Genomika se odnosi na sveukupnu studiju gena u genomu
• uključuje: sekvenciranje, transkripcione eseje, funkcionalne studije aktivnosti i regulacije gena, računarske metode, evolutivna poredjenja, itd.
• Obuhvata
– Genom Prokariota
– Genom Eukariota
• nukleus, nDNK
• mitohondrije, mtDNK
• hloroplasti, cpDNK
• Sekvenca genoma nam može dati informaciju o:– razviću organizma,
– otpornosti na oboljenja– istoriji vrste, populacije
– budućnosti vrste, populacije
– sličnosti sa ostalim vrstama, populacijama
Ciljevi genomike
•Uspostavljanje integrativnih baza podataka– ...uglavnom je „magacioniranje“a trebalo bi ih povezivati
sa ekspresijom
•Opisivanje svakog gena:– funkcija/ekspresija/interakcije/fenotip
– 3-d struktura i njeno ispoljavanje (introni/egzoni, domeni, ponovci)
– sličnosti sa drugim genima
•Karakteristike razvnovrsnosti sekvence u populacijama
Genomika:
Strukturna– nalaženje sekvenci
•Funkcionalna– kada je poznata sekvenca gena, istražuje se njena funkcija
– Genom je isti u svim ćelijama ali samo se deo genoma eksprimira u nekim ćelijamaspecifičnosi se razvijaju tokom diferencijacije u razviću
•Komparativna– poredjenje i strukture i funkcije sekvenci genoma medju taksonima
veličina genoma
Tehnologija rekombinantne DNK
•DNA sekvenciranje, genomske biblioteke, PCR, tehnike hibridizacije
Mapiranje genoma
Ranije....
•Genetičke mape– Rastojanja među jednostavnim markerima izraženo u jedinicama rekombinacije
•Citološke mape– Bojenje hromozoma, vidljivo pod mikroskopom
Sada....
•Fizičke mape– Rastojanje među nukleotidima izraženo u bazama
•Komparativne mape– Detekcija odgovarajućih gena i regulatornih sekvenci
Projekat Humanog Genoma (HGP)• Formalno započeo 1990, u U.S.A. Koordinisan od strane U.S. Department
of Energy i National Institute of Health. Planirano da traje 15 godina, ali brzi napredak tehnologije ubrzao završetak.
Ciljevi projekta su bili:
• identifikovati svih 20,000-25,000 gena u humanoj DNK,
• determinisati sekvence 3 milijarde baznih parova koje čine humanu DNK
• čuvati informacije u bazama podataka
• poboljšavati metode za analizu podataka
• obratiti pažnju na etičke, pravne i socijalne probleme koji mogu proizaći iz projekta
• Oko 30 000 gena je identifikovano tokom Projekta Humanog Genoma- HGP (od 1990)
• Samo oko 2% humanoggenoma čine geni kojikodiraju za proteine
• Promene u sekvencama DNK mogu da se dese bilo gde, ne samo u genima
Mapiranje genoma čoveka
http://www.ncbi.nlm.nih.gov/
Bioinformatika: računarska analiza podataka genomike
• stvaranje algoritama, računarskih i statističkih tehnika i teorije u cilju rešavanja praktičnih problema u analizi bioloških podataka
• Uključuje: applied mathematics informatics, statistics computer science, artificial intelligence, chemistry and biochemistry
• za rešavanje bioloških problema, obično na molekularnom nivou.
• Glavni domeni istraživanja su:– sequence alignment, gene finding, genome assembly, protein
structure alignment, protein structure prediction, prediction ofgene expression and protein-protein interactions, modeling of evolution.
Zastupljenost gena prema funkciji u ćeliji sisara
postgenomska era
• razumevanje proteoma, transkriptoma, metaloboma...
• svaka ćelija ima isti genom, istu DNK sekvencu sa kojom se radja, ali svaka ćelija u telu ima drugačiji proteom, a on se menja i kroz vreme.
– pri infekciji, proteom se menja u ćelijama, kao imuni odgovor.
– proteomi se menjaju kao odgovor na fluktuacije i unutarćelijskoj i medjućelijskoj sredini ....Lekovi, vežbanje, ishrana.
Glavne oblasti istraživanja i primene genomike, proteomike,
bioinformatike
Analiza sekvenci
• DNK faga Φ-X174 je sekvencirana 1977. godine i od tada su DNK sekvence stotina organizama dekodirane i smeštene u bazama podataka odakle se analiziraju, poredeitd.
• Sa porastom broja podataka postalo je teško obradjivati manuelno sekvence pa se računarski progami koriste za istraživanje genoma, hiljade organizama, sa milijardama nukleotida....
shotgun sequencing
prvi put u The Institute for Genomic Research prisekvenciranju prvog bakterijskog genoma, Haemophilus influenza
• daje sekvence hiljada kratkih DNK fragmenata (600-800 nukleotida)
• krajevi ovih fragmenata se preklapaju i kada se pravilno postave uzdužno, čine ceo genom.
• daje brzo podatke o sekvencama ali je sklapanje tih fragmenata dugo i komplikovano je za velike genome i zato je upotreba algoritama u sklapanju genomaznačajni deo bioinformatike.
Označavanje genoma (genome annotation)
• proces markiranja, označavanja gena i biološki značajnih mesta na DNK.
• Prvi softver za to je dizajniran 1995 - Owen White, član tima koji je sekvencirao prvi organizam, Haemophilus influenzae)
automatsko traganje za genima i regulatornim sekvencama unutar genoma
• nisu svi nukleotidi u genomu deo gena i ova “junk DNK” može sadržati nepoznate, ali funkcionalne elemente.
• Bioinformatika spaja procep izmedju genoma i proteoma.
Analiza genske ekspresije
• Ekspresija više gena može se odrediti preko nivoa i-RNK– microarrays - DNK čipovi, expressed cDNA sequence tag (EST) sequencing, serial analysis of
gene expression (SAGE) tag sequencing, massively parallel signature sequencing(MPSS), multiplexed in-situ hybridization)
• Sve ove tehnike podložne su greškama (“šumu”) koji proističe iz samog biološkog sistema i merenja i u računarskoj biologiji se razvijaju statističke metode kojima se razdvaja pravi signal od “šuma”
• Ovakve studije se često koriste da odrede gene koji su uključeni u ispoljavanje poremećaja:
– mogu se porediti microarray podaci iz kanceroznih epitelijalnih ćelija i iz nekanceroznih, da se odrede transkripti koji su uzvodno ili nizvodno regulisani u odredjenoj grupi ćelija kancera.
Analiza proteinske ekspresije• Proteinskičipovi i visoko protočna (HT) masena spektrometrija (MS) pružaju sliku o
proteinima prisutnim u biološkom uzorku.
Bioinformatika pravi smisao medju ovim podacima
DNK čipovi
• su u najvećoj meri transformisali genomiku• 1. omogućavaju da se simultano meri
nivo transkripcije za svaki gen u genomu• 2. omogućavaju sakupljanje podataka o
celom genomu i njegovom odgovoru na promenu sredine
Biomedicinska primena DNKčipova• za bolje razumevanje i dijagnostifikovanje
kancera • efikasnost lekova - farmakogenetika
Analiza regulacije genske ekspresije
• Složena “orkestracija” dogadjaja koji počinju vanćelijskim signalom i vode nakon kaskade dogadjaja porastu, ili padu sinteze jednog, ili više proteinskih molekula
• Bioinformatika se koristi na različitim koracima ovog procesa– analiza promotora uklučuje otkrivanje i studiju sekvence u regionu genoma koji
okružuje gen, a koji utiču na nivo do koga se taj region transkribuje u i-RNK
– Može se porediti genska regulacija: poredjenje microarray podataka sa različitih stupnjeva, ili stanja u razviću i životu nekog organizma, čime se formira hipoteza o genima uključenim u svakom od njih.
– kod jednoćelijskih organizama mogu se porediti podaci iz različitih stadijuma ćelijskog ciklusa u različitim stresnim uslovima (nedostatak ishrane, toplotani šok itd.) Na osnovu metode grupisanja podataka o toj ekspresiji odredjuje se koji geni se,na primer,eksprimiraju zajedno.
Analiza somatskih mutacija i poredjenje sa polimorfizmima germinativne linije
• sekvenciranje može da identifikuje niz tačkastih mutacija u različitim genima
• Ovi podaci zahtevaju automatsko čitanje sekvenci i poredjenje sekvenci sa poznatim u humanom genomu, uključujući poznate polimorfizme germinativne linije
• Oligonukleotidni genski čipovi, uključuju komparativnu genomsku hibridizaciju i SNP čipovi, sposobni da vrše probe i do nekoliko stotina hiljada mesta kroz genom koriste se za identifikaciju viška ili manjka hromozoma na primer, u tkivu kancera.
• Hidden Markov model i change-point analysis metode razvijene su da razlikuju stvarne promene u broju kopija i “šuma” u podacima. Dalje metode bioinformatike se razvijaju da razumeju implikacije lezija koje se nalaze na primer u mnogim tumorima.
• Neke metode (e.g. Quantum 3.1 ) pogodne su za promenu proteinske sekvence na specifičnim mestima kroz alteracije amino kiselina i predvidjaju promene u bioaktivnosti nakon mutacija.
Informatika i računarska evolutivna biologija
Informatika pomaže evolucionim biolozima na više načina:
• Da prate evoluciju velikog broja organizama merenjem promena na njihovim DNK, ne oslanjajući se samo na fizičke ili fiziološke observacije.
• Da porede genome, što omogućava izučavanje složenih evolucionih dogadjaja kao što su duplikacije gena, lateralni genski transfer itd.
• Da izgrade složene računarske populacione modele koji mogu predvidjati ishode promena genetičke strukture populacija kroz vreme.
Komparativna genomika
• evolutivni dogadjaji na različitim
nivoima organizacije oblikuju
genomsku evoluciju:
– na najnižem nivou, tačkaste
mutacije odražavaju se na
nukleotide;
– na višem nivou, veliki
hromozomski segmenti prolaze
duplikaciju, lateralni transfer,
inverziju, transpoziciju, deleciju
ili inserciju;
– konačno, celi genomi su
uključeni u procese
hibridizacije, poliploidizacije i
endosimbioze, što često vodi
brzoj specijaciji.
• srž komparativne genomske analize je stvaranje veze izmedju gena (orthology analysis) u različitim organizmima.
• intergenomske mapeomogućavaju praćenje evolutivnih procesa odgovornih za divergenciju genoma
• razvijanje matematičkih modela i algoritama (parsimony models,
Markov Chain Monte Carlo algorithms, Bayesian analysis) zaizučavanje složenosti genomske evolucije
molekularna evolucija vs. populaciona genomika
• Molekularna evolucija ima za cilj analizu tipa promena makromolekulskih sekvenci medju vrstama kroz evoluciju
• Populaciona genomika, slično, primena populacione genetike na genomskoj skali, ali naglasak je na razlikama unutar vrsta
procena biodiverziteta
• Biodiverzitet jednog ekosistema može se definisati kao ukupni genomski sastav odredjene sredine, svih prisutnih vrsta
• Baze podataka se koriste da bi se prikupila imena vrsta, opisi, distribucijagenetičke informacije, stanje i veličina populacija, potrebe staništa, interakcije medju vrstama.
• posebni softveri se koriste da pronadju, vizualiziraju i analiziraju informacije i omoguće komuniciranje medju istraživačima
• Kompjuterske simulacije, modeli, na primer za populacionu dinamiku, mogu da procene kumulativni genetički efekat i stanje genofonda, na primer u poljoprivredi ili konzervacionoj genetici.
• Cele sekvence DNK, genomi ugroženih vrsta, mogu se sačuvati zahvaljujući bioinformatici.
Primena genomikeu poljoprivredi– sekvenciranje genoma kultivisanih biljaka i
domaćih životinja
– otkrivanje gena za poželjne osobine
– identifikacija patogena
primena genomikeu medicini– identifikacija sekvenci i gena za predispiziciju na neka
oboljenja
– poboljšanje dijagnostike• Analize genske ekspresije preko čipova iz više tipova tumora
• Grupisanje obrazaca ekspresije prema tumorima
– Farmakogenomika• odredjivanje terapije prema genotipu
• Identifikacija varijabilnosti u odgovoru na terapije
• SNP (polimorfizmi pojedinačnih nukleotida) mesta u genomu po kojima se osobe razlikuju u pojedinačnim nukleotidima
• DNK profilisanje - mapiranje, odredjivanje takvih mesta u genomu
• Baze podataka, upotreba u biomedicini, farmaciji
• neki SNP utiču na osobinu, neki su neutralni(markeri)
• SNP može biti u asocijaciji sa osobinom jer je statistički korelisan sa nekom uzročnom varijantom
http://learn.genetics.utah.edu/units/pharma/phsnipping/
molekul DNK
vezani SNP van genabez efekta na stvaranjei funkciju proteina
uzročni SNP u genu
nekodirajući SNP menja količinu stvorenog proteina
kodirajući SNP menja aminokiselinsku sekvencu
osnovan 2002
• cilj: opisati zajednički obrazac variranja humanih DNK sekvenci, ili, napraviti haplotipsku mapu genoma čoveka
• identifikovati LD i distribuciju haplotipova u genomu
• ovo je od značaja za:– identifikaciju lokusa za složene osobine, kod čoveka, npr.
dijabetes, kancer, moždani udar, koronarna oboljenja, depresija, astma
– razumevanje populacione istorije ljudi koja se oslikava u različitosti i sličnosti
– za dizajn i analizu studija genetičkih asocijacija koje zavise od informacije o LD kroz genom – bitno je znati koliki su i gde su predački segmenti hromozoma da bi se koristili odgovarajući SNP markeri
http://hapmap.ncbi.nlm.nih.gov/
http://www.sanger.ac.uk/resources/downloads/
human/hapmap3.html
Sumirani zaključci HapMap:
• sve 4 populacije pokazuju sličnu strukturu haplotipskih blokova sa jakim LD, sa slabim ili bez LD medju markerima susednih blokova.
• blokovi obuhvataju 67-87% genoma, a 13-33% analiziranih regiona pokazuju puno veću raznovrsnost i rasutost i razlike medju jedinkama
• Granice hap blokova su na sličnim pozicijama kroz genom
• Hap blokovi variraju po veličini ali tipično je da su 5-15kb, osim u afričkom uzorku (7,3%) usled većeg broja generacija od osnivačkog, predačkog genoma
– mnogo veći blokovi su gde nema rekombinacije, oko centromera ili u regionima koji su pod nedavnom jakom selekcijom
• Većina SNP varijanti je nastala retkim mutacijama (stopa oko 10-8 po nukleotidnom mestu po generaciji) na određenom hromozomu i tako je od početka u LD sa okolnim delom
• Humana genetička varijabilnost je ograničenija nego što se mislilo preko broja mogućih SNPs.
– četiri do šest haplotipa po bloku dovoljno da opiše sve hromozome.
LD je opšti fenomen genoma čoveka. Dat je deo genoma u kome su hap blokovi sa D
= 1 odvojeni regionima u kojima se odigrala rekombinacija. Najveći blok ima 80 kb.
http://science.bio.org/genomics.news.htmlhttp://www.genomenewsnetwork.org/http://www.ncbi.nlm.nih.gov/
• To collect works that help us understand
genomics is not something apart from
ourselves but is ourselves
http://www.genomicart.org/offerings.htm
top related