solid color space

57

Upload: kaveri

Post on 13-Jan-2016

21 views

Category:

Documents


0 download

DESCRIPTION

SOLiD color space. File management. Szekvenciák, kontiggá való összerakása I. Tévedések vígjátéka. A scaffold fogalma. Szekven álási lyukak. Nincs kapcsolat. Kontig 3. Kontig 1. Kontig 2. Kontig 4. Kontig 5. Scaffold 1. Scaffold 2. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: SOLiD color space
Page 2: SOLiD color space
Page 3: SOLiD color space
Page 4: SOLiD color space
Page 5: SOLiD color space
Page 6: SOLiD color space
Page 7: SOLiD color space
Page 8: SOLiD color space
Page 9: SOLiD color space
Page 10: SOLiD color space
Page 11: SOLiD color space
Page 12: SOLiD color space
Page 13: SOLiD color space
Page 14: SOLiD color space
Page 15: SOLiD color space
Page 16: SOLiD color space
Page 17: SOLiD color space
Page 18: SOLiD color space
Page 19: SOLiD color space
Page 20: SOLiD color space

SOLiD color space

Page 21: SOLiD color space
Page 22: SOLiD color space
Page 23: SOLiD color space
Page 24: SOLiD color space
Page 25: SOLiD color space
Page 26: SOLiD color space
Page 27: SOLiD color space
Page 28: SOLiD color space

File management

Page 29: SOLiD color space

Szekvenciák, kontiggá való összerakása I.

Tévedések vígjátéka

Page 30: SOLiD color space

összekapcsolás: kozmidkönyvtár (BAC, YAC) klónok végeinek szekvenciái két küldönböző kontigra esnek

Szekvenálási lyukak Nincs kapcsolat

Scaffold 2Scaffold 1

Kontig 4 Kontig 5Kontig 1 Kontig 2 Kontig 3

Scaffold: láncszerűen lineáris sorrendbe elhelyezett nem összeérő kontigok sora.

A scaffold fogalma

Page 31: SOLiD color space

Kontigok szuperkontigokká való összerakása

Page 32: SOLiD color space

KOMBINATORIKUS PCR

Page 33: SOLiD color space

Genomi DNS részleges emésztése MboI (Sau3AI)-gyel(kompatibilis véget ad a BamHI-véggel)A 30 – 45 kb régió méret szerinti elválasztása

BamHI- XbaI emésztés

Ampr ori

cos cos

ligálás

30 – 45 kb-os fragmentek

cos cos

in vitro pakolás GigaPack fehérje extraktummal

szelekció ampicillin rezisztens klónokra

kozmid könyvtárKOZMID KÖNYVTÁR

Page 34: SOLiD color space

Mesterséges kromoszómák:BAC (bacterial artificial chromosome) vektorok

Page 35: SOLiD color space

Mesterséges kromoszómák:YAC (yeast artificial chromosome) vektorok

Page 36: SOLiD color space

454 PE library generation

Page 37: SOLiD color space

Egy tipikus példa párosított végszekvenálásra, 454, PE

Page 38: SOLiD color space

Solexa párosított végszekvenálás I.

Page 39: SOLiD color space

Solexa párosított végszekvenálás II.

Page 40: SOLiD color space

Solexa párosított végszekvenálás III.

Page 41: SOLiD color space

PRIMER SÉTA

TEMPLÁT GENERÁLÓ RENDSZER

Kozmid,BAC,YAC könyvtárakban

Az integrációhelyét ellenőrizni kell

Nagy kapacitású automata Southern hibiridizáció

Page 42: SOLiD color space

Összerakó algoritmusok (Assemblers)

Buzgó (greedy) algoritmus

Átfedési-szerkezet-konszenzus

Page 43: SOLiD color space

De ha sikerül, és van szekvenciánk

Mi van rajta,van-e gén? Honnan tudjuk, hogy

Valamit találtunk, találtunk-e gént?

CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGA

TCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGG

TCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTT

CGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAG

GGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGC

CGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGT

CCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCA

TTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCG

AGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC

GGGAATGCTTCGTGTTGAAGTGGCCCTGGCGCGCGCGCAGGCGGCAGAGGGCCTTGTCAGTTCGGAATTGGCCGACGCGATCGAGGTTGTTGGTACTGCCGGGTTGGACCCCGAGGCGAT

GGCGGCGACTACTCGCATGACAGGAGTGCCCGCAATATCGTTCGTCCGTGCGGTGCAATCGGCCCTGCCGCCCTCACTGGCGGGTGGATTTCATTTCGGCGCCACCAGTCAAGACATCGT

GGATACGGCCCACGCGCTCCAGCTGGCCGAGGCACTCGATATTATAGAAGTCGATTTACACGCCACTGTCAGCGCAATGATGAATCTGGCCGCTGCTCACTGCAATACACCCTGTATCGG

GCGCACGGCCTTGCAGCACGCAGCGCCAGTTACGTTCGGCTACAAGGCGTCCGGCTGGTGCGTTGCCCTGGCGGAGCATCTGGTGCAGCTTCCCGCGCTGCGAAAGCGGGTTCTGGTGGC

GTCGCTAGGGGGGCCGGTTGGTACCCTTGCCGCGATGGAGGAGCGGGCCGACGCTGTACTGGAGGGTTTCGCTGCGGACCTGGGGTTGGCCATTCCCGCCCTGGCCTGGCACACGCAGCG

GGCCCGGATCGTCGAGGTGGCCAGTTGGCTGGCCATATTGCTGGGAATTCTGGCAAAAATGGCCACCGATGTCGTTCACTTGTCCTCCACGGAAGTGCGCGAGCTTTCCGAACCTGTAGC

GCCGGGCAGGGGGGGCTCCTCGGCGATGCCTCACAAGCGGAACCCGATTTCCTCGATTACCATCCTGTCCCAGCATGCTGCGGCAGGGGCCCAGCTCTCCATTCTCGTGAACGGCATGGC

CAGTCTGCACGAACGTCCGGTGGGGGCGTGGCATTCGGAATGGTTGGCTCTGCCGACGCTGTTCGGCCTTGCCGGCGGTGCCGTGCGCGAGGGCAGGTTTCTGGCCGAGGGGCTGCTGGT

CGATGCCGACCAGATGGGTCGCAATCTACAATTGACCAATGGCCTGATTTTCAGCGACGCGGTAGCCGGCCAGTTGGCAAAGCACTTGGGTCGGGCCGAGGCTTATGCCGCTGTCGAGGA

TGCCGCCGCCGAGGTGTTGCGTTCAGGCGGCAGCTTTCAGGGTCAGCTGAACCAGCGCCTGCCCGATCACCGCGACGCTATCGCTATTGCTTTTGATACGACGCCGGCGATCCAGGCCGG

GGCCGCCCGCTGCCGTAGTGCGCTGGATCATGTGGCTCGTATTCTTGGACCCGCCTCTACCATCGGATTTCAAGGAGGCTAATGACGTGACGACACTGTTTGAGGCGACGACCATCCCGA

TTTGCGAGGGCCCGCGCGACCAGACCGCCGAGATCCTTTTCGAGATGCCGCCGGGTGCGTGGGATACCCATTTTCATGTTTTTGGCCCAGTTTCATCGTTTCCATACGCAGAACACAGGC

TCTATTCCCCACCGGAGTCGCCACTTGAGGATTATCTGGTGTTGATGGAGGCTTTGGGGATCGAGCGCGGCGTTTGTGTCCATCCGAATGTTCATGGTGCCGACAATTCGGTGACGCTCG

ACGCAGTTGCGCGGTCCGATGGTCGTCTGCTGGCGGTGATCAAGCCACATCACGAGATGACTTTTGTTCAGCTGCGGGACATGAAGGCGCAGGGGGTCTGCGGGGTACGTTTTGCCTTCA

ATCCGCAGCATGGCTCGGGCGAGTTGGATACTCGTTTGTTCGAGCGTATGTTGGACTGGTGCCGCGACCTAGGCTGGTGCGTAAAATTGCATTTCGCGCCCGCTGCGCTGGACGGTCTGG

CTGAACGTTTGGCGCGCGTCGATATTCCGATCATCATCGATCATTTCGGGCGGGTGGACACCGCGCAAGGTGTGGATCAGCCGCACTTCCTGCGTTTGCTCGATCTGGCCAAACTGGACC

ATGTCTGGATCAAGCTTACGGGGGCAGATCGTATTAGCGGTTCCGGCGCGCCATATGACGATGTCGTGCCCTTCGCGCACGCTTTGGCAGATGTGGCGCCCGACCGCCTCCTCTGGGGTT

CGGATTGGCCGCATTCAGGCTATTTCGATCCGAAGCACATACCCAATGACGGCGACTTGTTGAACCTTTTGGCGCGTTTTGCCCCCGATGCTGAACTGCGTCGTAAGATCCTTGTGGACA

ACCCGCAGCGCCTGTTCGGGGCTGCTTGAGGAGCCGAGCCGATGCAACCTTTCGTCTACGAAACAGCCCCAGCGCGCGTCGTTTTCGGGCGCGGCACTTCGCAGAATCTGCGGCGGGAAC

TTGAGGCCCTGAATTTTGGCAGGGCGCTGGTTCTTTCCACGCCCGACCAAAAAGAACAATCGCTGCGAATTGCCCAGGGCCTGGGTTCTCAGCTGGCGGGGTCGTTCCACGCCGCTGCCA

TGCATACGCCTGTCGAGGTCACCTTGCAGGCGCTTGAGGTGCTGAAGGATGTGCAGGCCGATTGCATCGTGGCGATTGGCGGCGGCTCAACCATTGGGTTGGGCAAGGCACTGGCCCTGC

GCACCGATCTGCCGCAGATCGTCGTCCCGACGACTTATGCCGGCTCGGAAATGACGCCGATCCTGGGAGAGACGGAAAACGGGCTGAAGACCACACAGCGTAATCCCAAAGTGCAGCCGA

GGGTGGTTCTCTACGATGTGGACCTGACTGTGACGCTTCCGGTGCAGGCCTCGGTTACATCAGGCATGAATGCGATCGCCCATGCGGCCGAGGCATTATATGCGCGGGACGGCAATCCGG

TGATCTCGCTGATGGCCGAAGAGGCGATCCGCGCGCTGGCCCATGCCCTGCCGCGTATCGTTGCCACTCCCGACGATATCGAAGCGCGCAGCGATGCCCTCTATGGCGCGTGGCTGTGCG

GAACGTGCCTGGGTTCGGCCGGAATGGCGTTGCACCATAAGCTCTGCCACACCCTCGGCGGAAGTTTCGATTTGCCACATGCCCCGACCCACACGGTCATCCTCCCCTATGCGCTCGCCT

ATAATAGTGATGCGGCCAGGCCCGCAATGGCAGCCATCGCGCGCGCGCTGGGCATGGCGGATGCAGCGATGGGCATGAGAGCGTTGTCCATGCGGTTGGGCGCCCCGACATCGCTGCGTG

AGTTGGGCATGGCAGAAGCCGATCTTGACCGCGCCGCCGACCTGGCCACGCAAAATGCCTATTGGAACCCGCGACCCATCGAGCATGGGCCGATTCGTAACCTTCTGGGACGGGCCTGGG

CTGGAACTCCGGTCTGAAGGACCTAGAGGACAGTCAATTCATTGATCTGAAGTCACCAACGAGGAGATATGGGATGAACGAGAACATTGCGATCCGCAAATTGGGCCGCCGACTCCGATT

GGGCATTGCCGGTGGCGCGGGTCATTCGCTGATTGGTCCGGTTCACCGGGAGGCGGCTCGGCTTGACGATTTGTTCTCTCTCGATGCTGCGGTGCTGTCCAGTAACGCGGAACGCGGGGA

TGCTGAGGCCGCGGCTCTCGGAATTCCGCGCTCCTATTCGTCCACCGCCGAGATGTTCGCAATGGAGAAGGCTAGGCCCGACGGTATTGAGGCCGTTGCCATAGCCACGCCGAATGACAG

CCATTACCGGATTCTGTGCGAGGCGCTGGACGCCGGGTTGCATGTAATCTGCGACAAGCCTTTAACCTCCACGAAGGCCGAGGCCGACGACGTGCTGGTGCGGGCGAAGGCCGCGGGCAA

GGTTGTGGTCCTGACCCACAATTATTCTGGCTACGCCATGGTACGCCAAGCCCGCGCCATGGTCGCCGCCGGTGAACTTGGGAAAATCCACCAGATTCACGGGGTCTACGCTCTGGGCCA

GATGGGCCGTTTGTTCGAGGCCGACGAAGGGGGCGTGCCTCCGGGGATGCGTTGGCGGATTGATCCTGCGCGCGGTGGCGACAGTCACGCCCTGGTGGATATCGGCACCCATGTGCACCA

TCTGGCTACCTTCATCACGCAGTTACAGGTCGTTGAGGTAATGGCCGATCTTGGGCCGGCGGTTCAAGGCCGCGCGGCCCATGACAGTGCCAACGTCATGTTCCGTATGGAAAACGGAGC

TTTCGGATCGTTCTGGGCCACCAAGGCGGCATCGGGGGCCAGCAAGCTGGCGATCGAAGTCTACGGTGACAAGGGCGGCGTCCTGTGGGAGCAGGCCGACGCCAATAACTTGCTACATAT

GCGGCAGGGCCAACCCCCAGCCCTGATTGGTCGACAAGTTGCCGGGCTGCATCCTGCGGCAATCCGCGCGATGCGGGGGCCGGGTTATCATTTCGTGGAAGGCTATCGCGAGGCCTTTGC

GAATATGTACGTGGATTTCGCCGAACAGATCTTGGCCATGATGGGCAAGGGGGCCGCAGATCACCTGGCATTGGAAGCGCCGTCGGTCGTGGACGGCCTGCGCTCCATGGCGTTCATCGA

AGCCTGTGTGGCGTCGTCGCAGGACCGCCAATGGCGGCAGGTGGAGCAAGTCAGTTGATCTCTCAGCGGCTTCGGCATTTTTCCCGGGCTGGCGGCTCCCCGCAGCTCCCTCCGGTGGAA

AGAACGGGTAATCAAAATAATATTCTGATTTTAAAGGATGTTCCAGACAGCTGATTATTCCTGAAATTTAGGGCTCTTTCGGCTGTAGCAATTGACTAAAAGCCGAATTTAAGGGTAATTAAACAAACGCTGTTCGTATTATTTAAACAGGTGAGTGATGGCGATATTCCTGGAAGGCTGGCCGATGGTTTCATCTGAATACCCGGCCAGAAGCGTTGAGGCGCACCCGGCCTATCTGAC

GCCAGACTATGTTTTCACGCGAAAGCGTGCGCCGACTCGACCGCTGCGGTTAATTCCTCAGTCTGCGACGGAGCTGTATGGCCCGGTTTATGGACAAGAGAGCGTCCGTCCGGGGGATAA

CGACCTGACCCGTCAGCACGAAGCTGAGCCGGTGGGGGAGCGGATTCTGGTGACGGGGCGCGTGACCGACGAAGACGGGCGGGGTGTCCCTAATACGCTGCTAGAGATCTGGCAGGCCAA

TGCCGCCGGTCGCTATATCCACAAGCTTGACCAGCATCTTGCCCCGCTTGATCCAAATTTCTCGGGGGCAGGGCGTACGGTTACGGGGGCTGATGGCTCTTATTCCTTCATCACGATCGT

GCCGGGCGCCTATCCGGTCGTGGGGCTGCACAATGTCTGGCGCCCGCGCCACATCCATGTGTCGTTGTTCGGTCCGTCCTTCGTGACCCGCTTGGTTACCCAGATATATTTCGAGGGCGA

TCCGCTGCTGAAATATGACACGATCTACAACACGGCGCCCGACATCTCGAAGCGCAGCATGGTGGCGCAGTTGGACATGGGCGCCACGCAATCCGAATGGGGCCTGACCTATCGCTTCGA

CATCGTTCTGCGTGGGCGCAACGGCAGCTATTTCGAGGAACCCCATGACCACTAAGACCCCACTGACCATCACCCCCTCGCAGACTGTCGGGCCTTTCTATGCCTATTGCCTGACCCCGG

AGGACTACGGGACGCTTCCACCGCTGTTCGGCGCGCAGCTTGCGACCGAGGACGCCGAAGGGGAACGGATTACGATCCAGGGAACGATCACGGACGGAGAGGGGGCCATGGTTCCCGATG

CCTTGATCGAGATCTGGCAGCCGGACGGGCAGGGGCGTTTTGCTGGAGCCCATCCAGAGCTGCGGAATTCGGCCTTCAAGGGCTTCGGGCGCCGCCACTGTGACAAAAGCGGAAACTTCA

GTTTCCAAACCGTGAAGCCTGGCCGGGTGCCCACTGCCGACGGCGTGATGCAGGCACCCCATATCGCTTTGTCGATCTTCGGCAAGGGATTGAACCGCCGGCTCTATACGCGGATCTACT

TCGCAGACGAGGCATCGAATGCCGAGGACCCCGTTCTGTCGATGCTGTCCGAGGATGAGCGCGTGACCCTGATCGCCACCTCTGAATCGCCCGCCGCATATCGCCTCGACATCCGCCTGC

AAGGCGACGGCGAAACGGTGTTTTTCGAGGCCTGAGTCGGCCGGCAAGTTTGCGGGGATCCGTCCGCCGCAATTGTGTTTCGCTATAGACGCCACGGCTGCCGCATGCCGCCGGGTGGAA

GGGCCTTGCAAGGCCTGTCAACGGCGGAGTAAAATCCGGCCAGGCGGCGGAGTAAAACCAGGCCACTTGTGGCCCACGCATGAGACACCCGGGAGGGCGTAGCCCAAGCGGGGGTCTCAT

GCGTGTGCGGCGGTTTTCTGGGGGTTCAGCCAGCCTTGCGGGCGCGGCTTTGAGCGAGACGATAGCTGTCGCCGTTCATCTCGAG

Page 44: SOLiD color space

Hasonlóság

CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC

CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC

a két szekvencia teljesen ugyanaz

Page 45: SOLiD color space

Hasonlóság

CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC

AAACTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC

GLOBÁLIS, LOKÁLIS

Most is - majdnem

BLASTN, FASTA

Page 46: SOLiD color space

ANALÓGIÁK - ADATBANKOK

Összahasonlítás már ismert elemekkel

Page 47: SOLiD color space

… és kódol-e fehérjét?

Open reading frames: nyitott leolvasási keretek

Áltában ATG-vel kezdődik, de opció

Hossz: ajánlás 100 aminosav, de opció

Az eredmény hipotetikus, össze kell vetni a valósággal

Hipotetikus fehérje lista hasonlóság BLASTP

Információból információ generálása

Problémák: frameshift mutáció, a globál hasonlóság csődje

Hol kezdődik? Mi a start?

Page 48: SOLiD color space

Egy régió nyitott leolvasási keret térképe

Page 49: SOLiD color space

Hol kezdődik?

2290 2300 2310 2320 2330 2340 GCCGCCCGCTGCCGTAGTGCGCTGGATCATGTGGCTCGTATTCTTGGACCCGCCTCTACC A A R C R S A L D H V A R I L G P A S T M W L V F L D P P L P

2350 2360 2370 2380 2390 2400 ATCGGATTTCAAGGAGGCTAATGACGTGACGACACTGTTTGAGGCGACGACCATCCCGAT I G F Q G G * S D F K E A N D V T T L F E A T T I P I

Ki tudja?

Egyéb elemek azonosítása,

genomi elrendeződés

Kísérletes ellenőrzés

Page 50: SOLiD color space

...a reálisabb kép, hasonlóság keresés után

Page 51: SOLiD color space

FRAME SHIFT MUTÁCIÓ - MEGOLDÁS

Minden leolvasásái keretben transzláció

Stop kodon nem számít

Mindent mindennel összehasonlít fehérje szinten

BLASTX

Page 52: SOLiD color space

In silico transzláció mind a 6 leolvasási keretben

Page 53: SOLiD color space

Genomi kontextus

NH3+

SO3-

OHOH

SO3-

COOCOO

SO3

O OCOO

SO3

COOCOO

O

-

-

-

-

- -

3HSO3

-

O2

szulfanilsav 4-szulfokatekol

szulfomukonát

szulfolakton

maleilacetát

TCA ciklus

+

P340 II dioxigenáz

szulfomukonát cikloizomeráz

szulfolakton hidroláz

maleilacetét reduktáz

gén

orf1

pcaB

orf2

macA

orf3

pcaH

pcaG

istB

funkcó

hipotetikus konzervált membrán protein, permeáz?

3-karboxi-cisz-cisz mukonát cikloizomeráz

feltételezett hidroláz

maleil acetát reduktáz

feltételezett oxidáz, dehidrogenáz NAD kötő domain

protokatekol-3,4 dioxigenáz béta alegység

protokatekol-3,4 dioxigenáz alfa alegység

hossz (aa)

259

~ 450

319

359

395

245

195

19 IS21 transzpozáz, C-terminális

homológia (%)

 45

40-45

40

45-55

 

80, 67, < 60

64, 61,

100

40-45

orf1 pcaB orf2 macA orf3 pcaH pcaG istB

pSC1/48 (7404bp)

MS azonosítás

Page 54: SOLiD color space

Kodon felhasználás, codon usage

Az élőlényekre jellemző a kodon felhasználási gyakoriság

Kodon felhasználási táblázatok, adatbankok

Page 55: SOLiD color space

Kodon felhasználás, codon usage

Page 56: SOLiD color space

Kodon felhasználás, eltérések

Page 57: SOLiD color space

Szekvenciák adatbankokba küldése

NCBI, Genbank

Rövid kontigok: BankIT

Hosszú szekvenciák: Sequin