![Page 1: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/1.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
1
Größenbestimmung bei MicroarrayexperimentenKlassenvergleiche und Classifier
![Page 2: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/2.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
2
Microarrays
• Dienen zur Erkennung von Expressionsprodukten.
• Platten aus Glas, Silizium etc.• Enthalten die Gene des Organismus.• Position jedes Gens auf Platte ist bekannt.
![Page 3: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/3.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
3
Versuchsablauf• Transkriptionsprodukte (Targets) werden
auf das MA gegeben. Diese sind mit Fluoreszenz-Markern versehen.
• Binden der Targets an den komplementären Strängen auf dem MA.
• Waschen um nicht oder unzureichend gebundene Targets zu entfernen.
![Page 4: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/4.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
4
Auswertung• Farbstoffe werden durch Laser zum
Leuchten gebracht. • Scannen des Bildes.• Normalisierung. • Fehlerbeseitigung• Erstellen der Genexpressionsmatrix.
![Page 5: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/5.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
5
Warum Versuchsgrößenbestimmung?
• Beschränkungen durch:– Finanzmittel– Zeit– Vorhandene Proben
![Page 6: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/6.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
6
Klassen-Vergleiche
• Vergleich von zwei Gewebetypenz.B.:
- Krebsgewebe normales Gewebe- histologisch verschiedene Krebsgewebe
• Ziel ist es, unterschiedliche Gen-Expressionen zu identifizieren.
![Page 7: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/7.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
7
Verschiedene MA-Versuchstypen
• Single Label/ Double Label– Pooling– Dye Swap– Nutzen von technischen Replikaten
![Page 8: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/8.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
8
Single Label Arrays
• DNA – Oligonukleotid MAs (Affymetrix)• Nur Targets einer Zelle• Hohe Spotdichte• teuer
![Page 9: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/9.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
9
Notation• Floureszens-Intensität: Ygadvfs
– g :1,2,...G | Gen– a :1,...,n | Array– d : 1 = Single Label; 2 = double Label | Farbe– v : 1,2 | Phänotypen– f : 1,2,...F | Individuen– s : 1,2,...m | Unterprobe/technisches Replikat
![Page 10: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/10.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
10
Single Label MAs
• Log (Ygadvfs) = Gg + GVgv + (GF)gf(v) + gadvfs
– Gg = Genexpression von g in der Population
– GVgv = Effekt der Klasse oder des Typs
– (GF)gf(v) = individueller Effekt gadvfs = unabh. Fehler mit Normal(0, )
2x
![Page 11: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/11.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
11
),σNormal(
Normaly
mlnkyw
Normal
Normalx
mjnixz
kl
xk
klkykl
ij
xi
ijixij
2
2
2
2
fsg2fsfsg1fs
0~
),0(~
..1;...1;
),0(~
),0(~
..1;...1;
w Y , z Y
Single Label MAs
![Page 12: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/12.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
12
Varianz e technisch
Varianz ebiologisch
Entdeckte negativfalsch Entdeckte positvfalsch zchschnitteKlassendurder Distanz
Sample pro Replikateer technischAnzahl msMicroarray benötigtenan Anzahl totalen
)(][4
2
2
/2
2222/
g
g
gg
z
mzz
mn
Single Label MAs
![Page 13: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/13.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
13
Single Label MAs
Samplesdlichen unterschie biologischder Anzahl /
)(][4/2
222/
mnm
zzmn g
g
![Page 14: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/14.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
14
Dual Label Arrays
• cDNA MAs• Targets von 2 Zellen. Dies erleichtert einen
direkten Vergleich• Teilweise geringe Spotdichte
![Page 15: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/15.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
15
Dual Label MAs
• Log (Ygadvfs) = Gg + GAga + GDgd + GVgv+ (GF)gf(v) + gadvfs
– Gg = Genexpression von g in der Population– GAga = Spot auf Array– GDgd = Effekt des Färbemittels– GVgv = Effekt der Klasse oder des Typs – (GF)gf(v) = individueller Effekt gadvfs = unabh. Fehler mit Normal(0, )
2x
![Page 16: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/16.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
16
Dual Label MAs
• Referenz Design:
A1
R
A2
R
B1 B2
R R
![Page 17: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/17.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
17
Dual Label MAs
• Reference Design
Muss aus vorherigen Daten geschätzt werden.
Klassen.der einer innerhalb Varianz 2
)2(][4
22
2222/
gg
gg
zzn
![Page 18: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/18.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
18
Dual Label MAs
• Design mit technischen Replikaten und Dye Swap:
)2
(][42
222/
mzz
mn gg
![Page 19: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/19.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
19
Dual Label MAs
α = 0,001β = 0,05δ = 1
VarianzVerhältnis
technische Replikate /Sample
Anzahl benötigter Arrays
Anzahl benötigter Samples
2 1 49 49 2 74 37 3 99 33 4 124 314 1 49 49 2 82 41 3 114 38 4 148 37
![Page 20: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/20.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
20
Dual Label Mas
.Replikatenhnischen keinen tec bei n Anzahl zur Verhältnis im Replikaten m bei
Arrays Benötigtender Anzahl dieist n
]2)/(2)/(
[
1
m
22
22
1
gg
ggm
mnn
![Page 21: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/21.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
21
Dual Label MAs
• Block Design:
A2 A3
B2
A1
B1
A4
B3 B4
![Page 22: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/22.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
22
Dual Label MAs
• Balanced Block Design– Leichter Vergleich von 2 Klassen.– Weniger Arrays benötigt.– unflexibel
)2()( 22
2,2
1,
2
22/
ggg
zzn
![Page 23: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/23.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
23
Dual Label MAs
• Single Paired Design– Natürliche biologische Paarungen ( z.B. von
Individuum vor und nach einer Behandlung).– Je eine Seite mit einer Farbe pro Probe.
– η an Stelle von τ. Varianz des veränderten Gewebes (z.B. Tumor) zum normalen Gewebe.
)2()( 22
2
22/
ggbalanced
zzn
![Page 24: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/24.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
24
Dual Label MAs
• Dye-Swap Paired Design– Die gleichen Targets wie Single Paired Design.– Die gleichen Arrays werden nocheinmal mit
dem jeweils anderen Fluoreszensstoff ausgewertet.
)2()( 22
2
22/
ggdyeswap
zzn
![Page 25: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/25.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
25
Prognostic Markers• Finden von Genen oder Genklassen, die bei
einer Krankheit exprimiert werden.
![Page 26: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/26.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
26
Prognostic Markers
• Effekt von Pooling
• Mehr Samples weniger Arrays
Samplesen biologischen unabhängigan Anzahl
)2
()(
4222
22/
kmk
zzmn gg
![Page 27: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/27.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
27
Prognostic Markers
• α = Wahrscheinlichkeit für falsch positive Entdeckung.
• 1-β = Wahrscheinlichkeit richtig positive Entdeckung.
• Problem: Wie wählt man α?
![Page 28: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/28.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
28
Prognostic Markers
Genenan Anzahl GGeneen exprimiert andersder Anteil
)1(1
Entdeckte richtig #Entdecktefalsch #
]##
#[
GE[#TD]
π)Gα(E[#FD] FDFD
TDFDFDEFDR
![Page 29: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/29.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
29
Prognostic Markers
![Page 30: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/30.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
30
Prognostic Markers
![Page 31: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/31.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
31
Training eines Classifiers
• Ein Classifier soll Gene als Prognostic Marker erkennen.
![Page 32: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/32.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
32
Training eines Classifiers
• Bedingung: Solle wenige Samples brauchen• Lösung: Sequentielle Bestimmung• Vorteile
– Lernt durch eigene Erfahrung.– Stopp-Kriterium wird bei jedem Schritt
überprüft.– Erzielen der gewünschten Signifikanz garantiert– Mit jeder Klassifikationsmethode einsetzbar.
![Page 33: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung](https://reader035.vdocuments.net/reader035/viewer/2022062818/570491c41a28ab14218d9f61/html5/thumbnails/33.jpg)
Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler
Sebastian Bremm
33
Training eines Classifiers
N
ii
N
N
ii
N
QN
k
NQN
kzN
1
1
^
0
2
1
1
^
1
0
0
,min