försöks- planering, forts– 1) minskning i kroppsarbete prediktion 1: Ökande skillnad mellan...
TRANSCRIPT
Försöks-planering, forts
Per Milberg, IFM biologi
Mån 31 mar 2014
1. Snabbrepetion
2. Datatyper
3. Frågeställning
4. Datahantering
5. “Felpinnar”
1a. Snabbrepetition 1
� Kunskapshanteringsexpert
� Försöksplanering & statistik: gäller alla (inte barablivande forskare)
� Försöksplanering– Optimera den statistiska styrkan
– Minimera risken för felslut
– Precisera frågeställningen
� Frågor av olika typ– Omöjliga, orealistiska, oprecisa frågor
– “Naturvetenskapliga frågor” = skall gå att besvara med tillgänglig metodik
1b. Snabbrepetition 2
� Naturvetenskapliga hypoteser
� Observation => tolkning (hypotes) => prediktion
� Viktsutveckligen hos yngre svenska män 1920=>– 1) Minskning i kroppsarbete
� Prediktion 1: Ökande skillnad mellan yrkesgrupper
– 2) Ökat födointag� Prediktion 2: Matportionernas storlek har ökat
– 3) Mer energirikt födointag� Prediktion 3: Matportionernas energiinnehåll har ökat
– 4) Speglar bara på en allmän ökning i kroppsstorlek� Prediktion 4: Om vi korrigerar data för kroppsstorleksökning (tex
kroppslängd, BMI) så ser vi inte längre någon ökning i vikt
1c. Snabbrepetition 3
� Precision kontra noggrannhet
– Dålig precision => ökad replikering (fler prov)
� Pilotförsök:– Praktiskta problem
– Tidsåtgång => kostnader
– Vilka koncentrationer; doser; tätheter...?
– Hur ser data ut (medelvärde, varians)? =>styrkeanalyser
hög precision låg precision hög precision låg precisionhög noggrannhet hög(?) noggrannhet låg noggrannhet låg noggrannhet
1d. Snabbrepetition 4
� Urval: population kontra stickprov– Population: Den ”grupp” du vill uttala dig om
– ”SIFOs senaste väljarbarometer visar att…”
– Stickprov: Den ”grupp” du undersöker
� Exempel: Könskvot i sal E324, 25/1 2013, 10.15-12– Sanna värdet: 33,33333333333333…% utgörs av män
– Stickprov 1 (stort N=15) => 40,0%
1d. Snabbrepetition 4
� Urval: population kontra stickprov– Population: Den ”grupp” du vill uttala dig om
– ”SIFOs senaste väljarbarometer visar att…”
– Stickprov: Den ”grupp” du undersöker
� Exempel: Könskvot i sal E324, 25/1 2013, 10.15-12– Sanna värdet: 33,33333333333333…% utgörs av män
– Stickprov 1 (stort N=15) => 40,0%
– Stickprov 2 (litet N=5) => 0,0%
– Stickprov 3 (litet N=5) => 60,0%
Mån 31 mar 2014
1. Snabbrepetion
2. Datatyper
3. Frågeställning
4. Datahantering
5. “Felpinnar”
2a. Olika typer av data� BIKUPA: Hitta på flera exempel på dessa båda datatyper
2a. Olika typer av data� p 34-36 i statistikboken
� Enormt stor betydelse!1. försöksplanering
2. val av analys
3. statistisk styrka
2b. Olika typer av data
� En del attribut/egenskaper är av en viss typ� kön, ögonfärg, HIV-positiv
� Andra attribut är svåra att mäta� Hårfärg, smärta, studenters uppfattning om en kurs
� Frestande/nödvändigt att använda klasser� Mörkhårig, ljushårig
� Svarthårig, blond, rödhårig
� Svarthårig, mörkblond, mellanblond, ljusblond
2c Olika typer av data� Fenomenet vi studerar är troligen
“kontinuerligt”, men vi väljer att klassa� Sjuk/frisk
� Antibiotikaresistent/icke-abr
� Aggresiv invasionsart/icke-aggresiv
� Problemhund/icke-problemhund
� Studenter är nöjda med kursen/icke-nöjda med kursen
� +/- data: minsta möjliga informationsvärde; gränsdragningsproblem
� Alltid bättre att (om möjligt) mäta än att klassa� Grumligt/Klart
� Grumligt/Halvgrumligt/Halvklart/Klart
� Absorbans vid 470 nm i en 10-mm kolonn
� Alltid bättre att (om möjligt) klassa i >2 grupper än i bara 1
Fre 15 feb 2013
1. Snabbrepetion
2. Datatyper
3. Frågeställning
4. Datahantering
5. “Felpinnar”
3b. Förfina frågeställningen 1
� Frågeställningen som redskap– Precisera
– Kommunicera
� Frågeställningar: “de glasögon genom vilka vi betraktar världen”
8h. Förfina frågeställningFall 4: Sprit och dagisbarn
� Sprit är ett billigt och effektivt desinfektionsmedel
� Men blir dagisbarnen verkligen friskare av att personalenanvänder sprit istället för tvål (som är billigare men mindreeffektivt)?
� Formulera en relevant forskningsbar frågeställningkring ovanstående
FrågeställningarSprit och dagisbarn
� “… determine if the use of alcohol-based hand-disinfection as a complement to regular hand washing by children and staff at DCCs can reduce the rate of childhood absenteeism.” Lennell et al. (2008) Acta Paediatrica 97, 1672–80
� “… evaluate the possibilities for reducing the transmission of infections by an infection prevention program. The program was introduced in 10 day care centers and 10 centers served as controls. … 15-month. Records were made of the occurrence of infections and absences among the children, parents and personnel.” Uhari et al. (1999) Pediatric Infectious Disease Journal 18, 672-677
Fre 15 feb 2013
1. Snabbrepetion
2. Datatyper
3. Frågeställning
4. Datahantering
5. “Felpinnar”
Konventioner kringdatahanterning: Protokoll
1)BIKUPA: För och nackdelarmed att ha ett genomtänktprotokoll (på papper, eller idatorn)?
Konventioner kringdatahanterning: Protokoll1) Protokoll• Sparar tid...
• i fält, växthus, eller lab• vid datorn
• “Snyggt och prydligt”• Bättre stöd för minnet• Lättare för andra att förstå & använda data
• Minskar risken att glömma...• objekt (tex en viss planta, eller patient)• variabel (tex antal blad, eller kroppsvikt)• avläsningstidpunkt
• Enkelt att göra i tex Excel
Konventioner kringdatahanterning: Datafil
1) Uppställningen kan ofta likna protokollets• Variabler (antal blad; kroppsvikt; ögonfärg; CFU) i kolumner• Objekt (planta; patient; petriskål) i rader• Logisk ordning: 1) löpnr, 2) datum, 3) expr beh, 4) respons,
5) uträknade variabler
Plant-ID Datum Behandling Höjd (cm) Antalblad
Internodlängd
1 1 april 2011 GA3, 0.1 2.1 3 0.70
2 1 april 2011 GA3, 1.0 3.2 3 1.08
3 1 april 2011 GA3, 10.0 4.6 4 1.15
4 1 april 2011 GA3, 0.1 2.4 3 0.80
... ... ...
Konventioner kringdatahanterning: Datafil
• Uppställningen kan ofta likna protokollets• Variabler (antal blad; kroppsvikt; CFU) i kolumner• Objekt (planta; patient; petriskål) i rader• Logisk ordning: 1) löpnr, 2) datum, 3) expr beh, 4) respons,
5) uträknade variabler
“Gibberellinets betydelse...”
• Upprepade mätningar på samma objekt (planta), specialfall=>
Plant-ID Beh. Höjd(cm)1 apr
Höjd(cm)4 apr
Höjd(cm)9 apr
#blad1 apr
#blad4 apr
#blad9 apr
Inter-nod1 apr
Inter-nod4 apr
Inter-nod9 apr
1 GA3, 0.1
2.1 3 0.70
2 GA3, 1.0
3.2 3 1.08
3 GA3, 10.0
4.6 4 1.15
4 GA3, 0.1
2.4 3 0.80
... ...
Botaniklaboration
•Flera laborationer•Hormon som påverkar tillväxt•“3. Gibberellinets betydelse för tillväxten”•Långtidsförsök•Komplext experiment•Genererar mycket data•Kontinuerliga data•Variansanalys
Nästa seminarium
� Deadline– 1) Labrapport (individuell)
– 2) Data (gruppvis)
– 3) Frågor på kapitel 4-5 (Ruxton & Colegrave) –individuellt, en diskutabel fråga per kapitel
� Seminariet– Diskkuterar
� (i) frågor på kapitel 4-5
� (ii) urval av era frågeställningar (labrapport)
� (iii) era redovisningar av resultat (labrapport)
� (iv) era resultat & slutsatser (övergripande)
Fre 15 feb 2013
1. Snabbrepetion
2. Datatyper
3. Frågeställning
4. Datahantering
5. “Felpinnar”
Konfidensintervall, “felpinnar”, felmarginal(error bars) i praktiken
� Beskriva variation i data (tex SD)
� Beskriva precision i estimat (texmedelvärde)
� Informell jämförelse av estimat
� =>oerhört användbart, vanligt & viktigt!
� NBIB44: tolkning� (“felpinnar” ord myntat av Laila Karlsson;
finns ej officiellt, än...; Ty: Fehlerbalken)
-0.4
0.0
0.4
0.8
1.2
Sant värde kontra stickprov: andel män i E324
Sant värde: 33.3%
Prov 1: 40%
Prov 2: 0%
Prov 3: 60%
Osäkerhet, som ökar med minskade provstorlek
Sant värde kontra stickprov: andel män i E324
Sant värde: 33.3%
Prov 1: 40%
Prov 2: 0%
Prov 3: 60%
Osäkerhet, som ökar med minskade provstorlek
Hastighet (miles per hour)
40,4 km/h
Felpinnar i praktiken 2
� Konfidensintervall (CI)
� Standardfel (SE; standard error)
� Standardavvikelse (SD; standard deviation)
� Boxplot
� Range graph
-0.4
0.0
0.4
0.8
1.2
Felpinnar i praktiken 3
� Standardavvikelse (SD): spridningen idata
� Standardfel (SE): precision i estimat(tex medel)
� SE=SD/(sqrt(N))
-0.4
0.0
0.4
0.8
1.2
Felpinnar i praktiken 4
� SE=SD/(sqrt(N))
� SD oberoende av N
� SE minskar med N
-0.4
0.0
0.4
0.8
1.2
Felpinnar i praktiken 5
� SE=SD/(sqrt(N))
� CI95%~2*SE
� För att kunna tolka måste vi veta vadpinnarna illustrerar
� Hädanefter 95%-konfidensintervall
-0.4
0.0
0.4
0.8
1.2
Jämföravärden
Rule of thumb for CI95%:
� If the overlap is about half of one one-sided error bar, the difference is sign at ~ p <0.05
� If the error bars just about meet, the difference is sign at ~ P<0.01
� Works if N>10
Cumming & Finch, 2005
Cumming G et al. J Cell Biol 2007;177:7-11© 2007 Rockefeller University Press
Tolkning av felpinnarFall 1: Ogräskonkurens
� Effekt av närvaro avogräs på biomassanav hirs.
� Referenslinjen ärbiomassa utan ogräs.
� Felpinnarna ärkonfidensintervall96%
Parthenium Tagetes Verbesina0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.21
0.22
Ave
rage
bio
mas
s so
rghu
m (
g)
Tolkning av felpinnarFall 2: Ogräsbekämpning i Etiopien
� Relativ mängd (%) biomassa av parthenium efter 5 metoder förogräskontroll jämfört med obehandlad kontroll. Försöketutfördes på två platser (Babile, Dire Dawa). Horisontal linje iboxen är medel, boxen inkluderar ±1 SE, och de vertikalapinnarna KI95%
� Hoeing=hackning; Smother=täckgröda; 2,4-D=herbicid