basic statistical analysis (practical approach)

Introduction to Clinical Research Basic Statistical Analysis (Practical Approach) PhD course Introduction to Clinical Research University of Copenhagen, Bispebjerg University Hospital March 2013

Upload: vaughan-taylor

Post on 03-Jan-2016




1 download


Introduction to Clinical Research. Basic Statistical Analysis (Practical Approach). PhD course Introduction to Clinical Research University of Copenhagen, Bispebjerg University Hospital March 2013. Ingredients: Choice of method – what kind of data for the analysis - PowerPoint PPT Presentation


Page 1: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Introduction to Clinical Research

Basic Statistical Analysis(Practical Approach)

PhD course

Introduction to Clinical Research

University of Copenhagen, Bispebjerg University Hospital

March 2013

Page 2: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod


●Choice of method – what kind of data for the analysis●Normal Continouos Variable, 2 groups

●Paired - T-test●Unpaired – F-test and T-test

Normal Continouos Variable, more groupsANOVA

Dichotomous VariableChi-square test and fictive SD

●Spreadsheet, functions and macros

Page 3: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

80 100 120 140 160 180 200 220 240 2600










Best determination of mean value?

Page 4: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Where was the mean value determined best?

The precision, also intuitively, is dependent on the relation between ”height and width”.

These relations are described in the t- as well as the Chi2- and F-distributions

The t-distribution is used to evaluate the height-width relation when looking at the normal-distribution.

Page 5: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Page 6: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Paired data – evalution of medicine – NOT evaluation of population blood pressure (which is just ”noise”)

Person mmHg Before mmHg After Difference1 135 110 252 80 60 203 105 80 254 75 55 205 140 120 206 95 70 257 90 70 208 125 100 25

SD 24,99 24,04 2,67SEM 8,84 8,50 0,94Average 105,63 83,13 22,50

Page 7: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

60 70 80 90 100 110 120 130 1400










Fictive, illustrative curves with same SEM (no need for F-test), ”No overlap” (at 95% cut off), p-value <0.001

Page 8: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

T-test, paired5,85671E-008

Page 9: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Page 10: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Person (KBH) Person (GL)135 11080 60

105 8075 55

140 12095 7090 70

125 100SD 24,99 24,04SEM 8,84 8,50Average 105,63 83,13

Unpaired data – it is not possible to subtract GL persons from KBH persons

Page 11: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

60 70 80 90 100 110 120 130 1400










Fictive curves with different SEM (F-test needed!), overlap (at 95% cut off), p-value >0.05

Page 12: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

F-test T-test, unpaired

0,9214535572 0,0878279815

Page 13: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Page 14: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

ANOVA-test (Analysis Of Variance)●One variable and more than two groups (one way-ANOVA)

●Two or more varying parameters (two way-,Multivariate-ANOVA)

●One way-ANOVA with just two groups is the same as T-Test, whereas several T-test gives the risk of mass significans problems

Page 15: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Page 16: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Dichotomous Data analysis and test (Chi-Square Test)

Affected Not Affected Total Chi-Square TestExposed 80 20 100 4,8288776E-074Unexposed 15 85 100Total 63,3 36,7 100

Affected Not AffectedExposed a bUnexposed c d

Relative Risk (RR) for Affected when Exposed: a/(a+b)*(c+d)/c (= 5.33)SD for Ln(RR): Squareroot (1/a+1/c-1/(a+b)-1/(c+d))

Odds Ratio (OR) for Exposed when Affected: a/c*d/b (= 22.6)SD for Ln(OR): Squareroot (1/a+1/b+1/c+1/d)

Page 17: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

So now we've seen the different test end up with a p-value. So let's make sure we have the definition straight:


P-value: The Probability of getting the observed results (or more extreme) although the null-hypothesis is true.

Page 18: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Often, with more than one result, evaluate of those results statistically are performed even though any results except the primary endpoint only carry hypothesis generating potential.

With more results the is a risk of mass-significance. To avoid that a Bonferoni-correction is needed:

The Bonferoni-correction is the simplest correction for mass-significance and it is very conservative. It is only valid for evaluating significance, i.e. preventing Type I errors. Power will be lost using Bonferoni. Bonferoni is only usable with a little number of results (<30).

Page 19: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Example why Bonferoni-correction is needed:

P (for at least one significant result) = 1 – P (no significant result)↕P (for at least one significant result) = 1 – (1-0.05)20

↕P (for at least one significant result) = 0.64

How is Bonferoni-correction done:

Simple: The general significance level (alpha), must be divided by number of results evaluated, i.e. alpha

i = alpha/i

Page 20: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Going more into detail with the statistical analysis, you should consider:

Origin of noise and contribution to SD?

Type of noise. What is it indicating?

Page 21: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Is noise additive and what about SD then?

SDTotal=√(SD1 2+ SD22+ ...+ SDX 2 )


Page 22: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Now what if one of the noise components is systematic?

Bias (systematic noise) Random noise


Page 23: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

We can (try to) design the experiment away from bias

We can (try to) be skilled away from random noise


Page 24: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod

Tips, tricks and drop outs:

If at all possible, always show your original data e.g. in a graph or in a table.

In that way you have been as honest as possible to your findings and readers, who then, when viewing your data can decide for herself if she wants to believe it or not.

Many continouos data sets have a right skewed part of the distribution. This can often be ”corrected” to a normal distribution by log(data-points) – and then the T-, F- or ANOVA can be done.

Remember, all the statistical calculations are based on your own subjective asssumptions – do you believe the results yourself?

Page 25: Basic Statistical Analysis (Practical Approach)

For at ændre ”Enhedens navn” og ”Sted og dato”:

Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod