exercices de statistique 2006

Upload: ayoub-khairany

Post on 04-Apr-2018

221 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/29/2019 Exercices de Statistique 2006

    1/124

    Dpartement de Mathmatiques et Informatique

    E x er c i c es Cor r i g s

    Abdelhamid El MossadeqProfesseur lEHTP

    2006-2007

  • 7/29/2019 Exercices de Statistique 2006

    2/124

    A. El MossadeqJuin 2006

  • 7/29/2019 Exercices de Statistique 2006

    3/124

    TABLE DES MATIERES

    Structures Statistiques et Estimation 1

    Les Procdures Usuelles des Tests dHypothses : 1. Les Frquences 45

    Les Procdures Usuelles des Tests dHypothses :2. Les Tests du Khi-Deux 61

    Les Procdures Usuell es des Tests dHypothses :3. Moyennes et Variances 95

  • 7/29/2019 Exercices de Statistique 2006

    4/124

  • 7/29/2019 Exercices de Statistique 2006

    5/124

    Structure Statistique et

    Estimation

  • 7/29/2019 Exercices de Statistique 2006

    6/124

  • 7/29/2019 Exercices de Statistique 2006

    7/124

    A. El Mossadeq Structures Statistiques et Estimation

    Exercice 1Dterminer et tudier les proprits de lestimateur du maximum de vraisemlancedun r -chantillon pour :

    1. le paramtre p dune loi de Bernouilli2. le paramtre p dune loi geometrique3. le paramtre p dune loi binomiale dordre n4. le paramtre dune loi de Poisson

    5. le paramtre dune loi exponentielle6. les paramtres et 2 dune loi normale7. le paramtre dune loi uniforme sur lintervalle [0, ]

    Solution 11. Soit X une variable alatoire de Bernouilli de paramtre p.

    Pour tout x

    {0, 1}, la probabilit lmentaire p (x) de x est :

    p(x) = px (1 p)1 x

    de plus :

    E [X ] = p

    V [X ] = p (1 p)

    (a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p

    [0, 1] et tout

    (x1,...,x r ){0, 1}r

    par :

    L ( p; x1,...,x r ) =r

    Yi=1 p(xi )= p

    r

    Pi =1 x i (1 p)r

    r

    Pi =1 x ido :

    ln L ( p; x1,...,x r ) = r

    Xi=1 x i!ln p + r r

    Xi=1 x i!ln(1 p)

    3

  • 7/29/2019 Exercices de Statistique 2006

    8/124

    Structures Statistiques et Estimation A. El Mossadeq

    Il en rsulte que :

    p

    ln L ( p; x1,...,x r ) =

    r

    Pi=1 xi

    p r

    r

    Pi=1 xi

    1 pdo :

    p

    ln L ( p; x1,...,x r ) = 0 = p =1r

    r

    Xi=1 x iet comme :

    2

    p2ln L ( p; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Bernouilli est :

    p =1r

    r

    Xi=1 X iCest la frquence empirique du r -chantillon.

    (b) Etude des proprits de p :Puisque :

    E [ p] = E [X ]

    = pet :

    V [ p] =V [X ]

    r

    =p (1 p)

    rOn en dduit que p est un estimateur sans biais et convergent du paramtre p dune loi de Bernouilli.

    2. Soit X une variable alatoire de gomtrique de paramtre p.Pour tout x

    N , la probabilit lmentaire p (x) de x est :

    p(x) = p (1 p)x 1

    de plus :

    E [X ] =1 p

    V [X ] =1 p p2

    4

  • 7/29/2019 Exercices de Statistique 2006

    9/124

    A. El Mossadeq Structures Statistiques et Estimation

    Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p

    [0, 1] et tout (x1,...,x r )

    (N )r par :

    L ( p; x1,...,x r ) =r

    Yi=1 p(xi )= pr (1 p)

    r

    Pi =1 x i rdo :

    ln L ( p; x1,...,x r ) = r ln p + r

    Xi=1

    x i!r ln(1 p)Il en rsulte que :

    p

    ln L ( p; x1,...,x r ) =r p

    r

    Pi=1 xi r1 p=

    r pr

    Pi=1 xi p(1 p)do :

    p ln L ( p; x1,...,x r ) = 0 = p =

    rr

    Pi=1 x iet comme : 2

    p2ln L ( p; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture gomtrique est :

    p =r

    r

    Pi=1

    X i

    Cest linverse de la moyenne empirique du r -chantillon.

    3. Soit X une variable alatoire binomiale dordre n et de paramtre p.pour tout x

    {0, 1,...,n }, la probabilit lmentaire p (x) de x est :

    p(x) = C (n, x ) px (1 p)n x

    5

  • 7/29/2019 Exercices de Statistique 2006

    10/124

    Structures Statistiques et Estimation A. El Mossadeq

    de plus :

    E [X ] = np

    V [X ] = np (1 p)

    (a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p

    [0, 1] et tout

    (x1,...,x r ){0, 1,...,n }r par :

    L ( p; x1,...,x r ) =

    r

    Yi=1 p(xi )

    = "r

    Yi=1 C (n, x i )# pr

    Pi =1 x i (1 p)rn

    r

    Pi =1 x i

    do :

    ln L ( p; x1,...,x r ) = lnr

    Yi=1 C (n, x i ) +r

    Xi=1 x i ln p + rn r

    Xi=1 x i!ln(1 p)Il en rsulte que :

    p

    ln L ( p; x1,...,x r ) =

    r

    Pi=1 xi p rn

    r

    Pi=1 x i1 p=

    r

    Pi=1 xi rnp p(1 p)do :

    p

    ln L ( p; x1,...,x r ) = 0 = p =1

    rn

    r

    Xi=1

    xi

    et comme : 2

    p2ln L ( p; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de binomiale est :

    p =1

    rn

    r

    Xi=1 X i

    6

  • 7/29/2019 Exercices de Statistique 2006

    11/124

    A. El Mossadeq Structures Statistiques et Estimation

    (b) Etude des proprits de p :Puisque :

    E [ p] =1n

    E [X ]= p

    et :

    V [ p] =V [X ]rn 2

    =p (1 p)

    rnon en dduit que p est un estimateur sans biais et convergent de p.

    4. Soit X une variable alatoire de Poisson de paramtre .Pour tout x

    N , la probabilit lmentaire p (x) de x est :

    p(x) = x

    x!exp

    de plus :

    E [X ] =

    V [X ] = (a) Recherche du maximum de vraisemlance :

    Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout(x1,...,x r )

    N r par :

    L (; x1,...,x r ) =r

    Yi=1 p(xi )

    =

    r

    Pi =1 x ix1!...x r ! exp r

    do :

    ln L (; x1,...,x r ) = ln (x1!...x r !) +r

    Xi=1 xi ln rIl en rsulte que :

    ln L (; x1,...,x r ) =

    r

    Pi=1 xi r

    7

  • 7/29/2019 Exercices de Statistique 2006

    12/124

    Structures Statistiques et Estimation A. El Mossadeq

    do :

    ln L (; x1,...,x r ) = 0 = p =1r

    r

    Xi =1 x iet comme :

    2

    2ln L (; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Poisson est :

    =1r

    r

    Xi=1

    X i

    Cest la moyenne empirique du r -chantillon.

    (b) Etude des proprits de :Puisque :

    E [ ] = E [X ]=

    et :

    V [] =V [X ]

    r=

    r

    On en dduit que est un estimateur sans biais et convergent de .

    5. Soit X une variable alatoire exponentielle de paramtre .Sa densit de probabilit f est d nie par :

    f (x) =

    0 si x 0

    exp x si x > 0de plus :

    E [X ] =1

    V [X ] =12

    Considrons un r -chantillon de cette structure.

    8

  • 7/29/2019 Exercices de Statistique 2006

    13/124

    A. El Mossadeq Structures Statistiques et Estimation

    Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )dans R r , tous strictement positifs, par :

    L (; x1,...,x r ) =r

    Yi=1 f (x i )= r exp

    r

    Xi=1 xido :

    ln L (; x1,...,x r ) = r ln r

    Xi=1 x iIl en rsulte que :

    ln L (; x1,...,x r ) =r

    r

    Xi=1 xido :

    ln L (; x1,...,x r ) = 0 = =r

    r

    Pi=1 xiet comme : 2

    2 ln L (; x1,...,x r ) < 0donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture exponentielle est :

    =r

    r

    Pi=1 X iCest linverse de la moyenne empirique du r -chantillon.6. Soit X une variable alatoire normale de paramtres et 2.

    Sa densit de probabilit f est d

    nie pour tout xR

    par :f (x) =

    1 2 exp

    122

    (x )2

    de plus :

    E [X ] =

    V [X ] = 2

    9

  • 7/29/2019 Exercices de Statistique 2006

    14/124

    Structures Statistiques et Estimation A. El Mossadeq

    (a) Recherche du maximum de vraisemlance :

    Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout

    R , tout > 0 et

    tout (x1,...,x r )R r par :

    L (, ; x1,...,x r ) =r

    Yi=1 f (xi )=

    1

    2r exp

    122

    r

    Xi=1 (xi )2

    do :

    ln L (, ; x1,...,x r ) = r ln 2 r ln 1

    22

    r

    Xi=1 (x i )2

    Il en rsulte que :

    L (, ; x1,...,x r ) =12

    r

    Xi=1 (xi ) L (, ; x1,...,x r ) = r + 13

    r

    Xi=1 (xi )2

    do :

    L (, ; x1,...,x r ) = 0

    L (, ; x1,...,x r ) = 0

    =

    =1r

    r

    Xi=1 x i2 =

    1r

    r

    Xi=1

    (xi )2

    Donc les estimateurs du maximum de vraisemblance dun r -chantillondune structure normale est :

    =1r

    r

    Xi=1 X i2 =

    1r

    r

    Xi=1 (X i )2

    10

  • 7/29/2019 Exercices de Statistique 2006

    15/124

    A. El Mossadeq Structures Statistiques et Estimation

    (b) Etude des proprits de et :On a :

    E [] = E [X ]=

    et :

    E 2

    =r 1

    rV [X ]

    =r 1

    r2

    On en dduit que est un estimateur sans biais et convergent de , mais est un estimateur biais de .

    7. Soit X une variable alatoire uniforme sur lintervalle [0, ].Sa densit de probabilit f est d nie pour tout x

    [0, ] par :

    f (x) =

    1

    si x

    [0, ]

    0 si x /

    [0, ]

    de plus :

    E [X ] = 2

    V [X ] =2

    12Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )[0, ]r :

    L (; x1,...,x r ) =r

    Yi=1

    f (x i )

    =1r

    La fonction :

    L (; x1,...,x r )est strictement dcroissante, donc elle atteint son maximum lorsque est min-imum.Et comme :

    i

    {1,...,r } : xi

    11

  • 7/29/2019 Exercices de Statistique 2006

    16/124

    Structures Statistiques et Estimation A. El Mossadeq

    donc est minimum lorsque :

    = max( x1,...,x r )Donc lestimateur du maximumde vraisemblance dun r -chantillon dune struc-ture uniforme est :

    = max( X 1,...,X r )

    Exercice 2Soit X une variable alatoire dont la densit de probabilit f est d nie par :

    f (x) =

    1

    exp x si x > 00 si x 0

    o est un paramtre rel strictement positif.

    1. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillonde variable parente X .

    2. est-il un rsum exhaustif ?3. Calculer lesprance mathmatique et la variance de .

    Que peut-on conclure ?4. Calculer la quantit dinformation de Fisher .

    En dduire que est efficace.

    Solution 2Soit X une variable alatoire exponentielle dont la densit de probabilit f est d niepour tout x, x > 0, par :

    f (x) =

    1 exp x si x > 00 si x 0

    o est un paramtre rel strictement positif.On a :

    E [X ] =

    V [X ] = 2

    12

  • 7/29/2019 Exercices de Statistique 2006

    17/124

    A. El Mossadeq Structures Statistiques et Estimation

    1. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )

    R r , tous strictement positifs, par :

    L (; x1,...,x r ) =r

    Yi=1 f (x i )=

    1r

    exp

    r

    Pi=1 xido :

    ln L (; x1,...,x r ) = r ln

    r

    Pi=1

    xi

    Il en rsulte que :

    ln L (; x1,...,x r ) = r

    +

    r

    Pi=1 xi2do :

    ln L (; x1,...,x r ) = 0 = =1r

    r

    Xi=1 x iet comme :

    2

    2ln L (; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture exponentielle est :

    =1r

    r

    Xi=1 X iCest la moyenne empirique du r -chantillon.

    2. Pour tout , > 0, et tout (x1,...,x r )R r , tous strictement positifs, on a :

    L (; x1,...,x r ) =1r

    exp

    r

    Pi=1 xi=

    1r

    exp r (x1,...,x r )

    13

  • 7/29/2019 Exercices de Statistique 2006

    18/124

    Structures Statistiques et Estimation A. El Mossadeq

    Daprs le thorme de factorisation, est un rsum exhaustif puisque :

    L (; x1,...,x r ) = g; (x1,...,x r )h (x

    1,...,x r )o :

    g; (x1,...,x r )=1r

    exp r (x1,...,x r )

    et :

    h (x1,...,x r ) = 1

    3. Comme :

    =1

    r

    r

    Xi=1X i

    alors :

    E hi = E [X ]= et :

    V hi =V [X ]

    r

    =2

    rOn en dduit que est un estimateur sans biais et convergent de .

    4. Calculons la quantit dinformation de Fisher , I [X, ], concernant .On a :

    I [X, ] = E 2

    2ln f (, X )

    = E 2

    2 ln X = E

    1

    2+

    2X

    3 = 12Donc la quantit dinformation de Fisher , I [X 1,...,X r , ], concernant fourniepar le r -chantillon est :

    I [X 1,...,X r , ] = rI [X, ]

    =r2

    14

  • 7/29/2019 Exercices de Statistique 2006

    19/124

    A. El Mossadeq Structures Statistiques et Estimation

    Calculons lefficacit e

    h

    ide ..

    On a :

    ehi =1

    I [X 1,...,X r , ]V hi= 1donc, est efficace.

    Exercice 3

    Soit X une variable alatoire dont la densit de probabilit f est d

    nie par :

    f (x) =

    0 si x 0k

    xk 1 exp x

    si x > 0

    o est un paramtre rel strictement positif , k un entier naturel non nul et uneconstante rel.

    1. Dterminer la constante .2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon

    de variable parente X .3. est-il un rsum exhaustif ?4. Calculer lesprance mathmatique et la variance de .

    Que peut-on conclure ?5. Calculer la quantit dinformation de Fisher .

    En dduire que est efficace.

    Solution 3

    La densit de probabilit de la variable alatoire X est d

    nie par :

    f (x) =

    0 si x 0k

    xk 1 exp x

    si x > 0

    Rappelons que pour tout k

    N :

    Z +

    0uk exp udu = k!

    15

  • 7/29/2019 Exercices de Statistique 2006

    20/124

    Structures Statistiques et Estimation A. El Mossadeq

    1. Ainsi :

    Z +

    f (x) dx = Z

    +

    0

    k x

    k

    1 exp x dx

    = Z +

    0u k 1 exp udu

    = (k 1)!do

    =1

    (k 1)!puisque :

    Z +

    f (x) dx = 1

    De plus :

    E [X ] = Z +

    xf (x) dx

    = Z +

    0

    1(k 1)!

    k xk exp

    x

    dx

    = k

    et :E X

    2

    = Z +

    x2f (x) dx

    = Z +

    0

    1(k 1)!

    k xk +1 exp

    x

    dx

    = k (k + 1) 2

    do :

    V [X ] = E

    X 2

    E [X ]

    2

    = k2

    2. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r ) R r ,tous strictement positifs, par :

    16

  • 7/29/2019 Exercices de Statistique 2006

    21/124

    A. El Mossadeq Structures Statistiques et Estimation

    L (; x1,...,x r ) =

    r

    Yi =1 f (xi )=

    1[(k 1)!]

    r rk(x1...x r )k

    1 exp

    r

    Pi=1 xido :

    ln L (; x1,...,x r ) = r ln (k 1)! ln (x1...x r )k 1

    rk ln

    r

    Pi=1 xiIl en rsulte que :

    ln L (; x1,...,x r ) = rk

    +

    r

    Pi=1 xi2do :

    ln L (; x1,...,x r ) = 0 = =1

    rk

    r

    Xi=1 x iet comme :

    2

    2 ln L (; x1,...,xr ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :

    =1

    rk

    r

    Xi=1 X i3. Pour tout , > 0, et tout (x1,...,x r )

    R r , tous strictement positifs, on a :

    L (; x1,...,x r ) =

    1

    [(k 1)!]r rk(x

    1...x r )k

    1 exp

    r

    Pi=1

    x i

    =1

    [(k 1)!]r rk

    (x1...x r )k 1 exp

    rk (x1,...,x r )

    Daprs le thorme de factorisation, est un rsum exhaustif puisque :

    L (; x1,...,x r ) = g; (x1,...,x r )h (x1,...,x r )

    17

  • 7/29/2019 Exercices de Statistique 2006

    22/124

    Structures Statistiques et Estimation A. El Mossadeq

    o :

    g; (x1,...,x r )=

    1rk exp

    rk (x1,...,x r )

    et :

    h (x1,...,x r ) =1

    [(k 1)!]r (x1...x r )

    k 1

    4. Puisque :

    =1

    rk

    r

    Xi=1 X ialors :

    E hi= 1k E [X ] = et :V hi=

    V [X ]rk 2

    =2

    rkOn en dduit que est un estimateur sans biais et convergent de .

    5. Calculons la quantit dinformation de Fisher , I [X, ], concernant .On a :

    I [X, ] =

    E

    2

    2 ln f (, X )

    = E 22 ln (k 1)! + (k 1)ln X k ln X = E k2 + 2X 3 =

    k2

    Donc la quantit dinformation de Fisher , I [X 1,...,X r , ], concernant fourniepar le r -chantillon est :

    I [X 1,...,X r , ] = rI [X, ]=

    rk2

    Calculons lefficacit ehide ..On a :ehi=

    1

    I [X 1,...,X r , ]V hi= 1

    18

  • 7/29/2019 Exercices de Statistique 2006

    23/124

    A. El Mossadeq Structures Statistiques et Estimation

    donc, est efficace.

    Exercice 4Soit X une variable alatoire dont la densit de probabilit f est d nie par :

    f (x) =

    0 si x /

    [0, ]

    1

    si x

    [0, ]

    o est un paramtre rel.

    1. Dterminer la fonction de rpartition de X.2. Calculer la quantit dinformation de Fisher.3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon

    de variable parente X .4. Calculer lesprance mathmatique et la variance de .

    Que peut-on conclure ?5. Dans le cas o est bias, proposer un estimateur sans biais de .

    Solution 41. La fonction de rpartition F de X est d nie pour tout x

    R par :

    F (x) = Z x

    f (t) dt

    do :

    F (x) =

    0 si x 0x

    si 0 x 1 si x

    de plus :

    E [X ] =2

    V [X ] =2

    122. Puisque le domaine D :

    D = {xR |f (x) > 0}

    = [0, ]

    19

  • 7/29/2019 Exercices de Statistique 2006

    24/124

    Structures Statistiques et Estimation A. El Mossadeq

    dpend de , donc la quantit dinformation de Fisher nexiste pas.

    3. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )[0, ]r :

    L (; x1,...,x r ) =r

    Yi=1 f (x i )=

    1r

    La fonction :

    L (; x1,...,x r )

    est strictement dcroissante, donc elle atteint son maximum lorsque est min-imum.Et comme :

    i

    {1,...,r } : xiIl en rsulte que est minimum lorsque :

    = max( x1,...,x r )

    Donc lestimateur du maximumde vraisemblance dun r -chantillon dune struc-ture uniforme est :

    = max( X 1,...,X r )

    4. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.

    (a) Fonction de rpartition de :

    20

  • 7/29/2019 Exercices de Statistique 2006

    25/124

    A. El Mossadeq Structures Statistiques et Estimation

    Pour tout u

    R on a :

    F (u) = P h < ui= P [max(X 1,...,X r ) < u ]

    = P [X 1 < u,...,X r < u ]

    =r

    Yk =1 P [X k < u ]= [F (u)]r

    =

    0 si u 0

    u

    r

    si 0

    u

    1 si u

    21

  • 7/29/2019 Exercices de Statistique 2006

    26/124

    Structures Statistiques et Estimation A. El Mossadeq

    (b) Densit de probabilit de :Pour tout u

    R

    {0, } on a :

    f (u) =d

    duF (u)

    =

    0 si u /

    ]0, [

    rur 1

    rsi u

    ]0, [

    (c) Esprance mathmatique de :

    E hi = Z R uf (u) du= Z

    0r

    ur

    rdu

    =r

    r + 1

    (d) Esprance mathmatique de 2

    :

    E

    h

    2

    i= Z R u2f (u) du= Z

    0r ur +1

    rdu

    =r

    r + 22

    (e) Variance de :

    V hi = E h2

    iE hi2

    =r

    (r + 1) 2 (r + 2)2

    Lestimateur de est biais, mais il est asymptotiquement sans biais.

    5. Considrons lestimateur :

    T =r + 1

    r

    Alors :

    E [T ] =r + 1

    rE hi=

    22

  • 7/29/2019 Exercices de Statistique 2006

    27/124

    A. El Mossadeq Structures Statistiques et Estimation

    et :

    V [T ] = r + 1

    r 2

    V hi= 1r (r + 2)

    2

    T est donc un estimateur sans biais et convergent de .

    Exercice 5Soit X une variable alatoire dont la densit de probabilit f est d nie par :

    f (x) =

    0 si x <

    exp( x) si x o est un paramtre rel.

    1. Dterminer la fonction de rpartition de X.2. Calculer la quantit dinformation de Fisher.3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon

    de variable parente X .4. Calculer lesprance mathmatique et la variance de .

    Que peut-on conclure ?5. Dans le cas o est bias, proposer un estimateur sans biais de .

    Solution 51. La fonction de rpartition F de X est d nie pour tout x

    R par :

    F (x) = Z x

    f (t) dt

    do :

    F (x) =

    0 si x 1 exp( x) si x

    de plus :

    E [X ] = + 1

    V [X ] = 1

    23

  • 7/29/2019 Exercices de Statistique 2006

    28/124

    Structures Statistiques et Estimation A. El Mossadeq

    2. Puisque le domaine D :

    D = {xR |f (x) > 0}

    = [, + [dpend de , donc la quantit dinformation de Fisher nexiste pas.

    3. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout

    R , et tout (x1,...,x r )([, + [)

    r :

    L (; x1,...,x r ) =

    r

    Yi=1 f (xi )

    = expr

    Xi=1 ( xi )La fonction :

    L (; x1,...,x r )est strictement croissante, donc elle atteint son maximum lorsque est maxi-mum.Et comme :

    i

    {1,...,r } : xiIl en rsulte que est maximum lorsque :

    = min( x1,...,x r )

    Donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :

    = min( X 1,...,X r )

    4. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.

    24

  • 7/29/2019 Exercices de Statistique 2006

    29/124

    A. El Mossadeq Structures Statistiques et Estimation

    (a) Fonction de rpartition de :

    Pour tout v

    R on a :

    F (v) = P h < vi= P [min(X 1,...,X r ) < v ]= 1 P [min(X 1,...,X r ) v]= 1 P [X 1 v,...,X r v]= 1

    r

    Yk =1

    P [X k v]

    = 1 r

    Yk =1 (1 P [X k < v ])= 1 [1F (v)]

    r

    =

    0 si v 1 exp r ( v) si v

    (b) Densit de probabilit de :

    Pour tout u

    R {} on a :f (v) =

    ddv

    F (v)

    =

    0 si v <

    r exp r ( v) si v >

    (c) Esprance mathmatique de :

    E hi = Z R vf (v) dv= Z

    +

    rv exp r ( v) dv

    = +1r

    25

  • 7/29/2019 Exercices de Statistique 2006

    30/124

    Structures Statistiques et Estimation A. El Mossadeq

    (d) Esprance mathmatique de 2

    :

    E h2

    i = Z R v2f (v) dv

    = Z +

    rv 2 exp r ( v) dv

    = + 1r2

    +1r 2

    (e) Variance de :

    V

    h

    i= E

    h

    2

    iE

    h

    i2

    =1r 2

    Lestimateur de est biais, mais il est asymptotiquement sans biais.

    5. Considrons lestimateur :

    T = 1r

    Alors :

    E [T ] = E hi1r

    =

    et :

    V [T ] = V hi=1r 2

    T est donc un estimateur sans biais et convergent de .

    Exercice 6Les lments dune population possdent un caractre X qui suit une loi de Poissonde paramtre inconnu .Une suite de r expriences a fourni les valeurs k1,...,k r .

    1. Dterminer lestimateur du maximum de vraisemlance de et tudier lesproprits de cet estimateur.2. est-il un rsum exhaustif ?3. On dsire estimer la quantit :

    = P [X = 0]

    Dterminer lestimateur du maximum de vraisemlance de .Que remarquez-vous ?

    26

  • 7/29/2019 Exercices de Statistique 2006

    31/124

    A. El Mossadeq Structures Statistiques et Estimation

    Solution 61. Soit X une variable alatoire de Poisson de paramtre .

    pour tout xN , la probabilit lmentaire p (x) de x est :

    p(x) = x

    x!exp

    de plus :

    E [X ] =

    V [X ] =

    (a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.

    Sa fonction de vraisemblance est d nie pour tout , > 0, et tout(k1,...,k r )N r par :

    L (; k1,...,k r ) =r

    Yi=1 p(ki )=

    r

    Pi =1 k ik1!...kr !

    exp rdo :

    ln L (; k1,...,k r ) = ln (k1!...kr !) +r

    Xi=1 ki ln r

    Il en rsulte que :

    ln L (; k1,...,k r ) =

    r

    Pi=1 ki rdo :

    ln L (; k1,...,k r ) = 0 = p =1r

    r

    Xi=1

    xi

    et comme : 2

    2ln L (; k1,...,k r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Poisson est :

    =1r

    r

    Xi=1 X iCest la moyenne empirique du r -chantillon.

    27

  • 7/29/2019 Exercices de Statistique 2006

    32/124

    Structures Statistiques et Estimation A. El Mossadeq

    (b) Etude des proprits de :Puisque :

    E [ ] = E [X ]=

    et :

    V [] =V [X ]

    r=

    r

    On en dduit que est un estimateur sans biais et convergent de .

    2. Pour tout , > 0, et tout (k1,...,k r )N r on a :

    L (; x1,...,x r ) = r (k 1 ,...,k r )

    x1!...x r !exp r

    Daprs le thorme de factorisation, est un rsum exhaustif puisque :

    L (; x1,...,x r ) = g (; (x1,...,x r )) h (x1,...,x r )

    o :

    g (; (x1,...,x r )) = r (k 1 ,...,k r ) exp ret :

    h (x1,...,x r ) =1

    x1!...x r !3. On a :

    = P [X = 0]= exp

    Pour tout , > 0, et tout (k1,...,k r )N r par :

    L ( ; k1,...,k r ) =r

    Yi=1 p(ki )=

    (ln )r

    Pi =1 k ik1!...k r !

    r

    do :

    ln L ( ; k1,...,k r ) = ln (k1!...kr !) +r

    Xi=1 ki ln (ln ) + r ln

    28

  • 7/29/2019 Exercices de Statistique 2006

    33/124

    A. El Mossadeq Structures Statistiques et Estimation

    Il en rsulte que :

    ln L ( ; k1,...,k r ) =

    r

    Pi=1 ki

    ln +

    r

    do :

    ln L ( ; k1,...,k r ) = 0 = = exp 1rr

    Xi=1 ki!et comme :

    2

    2ln L ( ; k1,...,k r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :

    = exp 1rr

    Xi=1 X i!= exp

    Exercice 7

    Soit un rel appartenant ]1, + [ et X une variable alatoire telle que :P [X = k] =

    1 1 1

    k 1

    , k

    N

    1. Calculer lesprance mathmatique et la variance de X .2. Dterminer lestimateur du maximum de vraisemlance de dun r -chantillon

    de variable parente X et tudier ses proprits.3. est-il un rsum exhaustif ?

    Solution 71. On a :

    E [X ] =

    Xk =1 kP [X = k]=

    Xk =1k 1 1

    k 1

    =

    29

  • 7/29/2019 Exercices de Statistique 2006

    34/124

    Structures Statistiques et Estimation A. El Mossadeq

    et :

    E [X (X 1)] =

    Xk =1 k (k 1) P [X = k]=

    Xk =1k (k 1)

    1 1k 1

    = 221 1do :

    E

    X 2

    = E [X (X 1)] + E [X ]= (2 1)et :

    V [X ] = E X 2

    E [X ]2

    = ( 1)2. Considrons un r -chantillon de cette structure.

    Sa fonction de vraisemblance est d nie pour tout

    ]1, + [ et tout (x1,...,x r )(N )r par :L (; x1,...,x r ) =

    r

    Yi=1 p(xi )

    =1

    r 1 1r

    Pi =1 x i r

    do :

    ln L (; x1,...,x r ) = r ln + r

    Xi=1 xi r!ln1 1

    Il en rsulte que :

    ln L (; x1,...,x r ) = r

    +

    r

    Pi=1 xi r ( 1)=

    r

    Pi=1 x i r ( 1)

    30

  • 7/29/2019 Exercices de Statistique 2006

    35/124

    A. El Mossadeq Structures Statistiques et Estimation

    do :

    ln L (; x1,...,x r ) = 0 = =1r

    r

    Xi=1 xi

    et comme : 2

    2ln L ( p; x1,...,x r ) < 0

    donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture gomtrique est :

    =1r

    r

    Xi=1 X iCest la moyenne empirique du r -chantillon.

    3. Puisque :

    =1r

    r

    Xi=1 X ialors :

    E [ ] = E [X ]=

    et :

    V [ ] =V [X ]

    r

    = ( 1)

    rOn en dduit que est un estimateur sans biais et convergent du paramtre dune structure gomtrique.

    Exercice 8Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilitf est d nie par :

    f (x) =

    a

    x +1si x a

    0 si x < ao X reprsente le revenu par habitant, a le revenu minimum et , > 2, uncoefficient dpendant du type du pays o lon se place.

    31

  • 7/29/2019 Exercices de Statistique 2006

    36/124

    Structures Statistiques et Estimation A. El Mossadeq

    1. Vri er que f est bien une densit de probabilit.2. Calculer lesprance mathmatique et la variance de X .3. Calculer la fonction de rpartition de X.4. Dterminer lestimateur du maximum de vraisemlance a de a dun r -chantillon

    issu X .5. Dans le cas o a est bias, proposer un estimateur sans biais de a.

    Solution 81. La densit de probabilit de la loi de Pareto est d nie par :

    f (x) =

    a

    x +1si x

    a

    0 si x < a

    f est bien une densit de probabilit.En eff et :

    Z R f (x) dx = Z +

    a

    a

    x +1dx

    = 1

    2. On a :

    E [X ] = Z R xf (x) dx= Z

    +

    a

    a

    xdx

    =

    1a

    et :

    E

    X 2

    = Z R x2f (x) dx= Z

    +

    aa

    x 1 dx

    =

    2a2

    do :

    V [X ] = E X 2

    E [X ]2

    =

    ( 2) ( 1)2 a

    2

    32

  • 7/29/2019 Exercices de Statistique 2006

    37/124

    A. El Mossadeq Structures Statistiques et Estimation

    3. La fonction de rpartition F de X est d nie pour tout x

    R par :

    F (x) = Z x

    f (t) dt

    =

    0 si x a

    Z x

    a

    a

    t +1dt si x a

    =

    0 si x a

    1 a

    xsi x a

    4. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout a

    R et tout (x1,...,x r )(]a, + [)

    r , par :

    L (a; x1,...,x r ) =r

    Yi=1 f (xi )=

    r a r

    (x1...x r ) +1

    La fonction :

    a L (a; x1,...,x r )est strictement croissante, donc elle atteint son maximum lorsque a est maxi-mum.Et comme :

    i

    {1,...,r } : a xiIl en rsulte que est maximum lorsque :

    a = min( x1,...,x r )

    Donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :

    a = min( X 1,...,X r )

    5. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.

    33

  • 7/29/2019 Exercices de Statistique 2006

    38/124

    Structures Statistiques et Estimation A. El Mossadeq

    (a) Fonction de rpartition de a :

    Pour tout xR on a :

    F a (x) = P [a < x ]= P [min(X 1,...,X r ) < x ]= 1 P [min(X 1,...,X r ) x]= 1 P [X 1 v,...,X r x]= 1

    r

    Yk =1 P [X k x]= 1

    r

    Yk =1(1

    P [X k < x ])

    = 1 [1F (x)]r

    =

    0 si x a1 a

    x r

    si x a(b) Densit de probabilit de :

    Pour tout x

    R {a} on a :f a (x) =

    ddv

    F a (x)

    =

    0 si x < a

    ra r

    xr +1si x > a

    (c) Esprance mathmatique de a :

    E [a] = Z R vf a (v) dv= Z

    +

    a

    ra r

    vrdv

    = rr 1a

    (d) Esprance mathmatique de a2 :

    E a2

    = Z R v2f a (v) dv

    = Z +

    a

    ra r

    vr 1dv

    =r

    r 2a2

    34

  • 7/29/2019 Exercices de Statistique 2006

    39/124

    A. El Mossadeq Structures Statistiques et Estimation

    (e) Variance de a :

    V [a] = E a2

    E [a]2

    =r

    (r 2) (r 1)2 a

    2

    Lestimateur a de a est biais, mais il est asymptotiquement sans biais.(f) Considrons lestimateur :

    T =r 1

    ra

    Alors :

    E [T ] = a

    et :

    V [T ] = r 1r 2

    V [a] =1

    r (r 2)a2

    T est donc un estimateur sans biais et convergent de a.

    Exercice 9Soit X une variable alatoire dont la densit de probabilit f est d nie par :

    f (x) =

    0 si x 1

    exp( x)

    si x >

    o est un paramtre rel et un paramtre rel strictement positif.

    1. Vri er que f est bien une densit de probabilit.2. Calculer lesprance mathmatique et la variance de X .3. Calculer la fonction de rpartition de X.4. On suppose connu et inconnu.

    (a) Dterminer lestimateur du maximum de vraisemlance de dun r -chantillon issu X .(b) Etudier les proprits de .(c) Dans le cas o est bias, proposer un estimateur sans biais de .

    5. On suppose connu et inconnu.

    (a) Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon issu de X .

    (b) Etudier les proprits de (c) Dans le cas o est bias, proposer un estimateur sans biais de .

    35

  • 7/29/2019 Exercices de Statistique 2006

    40/124

    Structures Statistiques et Estimation A. El Mossadeq

    6. On suppose que et sont tous les deux inconnus.

    (a) Dterminer lestimateur du maximum de vraisemlance ,de (, )dun r-chantillon issu de X .(b) Etudier les proprits de , (c) Proposer un estimateur sans biais de (, ) .

    Solution 91. f est bien une densit de probabilit.

    En eff et :

    Z R f (x) dx = Z +

    1 exp ( x) dx

    = Z +

    0exp tdt

    = 1

    2. On a :

    E [X ] = Z R xf (x) dx=

    Z +

    x

    exp

    ( x)

    dx

    = Z +

    0(t + )exp tdt

    = +

    et :

    E X 2

    = Z R x2f (x) dx

    =

    Z

    +

    x2

    exp

    ( x)

    dx

    = Z +

    0(t + )2 exp tdt

    = 22 + 2 + 2

    = ( + )2 + 2

    do :

    V [X ] = E X 2

    E [X ]2

    = 2

    36

  • 7/29/2019 Exercices de Statistique 2006

    41/124

    A. El Mossadeq Structures Statistiques et Estimation

    3. La fonction de rpartition F de X est d nie pour tout x

    R par :

    F (x) = Z x

    f (t) dt

    =

    0 si x

    Z x

    1

    exp( t)

    dt si x

    =

    0 si x

    1 exp( x)

    si x

    4. On suppose connu et inconnu.

    (a) Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0,

    R et tout

    (x1,...,x r )(], + [)r par :

    L (; x1,...,x r ) =r

    Yi=1 f (x i )=

    1

    r exp

    r

    Xi=1(

    xi )

    do :

    ln L (; x1,...,x r ) = r ln +1

    r

    Xi=1 ( xi )Il en rsulte que :

    ln L (; x1,...,x r ) = r

    12

    r

    Xi=1 ( x i )= 1

    "r 1r

    Xi=1 ( x i )#do :

    ln L (; x1,...,x r ) = 0 = =1r

    r

    Xi=1 (xi )=

    = "1rr

    Xi=1 xi#

    37

  • 7/29/2019 Exercices de Statistique 2006

    42/124

    Structures Statistiques et Estimation A. El Mossadeq

    et comme : 2

    2 ln L (; x1,...,x r ) < 0donc lestimateur du maximum de vraisemblance dun r -chantillon decette structure est :

    = "1rr

    Xi=1 X i#(b) On a :

    E [ ] = E

    "1r

    r

    Xi=1

    X i

    !

    #= et :V [] = V "1r

    r

    Xi=1 X i!#=

    V [X ]r

    =2

    r

    5. On suppose connu et inconnu.(a) Considrons un r -chantillon de cette structure.

    Sa fonction de vraisemblance est d nie pour tout , > 0,

    R et tout(x1,...,x r )(], + [)

    r , tous strictement positifs, par :

    L (; x1,...,x r ) =r

    Yi=1 f (xi )=

    1 r

    expr

    Xi=1( x i )

    La fonction : L (; x1,...,x r )

    est strictement croissante, donc elle atteint son maximum lorsque estmaximum.

    38

  • 7/29/2019 Exercices de Statistique 2006

    43/124

    A. El Mossadeq Structures Statistiques et Estimation

    Et comme :

    i

    {1,...,r } :

    xiIl en rsulte que est maximum lorsque :

    = min( x1,...,x r )

    Donc lestimateur du maximum de vraisemblance dun r -chantillon decette structure est :

    = min( X 1,...,X r )

    (b) Pour dterminer la densit de probabilit de , commenons dabord parcalculer sa fonction de rpartition.

    (i) Fonction de rpartition de :Pour tout v

    R on a :

    F (v) = P h < vi= P [min (X 1,...,X r ) < v ]= 1 P [min (X 1,...,X r ) v]= 1 P [X 1 v,...,X r v]= 1

    r

    Yk =1

    P [X k v]

    = 1 r

    Yk =1 (1 P [X k < v ])= 1 [1F (v)]

    r

    =

    0 si v

    1 exp r v si v (ii) Densit de probabilit de :

    Pour tout v

    R

    {} on a :

    f (v) =ddv

    F (v)

    =

    0 si v <

    r

    exp r v si v >

    39

  • 7/29/2019 Exercices de Statistique 2006

    44/124

    Structures Statistiques et Estimation A. El Mossadeq

    (iii) Esprance mathmatique de :

    E hi = Z R vf (v) dv= Z

    +

    r

    v exp r v dv= Z

    +

    0 r

    t + exp tdt=

    r

    +

    (iv) Esprance mathmatique de 2

    :

    E h2

    i = Z R v2f (v) dv

    = Z +

    r

    v2 exp r ( v) dv=

    r

    + 2

    + r

    2

    (v) Variance de :

    V

    h

    i= E

    h

    2

    iE

    h

    i

    2

    = r 2

    Lestimateur de est biais, mais il est asymptotiquement sansbiais.

    (c) Considrons lestimateur :

    T = r

    Alors :

    E [T ] = E

    h

    i

    r=

    et :

    V [T ] = V hi=

    r 2

    T est donc un estimateur sans biais et convergent de .

    40

  • 7/29/2019 Exercices de Statistique 2006

    45/124

    A. El Mossadeq Structures Statistiques et Estimation

    6. On suppose que et sont tous les deux inconnus.

    (a) Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0,

    R et tout(x1,...,x r )(], + [)

    r , tous strictement positifs, par :

    L (, ; x1,...,x r ) =r

    Yi=1 f (xi )=

    1 r

    expr

    Xi=1( x i )

    Compte tenu des questions prcedentes, la fonction :

    (, ) 7L (, ; x1,...,x r )atteint son maximum pour :

    = min( x1,...,x r )

    = "1rr

    Xi=1 xi#do, les estimateurs du maximum de vraisemblance

    ,

    de (, ) sont

    donns par :

    = min( X 1,...,X r )

    = "1rr

    Xi=1 X i#(b) On a :

    E hi=r

    +

    et :E [ ] = E [X ]E hi

    =r 1

    r

    Donc les estimateurs et sont biaiss.

    41

  • 7/29/2019 Exercices de Statistique 2006

    46/124

    Structures Statistiques et Estimation A. El Mossadeq

    (c) Considrons les estimateurs T et S de et respectivement d nis par :

    T =r

    r 1S =

    1r 1

    alors :

    E [T ] =

    E [S ] =

    Donc T et S sont des estimateurs sans biais de et respectivement.

    Exercice 10Soient X et Y deux variables alatoires indpendantes, la premire prenant lesvaleurs 1 et 0 avec les probabilits respectives et 1, et la deuxime prenant lesvaleurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose inconnueet P connue, P > 0.5.On d nit la variable alatoire Z par :

    Z = 1 si X = Y

    Z = 0 si X 6= Y

    On considre un n-chantillon ((X 1, Y 1) , ..., (X n , Y n )) de (X, Y ) et on d nit Z i ,1 i n, partir de X i et Y i comme on a d ni Z partir de X et Y .

    1. Montrer que (Z 1,...,Z n ) est un n-chantillon de Z .2. Etudier les proprits de lestimateur :

    T =1n

    (Z 1 + ... + Z n )

    3. Proposer alors un estimateur sans biais S de .

    4. Etudier la variance de S en fonction de P .5. Indiquer un intervalle de con ance pour lorsque n est grand, en supposantquon dispose dune observation p de la variable :

    T =1n

    (Z 1 + ... + Z n )

    6. Voyez-vous une application de ce qui prcde dans le domaine des sondagesdopinion ?

    42

  • 7/29/2019 Exercices de Statistique 2006

    47/124

    A. El Mossadeq Structures Statistiques et Estimation

    Solution 10On a :

    P [X = 0] = 1 P [X = 1] =

    et :

    P [Y = 0] = 1 P P [Y = 1] = P

    X et Y deux variables alatoires de Bernouilli de paramtres et P respectivement.Dterminons la loi de probabilit de Z :

    P [Z = 0] = P [X 6= Y ]= P [{(X, Y ) = (0 , 1)}

    {(X, Y ) = (0 , 1)}]

    = P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]= (1 ) P + (1 P )

    et :

    P [Z = 1] = P [X = Y ]= P [{(X, Y ) = (0 , 0)}

    {(X, Y ) = (1 , 1)}]

    = P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]

    = (1 ) (1 P ) + P Z est donc une variable alatoire de Bernouilli de paramtre :

    = (1 ) (1 P ) + P de plus :

    E [Z ] = V [Z ] = (1 )

    1. Puisque (X 1, Y 1) , ..., (X n , Y n ) sont indpentants et suivent la mme loi que(X, Y ), on en dduit que (Z 1,...,Z n ) sont indpendants et suivent la mmeloi que Z , donc cest un n-chantillon de Z .

    2. Soit lestimateur :

    T =1n

    (Z 1 + ... + Z n )

    On a :

    E [T ] = E [Z ]= (1 ) (1 P ) + P

    43

  • 7/29/2019 Exercices de Statistique 2006

    48/124

    Structures Statistiques et Estimation A. El Mossadeq

    et :

    V [T ] =1n V [Z ]

    =1n

    [(1 ) (1 P ) + P ][(1) P + (1 P )]3. T est donc un estimateur biais de sauf lorsque :

    =12

    ou :

    P = 1

    (a) Si :

    =12

    ou P = 1

    alors il suffi t de prendre :

    S = T

    (b) Si :

    6=12

    et P 6= 1

    alors il suffi t de prendre :

    S =1

    2P 1[T (1 P )]

    4. On a :

    V [S ] =1

    (2P 1)2 V [T ]

    =1

    n (2P 1)2 [(1 ) (1 P ) + P ][(1) P + (1 P )]

    44

  • 7/29/2019 Exercices de Statistique 2006

    49/124

    Tests dHypothses Les Frquences

  • 7/29/2019 Exercices de Statistique 2006

    50/124

  • 7/29/2019 Exercices de Statistique 2006

    51/124

    A. El Mossadeq Tests : Les Frquences

    Exercice 1

    A la veille dune consultation lectorale, on a intrrog cent lecteurs constituantun chantillon au hasard. Soixante ont dclar avoir lintention de voter pour lecandidat C .En quelles limites, au moment du sondage, la proportion du corps lectoral favorable C se situe-t-elle ?

    Solution 1

    Construisons lintervalle de con ance correspondant la frquence f = 0 .6 du corpslectoral favorable C observe sur un chantillon de taille n = 100.Au seuil , cet intervalle est d ni par :

    "f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #Pour = 5%, on a :

    t .975 = 1 .96

    on obtient alors lintervalle :

    [.504, .696]A 95%, le candidat C serait lu.

    Exercice 2

    On sait que le taux de mortalit dune certaine maladie est de 30%.Sur 200 malades tests, combien peut-on envisager de dcs ?

    Solution 2

    Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200,correspondant la probabilit de dcs p = 0 .3.Au seuil , cet intervalle est d ni par :

    " p t 1 / 2r p (1 p)n , p + t 1 / 2r p (1 p)n #Pour = 5%, on a :

    t .975 = 1 .96

    47

  • 7/29/2019 Exercices de Statistique 2006

    52/124

    Tests : Les Frquences A. El Mossadeq

    on obtient alors lintervalle :

    [.24, .36]

    Il en rsulte que sur les 200 malades, le nombre de dcs envisager serait compris, 95%, entre 48 et 72 dcs.

    Exercice 3

    Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers.Quinze dentre eux sont incomplets.Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?

    Solution 3

    Construisons lintervalle de con ance correspondant la frquence f = 0 .15 dedossiers incomplets observe sur un chantillon de taille n = 100.Au seuil , cet intervalle est d ni par :

    "f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #Pour = 5%, on a :

    t .975 = 1 .96

    on obtient alors lintervalle :

    [.08, .22]

    Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets seraitcompris, 95%, entre 800 et 2200 dossiers.

    Exercice 4

    Dans une maternit, on fait le point de la proportion de lles toutes les cent nais-sances.Comment peut varier cette proportion dune fois lautre si lon admet quil naiten moyenne 51% de lles ?

    Solution 4

    Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspon-dant la probabilit dobtenir une lle p = 0 .51.

    48

  • 7/29/2019 Exercices de Statistique 2006

    53/124

    A. El Mossadeq Tests : Les Frquences

    Au seuil , cet intervalle est d ni par :

    " p t 1 / 2r p (1 p)n

    , p + t 1 / 2r p (1 p)n #

    Pour = 5%, on a :

    t .975 = 1 .96

    on obtient alors lintervalle :

    [.41, .61]

    Il en rsulte, qu 95%, la proportion de lles varie dune fois lautre, entre 41%et 61%.

    Exercice 5

    Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?

    Solution 5

    Ici on :

    n = 10 4

    f = 15 10 4

    p = 10 3

    Testons, au seuil , lhypothse nulle :

    H 0 : la machine est bien rgle

    Sous cette hypothse, la quantit :

    t =f p

    r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :

    t .975 = 1 .96

    49

  • 7/29/2019 Exercices de Statistique 2006

    54/124

    Tests : Les Frquences A. El Mossadeq

    et comme :

    t =f p

    r p (1 p)n= 1 .58

    on accepte donc lhypothse nulle H 0 au seuil = 5%, cest dire, quau seuil = 5%, la machine fonctionne de faon satisfaisante.

    Exercice 6

    Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv 550fumeurs.Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?

    Solution 6

    Construisons lintervalle de con ance correspondant la frquence f =1112

    descancreux parmi les fumeurs observe sur un chantillon de taille n = 600.Au seuil , cet intervalle est d ni par :

    "f t 1 / 2r

    f (1

    f )n , f + t

    1 / 2r f

    (1 f

    )n #Pour = 5%, on a :

    t .975 = 1 .96

    on obtient alors lintervalle :

    [.9, .94]

    Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer despoumons est comprise, 95%, entre 90% et 94%.

    Exercice 7

    Avant de procder au lancement dun produit, une entreprise a fait procder uneenqute portant sur deux rgions gographiques A et B .Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B , 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.

    50

  • 7/29/2019 Exercices de Statistique 2006

    55/124

    A. El Mossadeq Tests : Les Frquences

    Solution 7

    Ici on :

    n A = 1800 et f A =720

    n B = 600 et f B =14

    Testons, au seuil , lhypothse nulle :

    H 0 : les opinions des rgions A et B sont identiques

    Sous cette hypothse, la quantit :

    t =f A f B

    r f A (1 f A)n A + f B (1 f B )n Bpeut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :

    t .975 = 1 .96

    et comme :

    t =f A f B

    r f A (1 f A)n A + f B (1 f B )n B= 4 .77

    on rejette donc lhypothse nulle H 0 95% (et mme 99.98%), cest dire, les deux rgions A et B ont des opinions di ff rentes.

    Exercice 8

    Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitementpar application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,on a trouv 50 gurisons.Que peut-on conclure ?

    51

  • 7/29/2019 Exercices de Statistique 2006

    56/124

    Tests : Les Frquences A. El Mossadeq

    Solution 8

    Ici on :

    n 1 = 200 , f 1 =14

    n 2 = 150 , f 2 =13

    Testons, au seuil , lhypothse nulle :

    H 0 : les deux traitements sont quivalents

    Sous cette hypothse, la quantit :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :

    t .975 = 1 .96

    et comme :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 1.69

    on accepte donc lhypothse nulle H 0 au seuil 5%, cest dire, les deux mthodes sont quivalentes .

    Exercice 9

    Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y a une di ff rence entre les proportions de vente de parcoursen 1ere classe pour les ns et dbuts de semaines ?

    52

  • 7/29/2019 Exercices de Statistique 2006

    57/124

    A. El Mossadeq Tests : Les Frquences

    Solution 9

    Ici on :

    n 1 = 350 , f 1 =1970

    n 2 = 250 , f 2 =1150

    Testons, au seuil , lhypothse nulle :

    H 0 : les taux de billets de 1ere classe vendus en n et dbut de semaines sont identiques

    Sous cette hypothse, la quantit :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable normale centre rduite.Pour = 5%, on a :

    t .975 = 1 .96

    et comme :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 1 .45

    on accepte donc lhypothse nulle H 0 au seuil 5%, cest dire, les taux de billets de parcours en 1ere classe vendus en ns et dbuts de semaines sont identiques etquon peut estimer par :

    f =n 1 f 1 + n 2 f 2

    n 1 + n 2= 0 .25

    Exercice 10

    On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile etquarante fois face.Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.

    53

  • 7/29/2019 Exercices de Statistique 2006

    58/124

    Tests : Les Frquences A. El Mossadeq

    Solution 10

    Ici on :

    n = 100f = 0 .6o f est la frquence de pile.Testons, au seuil , lhypothse nulle :

    H 0 : la pice est loyale

    Sous cette hypothse, on a :

    p = 0 .5

    et la quantit :

    t =f p

    r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normale centrerduite.on a :

    t =f p

    r p (1 p)n= 2

    (1) Pour = 5%, on a :

    t .975 = 1 .96

    on rejette donc lhypothse nulle H 0 95%, cest dire, qu 95%, la pice est truque .

    (2) Pour = 1%, on a :

    2.57 < t .995 < 2.58

    on accepte donc lhypothse nulle H 0 au seuil = 1%, cest dire, quauseuil = 1%, la pice est normale .

    Exercice 11

    Un chantillon de taille n a donn lieu au calcul dune frquence observe f corre-spondant lintervalle de con ance [.22 .34] au seuil = 5%.

    1. Calculer n .2. Par rapport la proportion p = 0 .3, lcart est-il signi catif au seuil = 5% ?3. Dterminer lintervalle de con ance de |f p| au seuil = 5%.

    54

  • 7/29/2019 Exercices de Statistique 2006

    59/124

    A. El Mossadeq Tests : Les Frquences

    Solution 11

    1. Au seuil , lintervalle de con ance correspondant une frquence f observe

    sur un chantillon de taille n est d ni par :

    "f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #On en dduit :

    f =0.22 + 0.34

    2

    n = t 21 / 2f (1 f )

    (f 0.22)2

    Pour = 5%, on a :t 0 .975 = 1 .96

    on obtient alors :

    f = .28n = 2152. Testons, au seuil , lhypothse nulle :

    H 0 : lcart nest pas singi catif

    Sous cette hypothse, la quantit :

    t =f p

    r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normalecentre rduite.On a :

    t =f p

    r p (1 p)

    n= 0.64

    Pour = 5%, on a :

    t .975 = 1 .96

    on accepte donc lhypothse nulle H 0 au seuil = 5%.3. Au seuil :

    f p

    r p (1 p)n t 1 / 2 , t 1 / 2

    55

  • 7/29/2019 Exercices de Statistique 2006

    60/124

    Tests : Les Frquences A. El Mossadeq

    donc, au seuil :

    |f p| "0, t 1 / 2r p (1 p)n #

    Pour = 5%, on a :

    t .975 = 1 .96

    do :

    |f p| [0, 0.06]

    Exercice 12

    Ltude du taux de dfectuosits a ff rentes aux caractristiques de traitements ther-miques dune mme pice, traite par deux fours di ff rents, a donn lieu aux rsultatssuivants :* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 picestraites.* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 picestraites.Que peut-on conclure ?

    Solution 12

    Ici on :

    n 1 = 200 , f 1 = 0 .10

    n 2 = 800 , f 2 = 0 .15

    Testons, au seuil , lhypothse nulle :

    H 0 : les deux traitements thermiques sont quivalents

    Sous cette hypothse, la quantit :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :

    t .975 = 1 .96

    56

  • 7/29/2019 Exercices de Statistique 2006

    61/124

    A. El Mossadeq Tests : Les Frquences

    et comme :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 2.03

    on rejette donc lhypothse nulle H 0 95%, cest dire, les deux traitements ne sont pas quivalents.

    Exercice 13

    Un questionnaire auquel on ne peut rpondre que par oui ou par non, a trempli par un chantillon de taille n.Lintervalle de con ance de la frquence observe f des rponses oui est (0.35 0.43)au seuil = 5%.

    1. Quelle est la taille n de lchantillon.2. Par rapport la proportion p = 0 .4, lcart est-il signi catif au seuil = 5% ?3. Dterminer lintervalle de con ance de |f p| au seuil = 5%.

    Solution 13

    1. Au seuil , lintervalle de con ance correspondant une frquence f observesur un chantillon de taille n est d ni par :

    "f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #On en dduit :

    f =0.35 + 0.43

    2

    n = t 21 / 2 f (1 f )

    (f 0.35)2

    Pour = 5%, on a :

    t 0 .975 = 1 .96

    on obtient alors :

    f = 0 .39

    n = 571

    57

  • 7/29/2019 Exercices de Statistique 2006

    62/124

    Tests : Les Frquences A. El Mossadeq

    2. Testons, au seuil , lhypothse nulle :

    H 0 : lcart nest pas singi catifSous cette hypothse, la quantit :

    t =f p

    r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normalecentre rduite.On a :

    t =

    f p

    r p (1 p)n= 0.49

    Pour = 5%, on a :

    t .975 = 1 .96

    On accepte donc lhypothse nulle H 0 au seuil = 5%.3. Au seuil :

    f p

    r p (1

    p)n

    t 1 / 2 , t 1 / 2

    donc, au seuil :|f p| "0, t 1 / 2r p (1 p)n #

    Pour = 5%, on a :

    t .975 = 1 .96

    do :

    |f p| [0, 0.04]

    Exercice 14

    Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.Le traitement donne-t-il une protection signi cative ?

    58

  • 7/29/2019 Exercices de Statistique 2006

    63/124

    A. El Mossadeq Tests : Les Frquences

    Solution 14

    Soient f 1 la frquence de contracter la maladie pour un sujet non immunis et f 2 la

    frquence de contracter la maladie pour un sujet immunis.Ici on :

    n 1 = 370 et f 1 =1437

    n 2 = 100 et f 2 =14

    Testons, au seuil , lhypothse nulle :

    H 0 : le traitements nest pas e ffi cace

    Sous cette hypothse, la quantit :

    t =f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :

    t .975 = 1 .96

    et comme :

    t = f 1 f 2

    r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 2 .56

    On rejette donc lhypothse nulle H 0 95%, cest dire, le traitement donne une protection signi cative.

    59

  • 7/29/2019 Exercices de Statistique 2006

    64/124

  • 7/29/2019 Exercices de Statistique 2006

    65/124

    Les Tests du Khi-deux

  • 7/29/2019 Exercices de Statistique 2006

    66/124

  • 7/29/2019 Exercices de Statistique 2006

    67/124

    A. El Mossadeq Les Tests du Khi-Deux

    Exercice 1

    Avant de procder au lancement dun produit, une entreprise a fait procder une

    enqute portant sur deux rgions gographiques A et B .Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B , 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.

    Solution 1

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    R egion Opinion favorable non favorable T otal

    R egion A 630 1170 1800

    R egion B 150 450 600

    Total 780 1620 2400

    Testons, au seuil , lhypothse nulle :

    H 0 : les rgions A et B ont la mme opinion

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs th eoriques

    R egion Opinion favorable non favorable T otal

    R egion A 585 1215 1800

    R egion B 195 405 600

    Total 780 1620 2400

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    63

  • 7/29/2019 Exercices de Statistique 2006

    68/124

    Les Tests du Khi-Deux A. El Mossadeq

    est une ralisation dune variable du Khi-deux :

    (2 1)(2 1) = 1degr de libert.Pour = 5%, on a :

    21; .95 = 3 .84

    Et comme :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    = 20 .51On rejette alors H 0 95% (et mme 99.5%), cest dire, les deux rgions ont des opinions di ff rentes quant au produit considr.

    Exercice 2

    Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitementpar application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,on a trouv 54 gurisons.Que peut-on conclure ?

    Solution 2

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    Traitement R esultat gu eri non gu eri Total

    radium 50 150 200

    chirurgie 54 96 150

    Total 104 246 350

    Testons, au seuil , lhypothse nulle :

    H 0 : les deux traitements sont quivalents

    64

  • 7/29/2019 Exercices de Statistique 2006

    69/124

    A. El Mossadeq Les Tests du Khi-Deux

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs th eoriques

    Traitement R esultat gu eri non gu eri Total

    radium 59.4 140.6 200

    chirurgie 44.6 105.4 150

    Total 104 246 350

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (2 1)(2 1) = 1

    degr de libert.Pour = 5%, on a :

    21; .95 = 3 .84

    Et comme :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    = 4 .94

    On rejette alors H 0 95% , cest dire, les deux traitements ne sont pas quivalents .

    Exercice 3

    Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y une di ff rence entre les proportions de vente de parcoursen 1ere classe pour les ns et dbuts de semaines ?

    65

  • 7/29/2019 Exercices de Statistique 2006

    70/124

    Les Tests du Khi-Deux A. El Mossadeq

    Solution 3

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    jour Classe 1ere classe 2ere classe T otal

    V endredi A.M 95 255 350

    Lundi matin 55 195 250

    Total 150 450 600

    Testons, au seuil , lhypothse nulle :H 0 : les taux de billets de parcours en 1ere classe vendus en n

    et dbut de semaines sont identiques

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs th eoriques

    Jour Classe 1ere classe 2ere classe T otal

    V endredi A.M 87.5 262.5 350

    Lundi matin 62.5 187.5 250

    Total 150 450 600

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (2 1)(2 1) = 1

    degr de libert.Pour = 5%, on a :

    21; .95 = 3 .84

    66

  • 7/29/2019 Exercices de Statistique 2006

    71/124

    A. El Mossadeq Les Tests du Khi-Deux

    Et comme :

    2 =2

    Xi=12

    X j =1 (oij t ij )2

    t ij

    = 2 .06

    On accepte alors H 0 au seuil = 5% , cest dire, les taux de billets de parcours en 1 ere classe vendus en ns et dbuts de semaines sont identiques.

    Exercice 4

    On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et

    quarante fois face.Tester au seuil de 5% puis 1%, lhypothse de la loyaut de la pice.

    Solution 4

    Testons, au seuil , lhypothse nulle :

    H 0 : la pice est loyale

    Sous cette hypothse, on a :

    p = 0 .5

    do les rpartitions :

    C ot e R epartition Observ ee R epartition T h eorique

    pile 60 50

    face 40 50

    Total 100 100

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=1(oi t i )2

    t i

    67

  • 7/29/2019 Exercices de Statistique 2006

    72/124

    Les Tests du Khi-Deux A. El Mossadeq

    est une ralisation dune variable du Khi-deux :

    2 1 = 1degr de libert.On a :

    2 =2

    Xi=1(oi t i )2

    t i= 4

    (1) Pour = 5%, on a :

    21; .95 = 3 .84

    On rejette donc lhypothse nulle H 0 95%, cest dire, qu 95%, la pice est truque.

    (2) Pour = 1%, on a :

    21; .99 = 6 .63

    On accepte donc lhypothse nulle H 0 au seuil = 1%, cest dire, quau

    seuil = 1%, la pice est normale.

    Exercice 5

    On veut savoir si la russite (R ) dun traitement est indpendantes du niveaux dela tension artrielle du malade (T ).On dispose pour cela de 250 observations rparties comme suit :

    T R echec succ es

    basse 21 104

    elev ee 29 96

    Que peut-on conclure ?

    68

  • 7/29/2019 Exercices de Statistique 2006

    73/124

    A. El Mossadeq Les Tests du Khi-Deux

    Solution 5

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    T R Echec Succ es Total

    Basse 21 104 125

    Elev ee 29 96 125

    Total 50 200 250

    Testons, au seuil , lhypothse nulle :

    H 0 : la russite du traitement est indpendante du niveau de la tension artrielle

    Calculons, sous cette hypothse, la rpartition thorique, le tableau de cette rpar-tition est donn ci-aprs.

    Tableau des effectifs th eoriques

    T R Echec Succ es Total

    Basse 25 100 125

    Elev ee 25 100 125

    Total 50 200 250

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (2 1)(2 1) = 1

    degr de libert.Pour = 5%, on a :

    21; .95 = 3 .84

    69

  • 7/29/2019 Exercices de Statistique 2006

    74/124

    Les Tests du Khi-Deux A. El Mossadeq

    Et comme :

    2 =2

    Xi=12

    X j =1 (oij t ij )2

    t ij

    = 1 .6

    On accepte alors H 0 au seuil = 5% , cest dire, la russite du traitement est indpendante du niveau de la tension artrielle.

    Exercice 6

    On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon

    (priphrique , non priphrique) et le ct (C ) de la lsion (poumon gauche ,poumon droit).Ltude a port sur 1054 malades :

    L C gauche droit

    periph erique 26 62

    non p eriph erique 416 550

    Que peut-on conclure ?

    Solution 6

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    L C gauche droit Total

    periph erique 26 62 88

    non p eriph erique 416 550 966

    Total 442 612 1054

    Testons, au seuil , lhypothse nulle :

    H 0 : la localisation du cancer est indpendante du ct de la lsion

    Calculons, sous cette hypothse, la rpartition thorique.Le tableau de cette rpartition est donne ci-aprs.

    70

  • 7/29/2019 Exercices de Statistique 2006

    75/124

    A. El Mossadeq Les Tests du Khi-Deux

    Tableau des effectifs th eoriques

    L C gauche droit Total

    periph erique 36.9 51.1 88

    nonp eriph erique 405.1 560.9 966

    Total 442 612 1054

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (2 1)(2 1) = 1

    degr de libert.Pour = 5%, on a :

    2

    1; .95 = 3 .84Et comme :

    2 =2

    Xi=12

    X j =1(oij t ij )2

    t ij

    = 6 .05

    On rejette alors H 0 95% (mme 97.5%), cest dire, la localisation du cancer dpend du ct de la lsion.

    Exercice 7

    De nombreuses observations cliniques ont montr que jusque l :

    30% des malades atteints de M ont une survie infrieure un an 50% ont une survie entre un an et deux ans 10% ont une survie entre deux ans et cinq ans 10% ont une survie suprieure cinq ans.

    On applique un nouveau traitement 80 malades atteint de la maladie M et onconstate :

    71

  • 7/29/2019 Exercices de Statistique 2006

    76/124

    Les Tests du Khi-Deux A. El Mossadeq

    12 ont une survie infrieure un an 56 ont une survie entre un an et deux ans 8 ont une survie entre deux ans et cinq ans 4 ont une survie suprieure cinq ans.

    Que peut-on conclure ?

    Solution 7

    Testons, au seuil , lhypothse nulle :

    H 0 : le nouveau traitement nest pas actif contre la maladie M

    Sous cette hypothse, on a les rpartitions :

    Survie R epartition Observ ee R epartition T h eorique

    survie 1 an 12 24

    1 an < survie 2 ans 56 40

    2 an < survie 5 ans 8 8

    survie > 5 ans 4 8

    Total 80 80

    Sous lhypothse nulle H 0 , la quantit :

    2 =4

    Xi=1(oi t i )2

    t i

    est une ralisation dune variable du Khi-deux :4 1 = 3

    degrs de libert.

    Pour = 5%, on a :

    23; .95 = 7 .81

    72

  • 7/29/2019 Exercices de Statistique 2006

    77/124

    A. El Mossadeq Les Tests du Khi-Deux

    Et comme :

    2 =2

    Xi=1 (oi t i )2

    t i= 14 .4

    on rejette donc lhypothse nulle H 0 95% (mme 99.5%), cest dire, qu 99.5%,le nouveau traitement est actif contre la maladie M .

    Exercice 8

    On suppose pouvoir classer les malades atteints dune maladie M en trois catgories

    cliniques : A , B , C.On se demande si ces trois catgories di ff rent par leurs survies un an.Les eff ectifs observs sont les suivants :

    Survie Cat egorie A B C

    survie a un an 5 20 45

    deces avant un an 15 50 145

    Que peut-on conclure ?

    Solution 8

    La rpartition observe est :

    T ableau des eff ectifs observ ees

    Survie Cat egorie A B C Total

    Survie a un an 5 20 45 70

    D eces avant un an 15 50 145 210

    Total 20 70 190 280

    Testons, au seuil , lhypothse nulle :

    H 0 : la survie un an est indpendante de la catgorie clinique

    Calculons, sous cette hypothse, la rpartition thorique.

    73

  • 7/29/2019 Exercices de Statistique 2006

    78/124

    Les Tests du Khi-Deux A. El Mossadeq

    Tableau des effectifs th eoriques

    Survie Cat egorie A B C T otal

    Survie a un an 5 17.5 47.5 70

    D eces avant un an 15 52.5 142.5 210

    Total 20 70 190 280

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (2 1)(3 1) = 2

    degrs de libert.

    Pour = 5%, on a :

    22; .95 = 5 .99

    Et comme :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij

    = .65

    On accepte alors H 0 au seuil = 5% , cest dire, la survie un an est indpendante de la catgorie clinique.

    Exercice 9

    75 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans le pass.

    74

  • 7/29/2019 Exercices de Statistique 2006

    79/124

    A. El Mossadeq Les Tests du Khi-Deux

    On peut classer les enfants selon la rpartition suivante :

    E A fort moyen l eger

    pr esent 8 2 2

    pass e 11 11 3

    jamais 6 18 14

    Au vu de ces rsultats, existe-t-il une association entre lintensit de lasthme etlexistence dun eczma ?

    Solution 9

    Le tableau de la rpartition observe est donne ci-aprs:

    T ableau des eff ectifs observ ees

    Ecz ema Asthme fort moyen l eger Total

    pr esent 8 2 2 12

    pass e 11 11 3 25

    jamais 6 18 14 38

    Total 25 31 19 75

    Testons, au seuil , lhypothse nulle :

    H 0 : lintensit de lasthme est indpendante de lexistence dun eczma

    Calculons, sous cette hypothse, la rpartition thorique.Le tableau de cette rpartition est donne ci-aprs.

    75

  • 7/29/2019 Exercices de Statistique 2006

    80/124

    Les Tests du Khi-Deux A. El Mossadeq

    Tableau des effectifs th eoriques

    Ecz ema Asthme fort moyen l eger Total

    pr esent 4 4.96 3.04 12

    pass e 8.33 10.33 6.34 25

    jamais 12.67 15.71 9.62 38

    Total 25 31 19 75

    Les eff ectifs thoriques sur la premire ligne sont strictement infrieurs cinq, ce quiempche lapplication dun test du Khi-deux.On peut remdier cet tat en oprantle groupement logique des classes pr esent et pass e.Les nouveaux tableaux des e ff ectifs observs et thoriques, obtenus aprs regroupe-ment de ces deux classes sont donns ci-aprs.

    T ableau des eff ectifs observ ees

    Ecz ema Asthme fort moyen l eger Total

    pr esent ou pass e 19 13 5 37

    jamais 6 18 14 38

    Total 25 31 19 75

    Tableau des effectifs th eoriques

    Ecz ema Asthme fort moyen l eger T otal

    pr esent ou pass e 12.33 15.29 9.38 37

    jamais 12.67 15.71 9.62 38

    Total 25 31 19 75

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij

    76

  • 7/29/2019 Exercices de Statistique 2006

    81/124

    A. El Mossadeq Les Tests du Khi-Deux

    est une ralisation dune variable du Khi-deux :

    (2 1)(3 1) = 2degrs de libert.Pour = 5%, on a :

    22; .95 = 5 .99

    Et comme :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij

    = 11 .84

    On rejette alors H 0 95% (mme 99.5%), cest dire, lintensit de lasthme dpend de lexistence dun eczma.

    Exercice 10

    Une tude statistique relative aux rsultats dadmission du concours dune grandecole fait ressortir la rpartition des admis selon la profession des parents lorsquecelle-ci est connue.

    1. La profession des parents a-t-elle une in uence sur laccs cette cole ?

    2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la statis-tique prcdente de 961 candidats dont lorigine socio-professionnelle est incon-nue et qui ont obtenus 43 succs ?

    P rofession des P arents Candidats Admis

    F ontionnaires et Assimil es 2224 180

    Commerce et I ndustrie 998 89

    Professions Lib erales 575 48

    Propri etaires Rentiers 423 37

    Propri etaires Agricoles 287 13

    Artisans 210 18

    Banques et Assurances 209 17

    77

  • 7/29/2019 Exercices de Statistique 2006

    82/124

    Les Tests du Khi-Deux A. El Mossadeq

    Solution 10

    1. La rpartition observe est :

    P rofession des P arents Candidats Admis Non admis

    F ontionnaires et Assimil es 2224 180 2044

    Commerce et Industrie 998 89 899

    Professions Lib erales 575 48 527

    Propri etaires Rentiers 423 37 386

    Propri etaires Agricoles 287 13 274

    Artisans 210 18 192

    Banques et Assurances 209 17 192

    Total 4916 402 4514

    Testons, au seuil , lhypothse nulle :

    H 0 : laccs lEcole est indpendant de la profession des parents

    Calculons, sous cette hypothse, la rpartition thorique :

    P rofession des P arents Candidats Admis Non admis

    F ontionnaires et Assimil es 2224 181.9 2042.1

    Commerce et Industrie 998 80.8 907.2

    Professions Lib erales 575 47 528

    Propri etaires Rentiers 423 34.6 388.4

    Propri etaires Agricoles 287 23.5 263.5

    Artisans 210 17.2 192.8

    Banques et Assurances 209 17.1 191.9

    Total 4916 402 4514

    78

  • 7/29/2019 Exercices de Statistique 2006

    83/124

    A. El Mossadeq Les Tests du Khi-Deux

    Sous lhypothse nulle H 0 , la quantit :

    2 =7

    Xi=12

    X j =1 (oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (7 1)(2 1) = 6

    degrs de libert.Pour = 5%, on a :

    26; .95 = 12 .6

    Et comme :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij= 6 .28

    On accepte alors H 0 au seuil = 5% , cest dire, laccs lEcole est indpen-dant de la profession des parents.

    2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle estinconnue et qui ont obtenus 43 succs, la rpartition observe et la rpartitionthorique, sous la mme hypothse nulle, deviennent comme consogns ci-aprs.

    T ableau des eff ectifs observ ees

    P rofession des P arents Candidats Admis Non admis

    F ontionnaires et Assimil es 2224 180 2044

    Commerce et Industrie 998 89 899

    Professions Lib erales 575 48 527

    Propri etaires Rentiers 423 37 386

    Propri etaires Agricoles 287 13 274

    Artisans 210 18 192

    Banques et Assurances 209 17 192

    Autres 961 43 918

    Total 5877 445 5432

    79

  • 7/29/2019 Exercices de Statistique 2006

    84/124

    Les Tests du Khi-Deux A. El Mossadeq

    Tableau des effectifs th eoriques

    P rofession des P arents Candidats Admis Non admis

    F ontionnaires et Assimil es 2224 168.4 2055.6

    Commerce et Industrie 998 74.8 913.2

    Professions Lib erales 575 43.5 531.5

    Propri etaires Rentiers 423 32 391

    Propri etaires Agricoles 287 21.7 265.3

    Artisans 210 15.9 194.1

    Banques et Assurances 209 15.8 193.2

    Autres 961 72.8 888.2

    Total 5877 445 5432

    Sous lhypothse nulle H 0 , la quantit :

    2 =8

    Xi=12

    X j =1(oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (8 1)(2 1) = 7

    degrs de libert.Pour = 5%, on a :

    27; .95 = 14 .1Et comme :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij= 22 .5

    On rejette alors H 0 95% (mme 99.5%) , cest dire, laccs lEcole est indpendant de la profession des parents.

    80

  • 7/29/2019 Exercices de Statistique 2006

    85/124

    A. El Mossadeq Les Tests du Khi-Deux

    Exercice 11

    Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre la

    survenue dune hypoglycmie et la survenue dun ictre : sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiques

    Que peut-on conclure ?

    Solution 11

    La rpartition observe est donne dans le tableau :

    T ableau des eff ectifs observ ees

    Ict ere Hypoglyc emie hypoglyc emique non hypoglyc emique T otal

    pas d 0ict ere 23 20 43

    ict ere mod er e 6 14 20

    ict ere intense 4 17 21Total 33 51 84

    Testons, au seuil , lhypothse nulle :

    H 0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs th eoriques

    Ict ere Hypoglyc emie hypoglyc emique non hypoglyc emique T otal

    pas d 0ict ere 16.89 26.11 43

    ict ere mod er e 7.86 12.14 20

    ict ere intense 8.25 12.75 21

    Total 33 51 84

    81

  • 7/29/2019 Exercices de Statistique 2006

    86/124

    Les Tests du Khi-Deux A. El Mossadeq

    Sous lhypothse nulle H 0 , la quantit :

    2 =2

    Xi=12

    X j =1 (oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (3 1)(2 1) = 2

    degrs de libert.Pour = 5%, on a :

    22; .95 = 5 .99

    Et comme :

    2 =3

    Xi=12

    X j =1(oij t ij )2

    t ij

    = 7 .97

    On rejette alors H 0 95% (mme 97.5%), cest dire, la survenue dune hypogly-cmie dpend de la survenue dun ictre.

    Exercice 12

    Un mdicament essay sur 42 patients est contrl quant aux e ff ets secondaires quilpeut avoir sur le poids des malades.On peut considrer que :

    quinze dentre eux ont maigri dix sept nont pas chang de poids dix ont grossi

    En supposant que la maladie est sans e ff et sur les variations de poids, le mdicamenta-t-il un e ff et signi catif sur le poids ?

    Solution 12

    Testons, au seuil , lhypothse nulle :

    H 0 : le traitement est sans e ff et sur les variations du poids

    Si le traitement est sans e ff et sur les variations du poids, alors ces variations sontdes seulement au hasard.La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaqueclasse est la mme et est gale

    13

    .

    82

  • 7/29/2019 Exercices de Statistique 2006

    87/124

    A. El Mossadeq Les Tests du Khi-Deux

    Do les rpartitions :

    V ariations R epartition Observ ee R epartition Th eorique

    ont maigri 15 14

    n 0ont pas chang e 17 14

    ont grossi 10 14

    Total 42 42

    Sous lhypothse nulle H 0 , la quantit :

    2 =3

    Xi=1(oi t i )2

    t i

    est une ralisation dune variable du Khi-deux :

    3 1 = 2

    degrs de libert.

    Pour

    = 5%, on a : 22; .95 = 5 .99

    Et comme :

    2 =2

    Xi=1(oi t i )2

    t i= 1 .86

    on accepte donc lhypothse nulle H 0 au seuil = 5%, cest dire, le traitement est sans e ff et sur les variations du poids.

    Exercice 13

    Pour tudier la densit de poussires dans un gaz, on a procd une srie dobservationsde petits chantillons de gaz au moyen dun microscope.On a ainsi eff ectu 143 observations et les rsultats sont les suivants :

    83

  • 7/29/2019 Exercices de Statistique 2006

    88/124

    Les Tests du Khi-Deux A. El Mossadeq

    Nombre de particules en suspension Nombre d0

    echantillons de gaz

    0 34

    1 46

    2 38

    3 19

    4 4

    5 2

    > 5 0

    Peut-on admettre, au seuil = 5%, que le nombre de particules en suspension estune variable de Poisson ?

    Solution 13Testons, au seuil , lhypothse nulle :

    H 0 : le nombre de particules en suspension est une variable de Poisson

    Calculons une estimation ponctuelle du paramtre de cette loi :

    P [X = k] = k

    k!exp

    o X est la variable alatoire reprsentant le nombre de particules en suspension.On sait que :

    = 1n

    n

    Xi=1 X iest un estimateur sans biais et convergent de .Une estimation ponctuelle de est donne par :

    =1

    143

    5

    Xi=0 in i= 1 .4336

    Do les rpartitions :

    84

  • 7/29/2019 Exercices de Statistique 2006

    89/124

    A. El Mossadeq Les Tests du Khi-Deux

    P articules en suspension R epartition observ ee R epartition th eorique

    0 34 34.1

    1 46 48.9

    2 38 35.0

    3 19 16.7

    4 4 06.0

    5 2 01.7

    > 5 0 00.6

    Total 143 143

    Leff ectif thorique t k , k 0, reprsentant le nombre particules en suspension k estdonn par :

    tk = nP [X = k]

    On constate que le tableau contient des e ff ectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes 4 et plus .Les tableaux des e ff ectifs observs et thoriques deviennent comme consigns ci-aprs.

    P articules en suspension R epartition observ ee R epartition th eorique

    0 34 34.1

    1 46 48.9

    2 38 35.0

    3 19 16.7

    4 4 08.3

    Total 143 143

    85

  • 7/29/2019 Exercices de Statistique 2006

    90/124

    Les Tests du Khi-Deux A. El Mossadeq

    Sous lhypothse nulle H 0 , la quantit :

    2 =4

    Xi=0(oi t i )2

    t i

    est une ralisation dune variable du Khi-deux :

    5 1 1 = 3

    degrs de libert.puisque pour calculer les e ff ectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.

    Pour = 5%, on a :

    23; .95 = 7 .81Et comme :

    2 = 2 .97

    On accepte alors H 0 au seuil = 5%, cest dire, le nombre de particules en suspension peut tre ajust par une loi de Poisson dont le paramtre est estimpar :

    = 1 .4336

    Exercice 14

    Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant atteintla cte orientale des Etats-Unis entre 1887 et 1956 :

    Nombre annuel de cyclones Nombre d 0ann ees0 11 62 10

    3 164 195 56 87 38 19 1

    > 9 0

    Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est unevariable de Poisson ?

    86

  • 7/29/2019 Exercices de Statistique 2006

    91/124

    A. El Mossadeq Les Tests du Khi-Deux

    Solution 14

    Testons, au seuil , lhypothse nulle :

    H 0 : le nombre annuel de cyclones est une variable de Poisson

    Calculons une estimation ponctuelle du paramtre de cette loi :

    P [X = k] = k

    k!exp

    o X est la variable alatoire reprsentant le nombre annuel de cyclones.On sait que :

    =1n

    n

    Xi=1 X iest un estimateur sans biais et convergent de .Une estimation ponctuelle de est donne par :

    =170

    9

    Xi=0 in i = 3 .7286Leff ectif thorique t k , k 0, reprsentant le nombre dannes k cyclones est donnpar :

    tk = nP [X = k]

    Do les rpartitions :

    Nombre annuel de cyclones Ef fectifs observ es Eff ectifs th eoriques0 1 1.681 6 6.272 10 11.693 16 14.534 19 13.545 5 10.16 8 6.287 3 3.348 1 1.569 1 0.65

    > 9 0 0.36Total 70 70

    On constate que le tableau contient des e ff ectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique :* des classes 0 et 1 dune part,* et des classes 7 et plus dautre part.

    87

  • 7/29/2019 Exercices de Statistique 2006

    92/124

    Les Tests du Khi-Deux A. El Mossadeq

    Les tableaux des e ff ectifs observs et thoriques deviennent :

    Nombre annuel de cyclones Ef fectifs observ es Eff ectifs th eoriques

    0 ou 1 7 7.95

    2 10 11.69

    3 16 14.53

    4 19 13.54

    5 5 10.10

    6 8 6.28

    7 5 5.91

    Total 70 70

    Sous lhypothse nulle H 0 , la quantit :

    2 =7

    Xi=1(oi t i )2

    t i

    est une ralisation dune variable du Khi-deux :

    7 1 1 = 5

    degrs de libert.puisque pour calculer les e ff ectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.Pour = 5%, on a :

    25; .95 = 5 .8948

    Et comme :

    2 = 5 .81

    On accepte alors H 0 au seuil = 5%, cest dire, le nombre annuel de cyclones peut tre ajust par une loi de Poisson dont le paramtre est estim par :

    = 3 .7286

    88

  • 7/29/2019 Exercices de Statistique 2006

    93/124

    A. El Mossadeq Les Tests du Khi-Deux

    Exercice 15

    Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprs la

    couleur de leurs yeux (Y ) et la couleur de leus cheveux (C ) :

    Y C Blonds Bruns N oirs Roux

    Bleus 25 9 3 7

    Gris ou V erts 13 17 10 7

    Marrons 7 13 8 5

    Existe-t-il une liason entre ces deux caractres ?

    Solution 15

    La rpartition observe est :

    Y C Blonds Bruns N oirs Roux Total

    Bleus 25 9 3 7 44

    Gris ou V erts 13 17 10 7 47Marrons 7 13 8 5 33

    Total 45 39 21 19 124

    Testons, au seuil , lhypothse nulle :

    H 0 : les couleurs des yeux et des cheveux sont indpendantes

    Calculons, sous cette hypothse, la rpartition thorique :

    Y C Blonds Bruns N oirs Roux Total

    Bleus 16 13.8 7.4 6.8 44

    Gris ou V erts 17 14.8 8 7.2 47

    Marrons 12 10.4 5.6 5 33

    Total 45 39 21 19 124

    89

  • 7/29/2019 Exercices de Statistique 2006

    94/124

    Les Tests du Khi-Deux A. El Mossadeq

    Sous lhypothse nulle H 0 , la quantit :

    2 =3

    Xi=14

    X j =1 (oij t ij )2

    t ij

    est une ralisation dune variable du Khi-deux :

    (3 1)(4 1) = 6

    degrs de libert.

    Pour = 5%, on a :

    26; .95 = 12 .6

    Et comme :

    2 =2

    Xi=13

    X j =1(oij t ij )2

    t ij

    = 15

    On rejette alors H 0 95% (mme 97.5%), cest dire, les couleurs des yeux et des cheveux ne sont pas indpendantes.

    Exercice 16

    On considre les familles de quatre enfants.Sur un chantillon de cent familles quatre enfants, la rpartition suivante a t ob-serve :

    Nombre de filles Nombre de familles

    0 7

    1 20

    2 41

    3 22

    4 10

    Peut-on considrer que la probabilit quun enfant soit une lle est12

    ?

    90

  • 7/29/2019 Exercices de Statistique 2006

    95/124

    A. El Mossadeq Les Tests du Khi-Deux

    Solution 16

    Testons, au seuil , lhypothse nulle :

    H 0 : la probabilit davoir une lle est 12

    Sous lhypothse nulle H 0 , la variable alatoire X gale au nombre de lles parmi

    les quatre enfants suit une loi binomiale dordre 4 et de paramtre12

    : B 4, 12.Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k lles parmi les quatreenfants est :

    pk = C (4, k )124

    Leff ectif thorique t k , 0 k 4, reprsentant le nombre de familles ayant k llesparmi les quatre enfants est donn par :

    tk = np k

    Do les rpartitions :

    Nombre de filles R epartition observ ee R epartition th eorique

    0 7 6.25

    1 20 25

    2 41 37.5

    3 22 25

    4 10 6.25

    Total 100 100

    Sous lhypothse nulle H 0 , la quantit :

    2 =4

    Xi=0(oi t i )2

    t i

    est une ralisation dune variable du Khi-deux :

    5 1 = 4

    degrs de libert.Pour = 5%, on a :

    24; .95 = 9 .49

    91

  • 7/29/2019 Exercices de Statistique 2006

    96/124

    Les Tests du Khi-Deux A. El Mossadeq

    Et comme :

    2 = 4 .03

    On accepte alors H 0 au seuil = 5% : la probabilit davoir une lle est 12

    .

    Exercice 17

    On distribue un jeu de quarante cartes quatre joueurs : A , B , C , D ; chacunreevant dix cartesUn statisticien a labor un programme de distribution de donnes par ordinateur.Pour un ensemble de deux cents donnes, obtenues partir de ce programme, il

    observe le nombre de donnes o le joueur A reoit k as, 0

    k

    4. Les rsultatssont les suivants :

    Nombre d 0as Nombre de donnes

    0 64

    1 74

    2 52

    3 8

    4 2

    Le programme du statisticien est-il able ?

    Solution 17

    Testons, au seuil , lhypothse nulle :

    H 0 : le programme du statisticien est able

    Sous lhypothse nulle H 0 , la variable alatoire X gale au nombre das du joueurA suit une loi hypergomtrique.Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k as est :