statistiques décisionnelles

260

Upload: akira-cm

Post on 09-Nov-2015

189 views

Category:

Documents


9 download

DESCRIPTION

Dans le présent ouvrage, les auteurs s’intéressent aux problèmes de l’échantillonnage statistique, tant du point de vue des méthodes d’échantillonnage que de celui des estimations et de tests statistiques.Lorsqu’on souhaite collecter des informations sur une population, deux possibilités s’offrent :- La première solution consiste à observer ou interroger tous les éléments de la population,c’est ce qu’on appelle une enquête complète ou enquête exhaustive ou recensement ;- La seconde solution consiste à observer ou interroger une partie de la population, c’est cequ’on appelle enquête partielle ou sondage. Les éléments de la population qui sont réellementobservés constituent l’échantillon et l’opération qui consiste à choisir ces éléments est appeléeéchantillonnage.L’alternative décrite ci-dessus se présente dans beaucoup de situations et le recours à ladeuxième solution c’est-à-dire l’enquête partielle est la pratique la plus courante.

TRANSCRIPT

  • Adil ELMARHOUMDocteur en statistique

    et informatique applique

    Mohamed DIOURIDocteur Ingnieur

    Prsident Fondateur de lIGA

    STATISTIQUES DECISIONNELLESExercices corrigs avec rappels de cours

  • COLLECTION SCIENCES TECHNIQUES ET MANAGEMENT

    STATISTIQUES DECISIONNELLESExercices corrigs avec rappels de cours

    Tous les droits sont rservsDpt lgal N 2003/2163

    I.S.B.N. 1954-409-51-3Premire dition 2003

    Deuxime dition 2008

    Les livres de la collection Sciences, Techniques et Management sont co-ditspar les ditions TOUBKAL et lInstitut suprieur du Gnie Appliqu, IGA.

  • A la mmoire de MyriamPour que la mmoire demeure

    Lorsque une mePleure

    Une autre meEst-il plus grand malheur !

    M. DIOURI

  • A ma fille ZinebA. ELMARHOUM

  • SOMMAIRE

    LIMINAIRE 7

    PARTIE 1 : ECHANTILLONNAGE STATISTIQUE 9CH. 1. DETERMINATION DE LECHANTILLON 11

    1.1. Position du problme. 111.2. Dtermination de la taille de lchantillon. 111.3. Mthodes dchantillonnage. 151.4. Enoncs des exercices dapplication. 191.5. Solutions des exercices dapplication. 22

    PARTIE 2 : LOI DE PROBABILITE DECHANTILLON 35CH. 2. LOI DE PROBABILITE DE LA MOYENNE DECHANTILLON 37

    2.1. Position du problme. 372.2. Population avec moyenne, variance et loi de probabilit. Connues. 382.3. Population avec moyenne et loi de probabilit. Connues. 392.4. Population avec moyenne, variance et loi de probabilit. Inconnues. 392.5. Loi de probabilit de la diffrence de deux moyennes. 402.6. Enoncs des exercices dapplication. 412.7. Solutions des exercices dapplication. 43

    CH. 3. LOI DE PROBABILITE DE LA VARIANCE DECHANTILLON 553.1. Position du problme. 553.2. Enoncs des exercices dapplication. 563.3. Solutions des exercices dapplication. 58

    CH. 4. LOI DE PROBABILITE DE LA PROPORTION DECHANTILLON 714.1. Position du problme. 714.2. Loi de probabilit selon lchantillon. 724.3. Enoncs des exercices dapplication. 734.4. Solutions des exercices dapplication. 74

    PARTIE 3 : PRINCIPE DE LESTIMATION 89CH. 5. ESTIMATION DE LA MOYENNE DUNE POPULATION 91

    5.1. Estimation dune moyenne. 915.2. Estimation de la somme de moyennes. 93

  • 5.3. Enoncs des exercices dapplication. 945.4. Solutions des exercices dapplication. 98

    CH. 6. ESTIMATION DE LA VARIANCE DUNE POPULATION 1156.1. Estimation dune variance. 1156.2. Estimation de la somme de variances. 1176.3. Enoncs des exercices dapplication. 1176.4. Solutions des exercices dapplication. 118

    CH. 7. ESTIMATION DE LA PROPORTION DUNE POPULATION 1297.1. Estimation ponctuelle. 1297.2. Estimation par intervalle de confiance. 1297.3. Enoncs des exercices dapplication. 1307.4. Solutions des exercices dapplication. 131

    PARTIE 4 : TESTS STATISTIQUES 137CH. 8. TESTS SUR LES MOYENNES 143

    8.1. Test sur un chantillon. 1438.2. Test sur deux chantillons. 1458.3. Test sur plusieurs chantillons : analyse de la variance (ANOVA). 1508.4. Enoncs des exercices dapplication. 1568.5. Solutions des exercices dapplication. 161

    CH. 9. TESTS SUR LES VARIANCES 1839.1. Test sur un chantillon. 1839.2. Test sur deux chantillons. 1849.3. Enoncs des exercices dapplication. 1869.4. Solutions des exercices dapplication. 188

    CH. 10. TESTS SUR LES PROPORTIONS 19910.1. Test sur un chantillon. 19910.2. Test sur deux chantillons. 20110.3. Test sur plusieurs chantillons. 20310.4. Enoncs des exercices dapplication. 20610.5. Solutions des exercices dapplication. 208

    CH. 11. TESTS NON PARAMETRIQUES 22311.1. Test de validit de loi de probabilit dune distribution. 22311.2. Test dindpendance. 22511.3. Enoncs des exercices dapplication. 22611.4. Solutions des exercices dapplication. 230

    TABLES STATISTIQUES 245

    BIBLIOGRAPHIE 259

  • 7LIMINAIRE

    Ce livre est sa 2me dition, il est le 3e dune trilogie des mmes auteurs, dont 2 livres ont djt dits, savoir : Statistique descriptive et Probabilits .

    Dans le prsent ouvrage, les auteurs sintressent aux problmes de lchantillonnagestatistique, tant du point de vue des mthodes dchantillonnage que de celui des estimations etde tests statistiques.

    Lorsquon souhaite collecter des informations sur une population, deux possibilits soffrent :

    - La premire solution consiste observer ou interroger tous les lments de la population,cest ce quon appelle une enqute complte ou enqute exhaustive ou recensement ;

    - La seconde solution consiste observer ou interroger une partie de la population, cest cequon appelle enqute partielle ou sondage. Les lments de la population qui sont rellementobservs constituent lchantillon et lopration qui consiste choisir ces lments est appelechantillonnage.

    Lalternative dcrite ci-dessus se prsente dans beaucoup de situations et le recours ladeuxime solution cest--dire lenqute partielle est la pratique la plus courante.

    Par rapport lenqute complte, lenqute partielle offre une srie davantages :

    - Le cot global de lenqute partielle est en gnral plus rduit que le cot global duneenqute complte ;

    - Lenqute par sondage est plus rapide que lenqute complte, surtout lorsque lacaractristique tudie prsente des modifications assez importantes au cours du temps ;

    - Les erreurs dobservations sont plus rduites que dans lenqute exhaustive, du fait quil ya moins de donnes manipuler ;

    - Lenqute partielle est, dans certaines situations particulires, la seule solution possible,cest le cas lorsque lobservation prsente un caractre destructif.

  • 8Ainsi, la problmatique des statistiques dcisionnelles sera tudie sous ses 3 aspects :

    - Dabord, la dtermination de lchantillon (en taille et en qualit), en vue davoir lesinformations sur la population mre tudier. Ceci fera lobjet de la partie 1 avec son uniquechapitre 1.

    - Ensuite, la dtermination des lois de probabilit suivie par les paramtres de lchantillon(moyenne, variance et proportion). Ceci fera lobjet de la partie 2 et de ses chapitres 2, 3 et 4.

    - Enfin, une fois lchantillon et les lois de probabilit des paramtres dtermins,ralisation des calculs sur les paramtres de la population mre tudie. Ceci fera lobjet de lapartie 3 avec ses chapitres 5, 6 et 7 et de la partie 4 avec ses chapitres 8, 9, 10 et 11.

  • Statistiques dcisionnelles Partie 1. Echantillonnage statistique

    9

    PARTIE 1ECHANTILLONNAGE STATISTIQUE

    Dans cette 1re partie, nous nous proposons de rsoudre tous les cas types de problmesdchantillons extraits dune population mre en respectant un certain nombre de contraintes.

    - Contraintes de prcision ;- Contrainte de budget.

    Nous aurons ainsi dterminer la taille et la nature de lchantillon qui donne les informationssouhaites sur la population mre tudier, avec la prcision, fixe, au pralable et tout enveillant ne pas dpasser le budget allou ltude.

  • Statistiques dcisionnelles Partie 1. Echantillonnage statistique

    10

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    11

    CHAPITRE 1DETERMINATION DE LECHANTILLON

    1.1. POSITION DU PROBLEME.

    La dtermination dun chantillon ncessite la dtermination :

    - de sa taille : nombre dlments extraire de la population mre ;

    - de la qualit de ses lments : nature des lments extraire.

    Les objectifs essentiels que doit remplir un chantillon sont de 2 sortes :

    - Il doit tre reprsentatif de la population mre, cest--dire quil doit donner desinformations sur cette population avec la prcision exige ;

    - Il doit avoir un cot compatible avec le budget disponible.

    1.2. DETERMINATION DE LA TAILLE DE LECHANTILLON.

    La dtermination de la taille dun chantillon dpend essentiellement de deux facteurs :

    - La prcision souhaite : plus on souhaite des rsultats prcis, plus lchantillon ncessaireest important.

    - Le budget disponible : plus on augmente la taille de lchantillon, plus le cot delenqute saccrot.

    La taille de lchantillon doit tre celle qui permet datteindre le meilleur quilibre entre lerisque derreurs dchantillonnage, le cot induit par ces erreurs, et le cot de lchantillonnagelui-mme.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    12

    1.2.1. Cas ou la loi de probabilit de la variable alatoire nest pas connue.

    Dans ce cas on utilise lingalit de Bienaym Tchebycheff, elle aboutit, en gnral, deschantillons de tailles leves.

    1.2.1.1. Taille dchantillon pour estimer une moyenne.

    - La taille de lchantillon dpend de la prcision souhaite pour la gnralisation desrsultats.

    - La prcision (ou erreur dchantillonnage) sexprime en valeur absolue ou relative. Ellereprsente la largeur de lintervalle de confiance de la moyenne. Soit la moiti de cettelargeur.

    Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marged'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente laprobabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas dela moyenne de la population de plus de . Ceci scrit :

    P( mX < ) 1-

    Ce qui donne : .

    n 2

    2

    avec :

    n : Taille de lchantillon ; : Prcision souhaite ; : Dfinit le seuil de confiance (1 - ) : Ecart- type dchantillon, il est souvent inconnu, il faut avoir des informationsantrieures ou mener une tude pilote.

    1.2.1.2. Taille dchantillon pour estimer une proportion.

    - La taille de lchantillon dpend de la prcision souhaite pour la gnralisation desrsultats.

    - La prcision (ou erreur dchantillonnage) sexprime en valeur absolue ou relative. Ellereprsente la largeur de lintervalle de confiance de la proportion. Soit la moiti de cettelargeur.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    13

    Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marged'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente laprobabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas dela proportion dans la population de plus de . Ceci scrit :

    P( pfn < ) 1-

    Ce qui donne : .q.p

    n 2

    avec :

    n : Taille de lchantillon ; : Prcision souhaite ; : Dfinit le seuil de confiance (1 - )p : Proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir desinformations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.

    1.2.2. Cas ou la loi de probabilit de la variable alatoire est une loi normale.

    Dans ce cas, on utilise la loi normale.

    1.2.2.1. Taille dchantillon pour estimer une moyenne.

    1.2.2.1.1. Cas des prlvements dans une population finie avec remise ou dans une population

    infinie sans remise.

    Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marged'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente laprobabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas dela moyenne de la population de plus de . Ceci scrit :

    P( mX < ) 1-

    Ce qui donne : 22

    2

    21

    Zn

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    14

    1.2.2.1.2. Cas des prlvements dans une population finie sans remise.

    De la mme manire, on trouve :

    ZN

    NZ

    n

    2-1

    2-1

    1.2.2.2. Taille dchantillon pour estimer une proportion.

    Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marged'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente laprobabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas dela proportion dans la population de plus de . Ceci scrit :

    P( pf n < ) 1-1.2.2.2.1. Cas des prlvements dans une population finie avec remise ou dans une population

    infinie sans remise.

    On trouve : 22

    21

    q.pZn

    avec :

    n : Taille de lchantillon ; : Prcision souhaite ;p : Proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir desinformations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.

    1.2.2.2.2. Cas des prlvements dans une population finie sans remise.

    On trouve :qp ZN

    NqpZn

    2-1

    2-1

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    15

    1.3. METHODES DECHANTILLONNAGE.

    Pour que les rsultats dune enqute par sondage puissent tre extrapols lensemble de lapopulation faisant lobjet de ltude, il est indispensable que cette enqute soit conduite selondes rgles bien dfinies et que les calculs conduisant ces extrapolations soient conformes laprocdure dchantillonnage utilise.

    Lchantillon choisi doit tre le plus reprsentatif possible de la population tudie, cest--direle degr de correspondance entre linformation recueillie et ce que nous apprendrait unrecensement complet de la population dpend en grande partie de la faon dont lchantillon at choisi.

    La thorie moderne de lchantillonnage nous propose une distinction fondamentale entrechantillons bass sur la probabilit : chantillons probabilistes et chantillons non bass sur laprobabilit : chantillons non probabilistes ou empiriques.

    1.3.1. METHODES DECHANTILLONNAGE PROBABILISTES.

    1.3.1.1. Echantillonnage alatoire simple.

    Un chantillonnage est alatoire si tous les individus de la population ont la mme chance defaire partie de lchantillon ; il est simple si les prlvements des individus sont ralissindpendamment les uns des autres.

    En particulier, si la population est finie, cette dfinition correspond au tirage alatoire avecremise, qui permet de traiter les populations finies comme des populations infinies.

    Pour prlever un chantillon alatoire et simple il faut :

    - Constituer la base de sondage qui correspond la liste complte et sans rptition deslments de la population ;

    - Numroter ces lments de 1 N ;- Procder, laide dune table de nombres alatoires ou dun gnrateur de nombres

    pseudo alatoires la slection des units diffrentes qui constitueront lchantillon.

    1.3.1.2. Echantillonnage stratifi.

    Lchantillonnage stratifi est une technique qui consiste subdiviser une populationhtrogne, deffectif N, en P sous populations ou strates plus homognes deffectif Ni detelle sorte que N= N1+N2+. +Np. Un chantillon, deffectif ni, est par la suite, prlevindpendamment au sein de chacune des strates en appliquant un plan dchantillonnage auchoix de lutilisateur. Le plus souvent, on procdera par un chantillonnage alatoire et simple lintrieur de chaque strate.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    16

    La stratification peut entraner des gains de prcision apprciables, elle facilite en outre lesoprations de collecte des donnes et fournit des informations pour diffrentes parties de lapopulation.

    Pour la rpartition de leffectif total, n, de lchantillon dans les diffrentes strates, la premiresolution, dite proportionnelle, consiste conserver la mme fraction dchantillonnage danschaque strate. Une seconde solution, dite optimale, tient compte du budget de lenqute.

    1.3.1.2.1. Rpartition proportionnelle.

    La rpartition proportionnelle consiste rpartir la taille de lchantillon n en utilisant la mmefraction de sondage f dans chacune des strates. Cette solution tient compte dun seul facteur quiest le poids de chaque strate.

    Dsignons par wi le poids de la strate et par f la fraction de sondage constante.

    Nnf

    NN

    w ii

    Le nombre dunits choisir dans chacune des strates est donc :

    iii N.fn. wn 1.3.1.2.2. Rpartition optimale.

    Cette deuxime solution consiste rpartir leffort dchantillonnage de faon ingale dans lesdiffrentes strates. Elle tient compte de quatre facteurs :

    - Budget total de lenqute, G- Poids de la strate, wi- Cot de la collecte de linformation dans la strate, ci- Dispersion lintrieur de la strate, mesure par lcart type i.

    Le nombre dunits choisir dans chacune des strates est :

    i

    iii

    c

    wkn avec

    iii cw

    Gk

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    17

    1.3.1.3. Echantillonnage par degrs.Lchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractrisspar un systme ramifi et hirarchis dunits.

    Dans le cas de deux degrs, par exemple, on considre que la population est constitue duncertain nombre dunits de sondage du premier degr (units primaires), chacune de ces unitstant constitue dun certain nombre dunits du second degr. (Units secondaires).

    On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unitslectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode deslection pouvant varier dun degr lautre.

    Lchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments detoute la population et quil est possible dnumrer les units prleves au premier degr. Ilpermet une concentration du travail sur le terrain et donc une rduction des cots.

    Pour un mme nombre total dobservations, il faut indiquer que lchantillonnage alatoire etsimple est plus prcis que lchantillonnage par degr.

    1.3.1.4. Echantillonnage systmatique.

    Lchantillonnage systmatique est une technique qui consiste prlever des unitsdchantillonnage situes intervalles gaux. Le choix du premier individu dtermine lacomposition de tout lchantillon.

    Si on connat leffectif total de la population N et quon souhaite prlever un chantillondeffectif n, lintervalle entre deux units successives slectionner est donn par :

    n

    Nk (arrondi lentier le plus proche)

    Connaissant k, on choisit le plus souvent, pour dbuter, un nombre alatoire, i, compris entre 1et k. Le rang des units slectionnes est alors i, i+k, i+2k, i+3k,

    Lchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit letemps consacr la localisation des units slectionnes.

    Si les lments de la population se prsentent dans un ordre alatoire (pas de tendance)lchantillonnage systmatique est quivalent lchantillonnage alatoire et simple. Par contresi les lments de la population prsentent une tendance, lchantillonnage systmatique estplus prcis que lchantillonnage alatoire.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    18

    1.3.2. METHODES DECHANTILLONNAGE EMPIRIQUES.

    1.3.2.1 Echantillonnage accidentel (ou de convenance).

    Il sagit dun chantillon constitu dindividus qui se trouvaient accidentellement lendroit etau moment o linformation a t collecte.

    Les chantillons accidentels ne peuvent tre considrs reprsentatifs daucune population. Ilest risqu de gnraliser une population donne des rsultats obtenus par un chantillonaccidentel.

    1.3.2.2. Echantillonnage priori.

    Cest un chantillonnage par jugement priori. Il consiste slectionner des individus dont onpense, avant de les interroger, quils peuvent dtenir linformation.

    Le risque de ce type dchantillonnage est de considrer des individus, apparemmentreprsentatifs de la population tudie.

    1.3.2.3. Echantillonnage Boule de neige

    Cette mthode est rserve aux populations composes dindividus dont lidentification estdifficile ou qui possdent des caractristiques rares.

    La mthode consiste faire construire lchantillon par les individus eux-mmes. Il suffit denidentifier un petit nombre initial et de leur demander de faire appel dautres individuspossdant les mmes caractristiques.

    1.3.2.4. Echantillonnage par Quotas.

    Lchantillonnage par quotas est lchantillonnage non probabiliste le plus connu, et finalementle mieux accept comme substitut aux mthodes probabilistes dans le cas o ces derniresrencontreraient des contraintes de base de sondage. Mais la reprsentativit de la populationtudie reste douteuse.

    Lchantillonnage par quotas consiste tudier la structure de la population selon des critreschoisis (quotas) empiriquement. Lchantillon est ensuite construit de manire constituer unereproduction en miniature de la population sur ces critres.

    Lchantillonnage par quotas est une forme simplifie de lchantillonnage stratifi fractionde sondage constante. Les quotas reprsentent les variables de stratification.

    Une fois les quotas fixs, les individus sont slectionns la convenance de lenquteur.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    19

    Les critres servant de base la dfinition des quotas ne doivent pas tre nombreux. Au-del de3 critres, la dmarche devient complexe. Les quotas doivent tre construits sur une base dedonnes fiables (statistiques disponibles) indiquant la rpartition de la population sur lescritres choisis. Les critres les plus utiliss dans les tudes de march sont conomiques etsociodmographiques en particulier lge, le sexe, la catgorie socioprofessionnelle, etc.

    1.4. ENONCES DES EXERCICES DAPPLICATION.

    1.4.1. Une enqute sur l'emploi a pour but destimer le taux d'activit dans un pays. Dans lesstatistiques disponibles, la population active du pays est estime 10 millions de personnes surune population totale de 40 millions de personnes.Dterminer la taille de l'chantillon si l'on accepte une erreur de 1%, avec une probabilit de0,95.

    1.4.2. On dsire estimer le revenu mensuel moyen dans un secteur de production. Quelle doittre la taille de lchantillon de salaris interroger pour que la moyenne empirique nesloigne pas de la moyenne de la population de 100 DH avec une probabilit au moins gale 0,95 sachant que lcart type est de 500 DH par salari ?

    1.4.3. On souhaite raliser une enqute sur la consommation des mnages afin destimer ladpense moyenne par mnage. Quelle doit tre la taille de lchantillon de mnages si lapopulation est compose de 5 millions de mnages et que lerreur admise ne doit pas dpasser10 DH avec une probabilit de 0,99 ?

    Lcart type de la dpense des mnages est de 2000 DH.

    1.4.4. On souhaite raliser une enqute sur lemploi afin destimer le taux de chmage. Lapopulation active est de 5 millions de personnes. Quelle doit tre la taille de lchantillon pourque la frquence empirique ne sloigne pas du vrai taux de chmage de plus de 2% et ce avecune probabilit de 0,95 ?Une enqute rcente avait donn un taux de chmage de 12 %.

    1.4.5. Dans le cadre d'une tude socio-conomique, on s'intresse aux habitants de 18 unitsurbaines, rparties en deux rgions.a) En supposant que la variable alatoire laquelle nous nous intressons suive une loinormale et que lenqute se droule, au sein dune population finie et nexclut pas la possibilitde sonder la mme personne plusieurs fois, dterminer la taille n de lchantillon.On donne comme hypothses de travail : une marge derreur admissible gale 1% avec uneprobabilit de 95% et un cart type du revenu gal 0,114 calcul daprs un 1er chantillon.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    20

    b) L'enqute doit donc comporter n interviews. Comme on dispose de 10 enquteurs et qu'onsouhaite que chaque enquteur n'opre que dans une seule unit urbaine et donc dans la mmergion, on souhaite se limiter l'tude de 10 units urbaines. On suppose qu'un enquteur peutraliser 10 interviews dans la mme journe et que tous les enquteurs ne ralisent pasncessairement le mme nombre denqutes. En fonction de la rpartition des units urbainespar rgion et de leurs nombres d'habitants, dterminer le nombre n1 et n2 dunits par rgion sonder (voir tableau page suivante).c) En nous limitant aux units les plus importantes dans chaque rgion, dterminer les units sonder ainsi que le nombre dinterviews raliser dans chacune dentre elles. Quel est lenombre de jours ncessaire une telle opration ?

    Rgion 1 Rgion 2N Unitsurbaines Nombres dhabitants N Units urbaines Nombres dhabitants

    N 1N 2N 3N 4N 5N 6N 7N 8

    9360045400389003650035100329002810026400

    N 09N 10N 11N 12N 13N 14N 15N 16N 17N 18

    1171001071006120051000438003890037800335002580025300

    1.4.6. Dans une rgion regroupant environ 3 millions dhabitants runis en 1530 communes, ondsire raliser une enqute relative la consommation moyenne des mnages pour le postealimentation.a) Dterminer la taille de l'chantillon si l'on accepte une erreur de 1,16, avec une probabilitde 0,95 et que lon estime lcart type gal 10.b) En effectuant une stratification base sur la distribution de frquences donne dans letableau ci-dessous, combien dinterviews devrait-on raliser dans chacune des catgories decommunes ?c) Si de plus pour des raisons de facilit, on dcidait de ne pas effectuer moins de 10 interviewspar commune, dans combien de communes diffrentes de chacune des catgories lesenquteurs devraient-ils se rendre ?

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    21

    Nombre dhabitants Nombre de communesMoins de 1000[[ 1000 2000[[ 2000 5000[

    [ 5000 10000[[10000 20000[

    plus de 20000

    900300200804010

    Total 1530

    1.4.7. Un sondage vise tudier la notorit dune marque. Pour cela on dispose de 12enquteurs durant un mois.a) Sachant que le rendement par jour et par enquteur est distribu selon une loi normalede moyenne 5, et dcart type 1, dterminer la taille no de l'chantillon retenu tel que : p(n> no) = 0,025.b) On propose de stratifier la population selon lge. Sachant que la population se rpartitcomme indiqu, dans le tableau ci-dessous, dterminer la rpartition de l'chantillon :

    Age Moins de 20ans

    Entre 20 et 30ans

    Entre 30 et 60ans

    Plus de 60ans

    Effectifs 5500000 2500000 1250000 250000

    1.4.8. On sintresse au pourcentage de fusibles dfectueux dans un lot de 50 sacs contenantchacun 10000 fusibles. Les sacs proviennent de diffrents fournisseurs qui affirment en gnralque la proportion de fusibles dfectueux ne dpasse pas 1%. Lerreur accepte sur cepourcentage est de 0,1% avec un niveau de confiance 0,95.a) Dterminer la taille de cet chantillon en utilisant l'ingalit de Bienaym Tchebycheff, et ensupposant la normalit de la variable. Laquelle de ces deux tailles doit-on retenir ? etpourquoi ?b) Prciser dans chaque cas, le type de sondage dont il s'agit :

    b1) Si on tire n fusibles en prlevant n/50 par sac.b2) Si on choisit d'abord k sacs et on tire ensuite ni fusibles par sac.b3) Si on mlange le contenu des 50 sacs, et on tire n fusibles.

    c) Quel est le procd de tirage, le mieux adapt ?

    1.4.9. Un sondage vise une population dentreprises rparties en quatre rgions contenantrespectivement 360, 840, 600 et 1200 entreprises. Le budget rserv pour cette enqute est de44 320 DH. Les cart-types sont estims 0,2 ; 0,1 ; 0,2 ; 0,4 respectivement pour les quatrergions. Les cots de ralisation par questionnaire sont respectivement de 225 DH, 196 DH,400H et 324 DH.a) Etablir une stratification optimale de lchantillon dterminer.b) Prciser le niveau derreur que lon doit accepter avec la taille de lchantillon calcule, enadmettant un niveau de confiance de 0,99 et une proportion de 0,3.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    22

    1.4.10. Le budget allou une enqute est de 132500 DH. Cette enqute est destine estimerle taux de chmage quon pense tre priori gal 10 %. Les frais de dplacement quotidiensont valus 1000 DH par enquteur. La rmunration dun enquteur est de 170 DH parjour. Les charges fixes sont de 20000 DH.a) Dterminer la taille de lchantillon si on tolre une erreur de moins de 1 % avec un niveaude confiance de 95%b) Dterminer la taille maximale permise par le budget allou si le rendement par enquteur estde 6 questionnaires par jour.c) Quel niveau derreur faut-il accepter si on ralise lenqute avec le budget allou ?

    1.4.11. Nous disposons dun montant de 10 000 dh pour enquter auprs dune populationstratifie en deux strates ayant les caractristiques suivantes :

    Strates Effectif Poids de lastrate Ecart type Cot delobservationStrate 1Strate 2

    20003000

    0,40,6

    20,7

    2536

    Etablir la rpartition optimale de lchantillon.

    1.4.12. Une machine automatique fabrique des entretoises destines un montage deroulements. La longueur de ces entretoises doit tre comprise, au sens large, entre 37,45 et37,55 mm. La variable alatoire X, qui associe chaque entretoise sa longueur, est une variablegaussienne de moyenne 37,50 mm.a) Quel doit tre lcart type de la variable alatoire X pour que 998 sur 1000 des picesfabriques soient bonnes ?b) On prlve un chantillon non exhaustif dans la production. Quel doit tre leffectif de cetchantillon pour que la moyenne des longueurs des pices prleves appartienne lintervalleferm [37,495 ; 37,505] avec une probabilit de 0,95 ?

    1.5. SOLUTIONS DES EXERCICES DAPPLICATION.

    1.5.1. Solution de lexercice 1.4.1.

    Nous sommes dans le cas o la loi de probabilit du taux dactivit nest pas connue. Nousutilisons donc lingalit de Bienaym Tchebycheff.

    .q.p

    n 2

    avec p = 0,25 q = 0,75 = 1% et = 5%ce qui donne n = 37 500

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    23

    Comme on le voit, lingalit de Bienaym Tchebycheff aboutit des chantillons de taillesleves.

    1.5.2. Solution de lexercice 1.4.2.

    Nous sommes dans le cas o la loi de probabilit des revenus mensuels nest pas connue. Nousutilisons donc lingalit de Bienaym Tchebycheff.

    .

    n 2

    2

    avec = 500 = 100 et = 5%ce qui donne n = 500

    1.5.3. Solution de lexercice 1.4.3.

    Nous sommes dans le cas o la loi de probabilit de la dpense des mnages nest pas connue.Nous utilisons donc lingalit de Bienaym Tchebycheff.

    .

    n 2

    2

    avec = 2 000 = 10 et = 1%ce qui donne n = 4 000 000

    Comme on le voit, lingalit de Bienaym Tchebycheff aboutit ici un chantillon de tailletrop leve, puisquil fait 4 millions pour une population de 5 millions. Nous devons, parconsquent recourir au thorme central limite et accepter lhypothse vraisemblable que la loide probabilit que suit la variable alatoire, dpense moyenne des mnages, peut treapproche par une loi normale du fait que la population concerne est de 5 millions dmes.

    Dans ce cas, on utilise lgalit relative aux prlvements sans remise dans une populationfinie.

    ZN

    NZ

    n

    2-1

    2-1

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    24

    avec = 2 000 = 10 N = 5 millions = 1% et2

    -1Z = 2,58

    ce qui donne n = 252 795. Un tel chantillon reprsente environ 6,3 % de la taille delchantillon trouve grce lingalit de Bienaym Tchebycheff et donc une trs grandeconomie, dans son traitement, par rapport au 1er chantillon.

    1.5.4. Solution de lexercice 1.4.4.

    Nous sommes dans le cas o la loi de probabilit du taux de chmage nest pas connue. Nousutilisons donc lingalit de Bienaym Tchebycheff.

    .q.p

    n 2

    avec p = 0,12 q = 0,88 = 2% et = 5%ce qui donne n = 5 280 un tel chantillon reprsente environ 1 pour mille de la populationtotale de 5 millions. Dans ce cas il nest pas ncessaire de recourir au thorme central limitepour essayer de rduire la taille de lchantillon.

    1.5.5. Solution de lexercice 1.4.5.

    a) Nous sommes dans le cas o la loi de probabilit de la variable alatoire est la loi normale, lapopulation est finie et le tirage se fait avec remise. On utilise donc lgalit :

    2

    22

    21

    Zn

    avec = 0,05 = 0,114 = 0,01 et2

    1Z = 1,96

    ce qui donne n = 500

    b) Considrons les 2 rgions et essayons de dterminer, au prorata des nombres dunits dechaque rgion, les 10 units qui seront concernes par les interviews.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    25

    CHOIX DES 10 UNITESRgions R1 R2 Total

    Nombredunits total 8 10 18

    % 44,44% 55,56% 100%Nombredunits delchantillon

    4 6 10

    c) Considrons les 2 rgions et essayons de rpartir, au prorata de leurs nombres dhabitants,les 500 interviews.

    REPARTITION DES 500 INTERVIEWSRgions R1 R2 Total

    Nombre dhabitantstotal 336900 541500 878400

    % 38,35% 61,65% 100%Nombre dhabitantsde lchantillon 192 308 500

    Arrondi 10 prs 190 310 500

    Nous avons arrondi 10 prs pour que chacun des enquteurs puissent raliser 10 enqutes parjour.

    Nous devons, dabord choisir les 4 units de la 1re rgion et ensuite choisir les 190 personnesdans ces 4 units. On choisira les 4 plus grandes units comme indiqu dans lnonc, nousdterminerons enfin le nombre dhabitants interviewer, dans chaque unit, au prorata delimportance des 4 units choisies.

    Rgion N1 : Rpartition des 190 interviews sur 4 units et leurshabitants

    UnitsNombre

    dhabitantstotal

    %Nombre

    dhabitantsinterviews

    Arrondis 10 prs

    U1 93600 44,67% 85 90U2 45400 21,17% 40 40U3 38900 18,14% 34 30U4 36500 16,03% 31 30Total 211400 100% 190 190

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    26

    De mme, nous devons, dabord choisir les 6 units de la 2me rgion et ensuite choisir les 310personnes dans ces 6 units. On choisira les 6 plus grandes units, nous dterminerons enfin lenombre dhabitants interviewer, dans chaque unit, au prorata de limportance des 6 unitschoisies.

    Rgion N2 : Rpartition des 300 interviews sur 6 units et leurshabitants

    UnitsNombre

    dhabitantstotal

    %Nombre

    dhabitantsinterviews

    Arrondis 10 prs

    U09 117100 27,94% 87 90U10 107100 25,55% 80 80U11 61200 14,60% 45 40U12 51000 12,17% 39 40U13 43800 10,45% 32 30U14 38900 9,29% 27 30Total 419100 100% 310 310

    Ainsi, on mobilisera 4 enquteurs pour la 1re rgion, 1 enquteur pour chaque unit, celui delunit 1 passera plus de temps, 9 jours (10 interviews par jour) ; de mme, on mobilisera 6enquteurs pour la 2me rgion, 1 enquteur pour chaque unit, celui de lunit 09 passera plusde temps, 9 jours (10 interviews par jour). Lopration durera donc 9 jours.

    1.5.6. Solution de lexercice 1.4.6.

    a) Nous sommes dans le cas o la loi de probabilit de la consommation moyenne nest pasconnue. Nous utilisons donc lingalit de Bienaym Tchebycheff.

    .

    n 2

    2

    avec = 10 = 1,16 et = 5%ce qui donne n = 1487 quon peut arrondir 1500

    b) Effectuons une stratification o les catgories de commune constituent les strates.

    Lchantillon de 1500 interviews sera rparti de faon proportionnelle sur les diffrentesstrates. En conservant la mme fraction de sondage de chaque strate.

    On dtermine le nombre dhabitants dans chaque strate en se basant sur les centres de classes.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    27

    Nombredhabitants

    Centre declasse

    Nombre decommunes

    Nombredhabitants

    Nombredinterviews

    Moins de 1000[[ 1000 2000[[ 2000 5000[[ 5000 10000[[10000 20000[plus de 20000

    5001500350075001500030000

    900300200804010

    450000450000700000600000600000300000

    218218339290290145

    Total 1530 3100000 1500

    La fraction de sondage : f = 31000001500

    = 0,00048387

    c) Pour visiter le plus grand nombre de communes, on fixe le nombre dinterviews raliserpar commune 10 sauf pour la dernire catgorie de communes car elle ne contient que 10communes qui seront toutes visites, on ralisera alors 14 interviews par commune. Pourdterminer le nombre de communes visiter dans chacune des catgories de communes, ilsuffit de diviser le nombre dinterviews par 10.

    Catgories decommunes

    Nombredinterviews

    Nombre decommunes

    visiterNombre

    dinterviews

    Moins de 1000[[ 1000 2000[[ 2000 5000[[ 5000 10000[[ 10000 20000[plus de 20000

    218218339290290145

    222234292910

    220220340290290140

    Total 1500 1500

    1.5.7. Solution de lexercice 1.4.7.

    a) Le rendement de chaque enquteur pendant 1 mois est de 150 interviews avec un cart typede 5,5 interviews. Pour les 12 enquteurs ce rendement est en moyenne de 1800 interviewsavec un cart type de 19 interviews.

    p(n >no ) = 0,025 => p(n

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    28

    b) Reprenons les donnes et calculons le poids de chaque tranche dge en effectuant unerpartition proportionnelle des 1838 interviews.

    Age Moins de20 ansEntre 20et 30 ans

    Entre 30et 60 ans

    Plus de 60ans

    Total

    Effectifs 5500000 2500000 1250000 250000 9500000Poids en % 57,9 26,3 13,2 2,6 100Taillechantillon

    1064 484 242 48 1838

    1.5.8. Solution de lexercice 1.4.8.

    a) Dans le cas de lutilisation de lingalit de Bienaym Tchebycheff, on trouve :

    .q.p

    n 2

    avec p = 0,01 q = 0,99 = 0,1% et = 5%ce qui donne n = 198000

    Dans le cas de prlvements sans remise dans une population finie, on trouve :

    p.q ZN

    Np.qZn

    2-1

    2-1

    avec p = 0,01 q = 0,99 = 0,1% N = 500000 = 1% et2

    -1Z = 1,96

    ce qui donne n = 35344

    Comme on le voit, lingalit de Bienaym Tchebycheff aboutit ici un chantillon de tailletrop leve. Nous devons, par consquent recourir au thorme central limite et accepterlhypothse vraisemblable que la loi de probabilit que suit la variable alatoire peut treapproche par une loi normale du fait que la population concerne est grande.

    b) Type de sondage.

    b1) Si on tire n fusibles en prlevant n/50 par sac, il sagit dun chantillonnage stratifiavec rpartition proportionnelle.

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    29

    b2) Si on choisit d'abord k sacs et on tire ensuite ni fusibles par sac, il sagitdchantillonnage deux degrs.

    b3) Si on mlange le contenu des 50 sacs, et on tire n fusibles, il sagit dchantillonnagealatoire simple.

    c) Le procd de tirage, le mieux adapt est lchantillonnage stratifi. Si le contenu des 50sacs est homogne, on peut procder par chantillonnage deux degrs.

    1.5.9. Solution de lexercice 1.4.9.

    a) La rpartition optimale tient compte de quatre facteurs :

    - Budget total de lenqute, G = 44 320 dh- Poids de la strate, wi- Cot de la collecte de linformation dans la strate, ci- Dispersion lintrieur de la strate, mesure par lcart type i.

    Le nombre dunits choisir dans chacune des strates est :

    i

    iii

    c

    wkn avec

    iii cw

    Gk

    Reprenons les donnes de lexercice dans un tableau synthtique.

    Rgions R1 R2 R3 R4 TotalNombre dentreprises 360 840 600 1200 3000Poids de la strate, wi % 12% 28% 20% 40% 100%Cot unitaire ci 225 196 400 324lcart type i. 0,2 0,1 0,2 0,4

    A partir de ces donnes, nous pouvons calculer n :

    iii cw

    Gk

    k =324.4,0.4,0400.2,0.2,0196.1,0.28,0225.2,0.12,0

    44320

    k = 10000

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    30

    ce qui donne :

    2250,12.0,210000n1 = 16

    1960,28.0,110000n 2 = 20

    4000,2.0,210000n3 = 20 324

    0,4.0,410000n 4 = 89

    ce qui donne n = n1 + n2 + n3 + n4 = 145

    Ce qui nous permet de raliser une stratification des entreprises de lchantillon, rgion parrgion :

    Rgions R1 R2 R3 R4 TotalNombre dentreprises 360 840 600 1200 3000Echantillon 16 20 20 89 145

    b) Nous sommes dans le cas o la loi de probabilit nest pas connue. Nous utilisons donclingalit de Bienaym Tchebycheff.

    .q.p

    n 2 soit .nq.p

    avec p = 0,3 q = 0,7 n = 145 = 1% et = ?ce qui donne = 38 % ce qui est une marge derreur inacceptable.1.5.10. Solution de lexercice 1.4.10.

    a) Nous sommes dans le cas o la loi de probabilit nest pas connue. Nous utilisons donclingalit de Bienaym Tchebycheff.

    .q.p

    n 2

    avec p = 0,1 q = 0,9 = 5% et = 1%ce qui donne n = 18 000

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    31

    b) Supposons n la taille de lchantillon, NE le nombre denquteurs et NJ le nombre de joursncessaires pour faire lensemble des interviews.

    Nous avons les galits suivantes :

    132 500 = 20 000 + NE.(1000 + 170).NJ

    n = 6 . NE . NJ

    De ces 2 galits, nous pouvons dduire :

    11706

    500112n ce qui donne pour n = 576

    c) Si lon ralise lenqute avec le budget allou, c'est--dire avec un chantillon de 576lments seulement, la marge derreur est :

    .q.p

    n 2 soit .nq.p

    avec p = 0,1 q = 0,9 = 5% et n = 576ce qui donne = 5,6% une telle marge derreur est acceptable.On peut donc se contenter dun chantillon de 576 au lieu dun chantillon de 18 000.

    1.5.11. Solution de lexercice 1.4.11.

    La rpartition optimale tient compte de quatre facteurs :

    - Budget total de lenqute, G = 10 000 dh.- Poids de la strate, wi- Cot de la collecte de linformation dans la strate, ci- Dispersion lintrieur de la strate, mesure par lcart type i.

    Le nombre dunits choisir dans chacune des strates est :

    i

    iii

    c

    wkn avec

    iii cw

    Gk

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    32

    Reprenons les donnes de lexercice.

    Strates Effectif Poids de la strate Ecart-type Cot de lobservationStrate 1Strate 2

    20003000

    0,40,6

    20,7

    2536

    A partir de ces donnes, nous pouvons calculer n :

    iii cw

    Gk =360,6.0,7.250,4.2.

    10000 = 1533,74

    ce qui donne :

    250,4.21533,74n1 = 245 36

    0,6.0,71533,74n 2 = 107

    ce qui donne n = n1 + n2 = 352

    1.5.12. Solution de lexercice 1.4.12.

    a) La longueur des entretoises est une variable normale de moyenne 37,50 mm et dcart type inconnu.998 sur 1000 des pices fabriques sont bonnes si :

    p(37,45 < X < 37,55) = 0,998

    ( 5,3755,37 ) - (

    5,3745,37 ) = 0,998

    ( 05,0 ) - (

    05,0 ) = 0,998

    2.( 05,0 ) - 1 = 0,998 (

    05,0 ) = 0,999

    05,0

    = Z0,999 = 3,09 => = 0,016

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    33

    b) La moyenne des longueurs des pices prleves appartient lintervalle ferm [37,495 ;37,505] et signifie que :

    = (37,505 37,495) / 2 = 0,005Nous sommes dans le cas o la loi de probabilit est la loi normale, on utilise donc lgalit :

    2

    22

    21

    Zn

    avec = 0,05 = 0,016 = 0,005 et2

    1Z

    = 1,96

    ce qui donne n = 40

  • Statistiques dcisionnelles 1. Dtermination de lchantillon

    34

  • Statistiques dcisionnelles Partie 2. Loi de probabilit dchantillon

    35

    PARTIE 2LOI DE PROBABILITE DECHANTILLON

    La notion de distribution dchantillonnage est la base des mthodes dinfrence statistiquedont les deux principales applications sont les problmes destimation et ceux des testsdhypothses.

    Les premiers ont pour but destimer, partir dun chantillon, la valeur numrique dun ou deplusieurs paramtres de la population, et de dterminer la prcision de cette ou de cesestimations. Cela fera lobjet de la 3e partie avec ses chapitres 5, 6 et 7.

    Les seconds ont pour but de vrifier la vracit dune hypothse, mise au dpart, au sujetdune ou de plusieurs populations. Cela fera lobjet de la 4e partie avec ses chapitres 8, 9, 10 et11.

    Mais avant daborder les calculs destimation et de tests statistiques, il nous faudra dterminerles lois de probabilits des paramtres dchantillon, en effet :

    A tout paramtre de population , on peut associer une srie infinie de valeurs observes t, t,t , , calcules partir dchantillons successifs de mme effectif, prlevs dans desconditions identiques. Ces valeurs peuvent tre considres comme des valeurs observesdune mme variable alatoire T et cette variable est fonction des diffrentes variablesalatoires correspondant chacun des individus de lchantillon :

    T = f (X1, X2, , Xn)

    En supposant que lchantillon est alatoire et simple, la variable alatoire T possde unedistribution de probabilit, dite distribution dchantillonnage. On peut donc calculerlesprance E(T) et la variance V(T) de cette distribution.

    La distribution dchantillonnage est donc la distribution des diffrentes valeurs que peutprendre la variable alatoire T, pour les diffrents chantillons possibles. Son cart type T estappel erreur standard.

  • Statistiques dcisionnelles Partie 2. Loi de probabilit dchantillon

    36

    Les principales distributions dchantillonnage sont :

    - la distribution dchantillonnage de la moyenne,- la distribution dchantillonnage de la variance,- la distribution dchantillonnage de la proportion.

    Cette partie sera consacre la dtermination, chapitre aprs chapitre, des lois de distributiondchantillonnage sus-cites.

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    37

    CHAPITRE 2LOI DE PROBABILITE DE LA MOYENNE DECHANTILLON

    2.1. POSITION DU PROBLEME.

    Dans ce chapitre, nous considrons une population mre do lon extrait, successivement, deschantillons de n lments dont on dtermine les moyennes :

    a) x1, x2, x3, ., xn avecn

    x

    x

    n

    1ii

    b) x1, x2, x3, ., xn avecn

    x'

    'x

    n

    1ii

    c) x1, x2, x3, ., xn avecn

    ''x

    ''x

    n

    1ii

    Les moyennes x , 'x et ''x sont gnralement diffrentes.

    On peut considrer la suite des premires observations x1, x1, x1, des diffrentschantillons comme des valeurs observes dune mme variable alatoire X1, la suite desdeuximes observations des diffrents chantillons comme des valeurs observes dune mmevariable alatoire X2, etc.

    Les moyennes observesx , 'x

    , ''x

    , sont alors des valeurs observes dune mme variable

    alatoireX qui est fonction de X1, X2, , Xn.

    n

    XX

    n

    1ii

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    38

    Comme X1, X2, , Xn, la variable alatoireX possde une distribution de probabilit, dite

    distribution dchantillonnage de la moyenne. On peut donc calculer lesprance et la variancede cette distribution, en supposant que lchantillon est alatoire et simple, les variablesalatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la moyenne estdsigne par m et la variance par .

    E(Xi) = m et V(Xi) =

    2.2. CAS DUNE POPULATION DONT ON CONNAIT LA MOYENNE, LA VARIANCEET LA LOI DE PROBABILITE.

    2.2.1. Echantillon exhaustif.

    Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, unchantillon alatoire simple deffectif n, lesprance mathmatique et la variance de lamoyenne sont :

    E(X ) = E(

    n

    Xin

    1i ) =

    n

    iXiE

    n 1)(1 = mn

    n1 = m

    V(X ) =

    n1NnN 2

    Lerreur standard est alors : 1NnN

    nX

    Dans ce cas, la loi de probabilit de la moyenne est normale de moyenne m et dcart type

    1NnN

    nX .

    2.2.2. Echantillon non exhaustif.

    E(X ) = E(

    n

    Xin

    1i ) =

    n

    1i)Xi(E

    n1

    = mnn1 = m

    V(X ) = V(

    n

    Xin

    1i ) =

    n

    1i)Xi(V

    n1

    = nn

    1 =n

    Lerreur standard est alors :nX

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    39

    Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type

    nX

    .

    2.3. CAS DUNE POPULATION DONT ON CONNAIT LA MOYENNE ET LA LOI DEPROBABILITE.

    E(X ) = m et V(

    X ) =

    n

    ^

    Avec : )x(v1nn

    ^ = 1n)xx(n

    1ii

    Lerreur standard est alors :n

    ^

    X

    Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type

    n

    ^

    X .

    2.4. CAS DUNE POPULATION DONT ON NE CONNAIT NI LA MOYENNE, NI LAVARIANCE NI LA LOI DE PROBABILITE.

    E(X ) = m et V(

    X ) =

    n

    ^

    avec : )x(v1nn

    ^ = 1n)xx(n

    1ii

    Lerreur standard est alors :n

    ^

    X

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    40

    Si la distribution de la population mre est inconnue, le thorme central limite permetdaffirmer que la distribution de la moyenne est asymptotiquement normale. Pour un effectifsuffisamment lev, la moyenne dun chantillon peut toujours tre considre comme unevariable approximativement normale. Cest gnralement le cas lorsque leffectif est suprieur 30. Dans le cas contraire (n 30), la moyenne dun chantillon peut toujours tre considrecomme une variable de Student (n-1) degr de libert.

    2.5. LOI DE PROBABILITE DE LA DIFFERENCE DE DEUX MOYENNESDECHANTILLONS INDEPENDANTS.

    La diffrence entre les moyennes observes des deux chantillons indpendants est : 1x

    - 2x

    Une distinction est faite entre le cas de deux populations de variances ingales et le cas de deuxpopulations de variances gales.

    2.5.1. Cas de deux populations de variances ingales

    E( 1x

    - 2x

    ) = m1-m2 V( 1x

    - 2x

    ) =2

    2

    1

    1

    n

    n

    Pour des populations normales (variances connues), les variables 1x , 2

    x sont des variables

    normales de moyennes respectivement m1 et m2 et dcarts types respectivement1

    1

    n

    et

    2

    2

    n

    . La diffrence entre les moyennes observes des deux chantillons indpendants est elle-

    mme normale de moyenne (m1-m2) et dcart type2

    2

    1

    1

    n

    n .

    Si les distributions des populations mres sont inconnues, pour des effectifs suffisammentlevs, la diffrence entre les moyennes peut toujours tre considre comme une variableapproximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs 30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre commeune variable de Student (n1 + n2 - 2) degrs de libert.

    2.5.2. Cas de deux populations de variances gales

    Dans le cas o les populations sont de variances gales, une estimation de la variancecommune aux deux populations est donne par :

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    41

    2nn)xx()xx(

    21

    2i1i^

    E( 1x

    - 2x

    ) = m1 - m2

    V( 1x

    - 2x

    ) =2

    ^

    1

    ^

    n

    n = )

    n1

    n1(

    21

    ^

    Pour des populations normales, la diffrence entre les moyennes observes des deuxchantillons indpendants est elle-mme normale de moyenne (m1-m2) et dcart type

    )n1

    n1(

    21

    ^ .

    Si les distributions des populations mres sont inconnues, pour des effectifs suffisammentlevs, la diffrence entre les moyennes peut toujours tre considre comme une variableapproximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs 30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre commeune variable de Student (n1 + n2 - 2) degrs de libert.

    2.6. ENONCES DES EXERCICES DAPPLICATION.

    2.6.1. Quelle est l'esprance mathmatique et quelle est la variance des rsultats qu'on peutobtenir quand on choisit au hasard et indpendamment dix nombres entiers de 1 9 et qu'on encalcule la moyenne, en supposant que chacun des nombres de 1 9 a une mme probabilitd'tre choisi et qu'un mme nombre peut tre choisi plusieurs fois sans aucune restriction ?

    2.6.2. Une population est constitue des cinq nombres 2, 3, 6, 8, 11. On considre tous leschantillons non exhaustifs possibles de taille deux de cette population. Trouver :a) La moyenne de la population.b) Lcart type de la population.c) La moyenne de la distribution d'chantillonnage des moyennes.d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreurquadratique moyenne des moyennes.e) Reprendre les mmes questions dans le cas dun chantillon exhaustif.

    2.6.3. On suppose que les poids de 3000 ttes dovins d'une ferme suivent une loi normale demoyenne 38,0 kilogrammes et dcart type 5,0 kilogrammes. Si l'on extrait 80 chantillons de25 ttes chacun, quelle est la moyenne et lcart type thoriques de la distributiond'chantillonnage des moyennes pour :a) Un chantillonnage non exhaustif ?b) Un chantillonnage exhaustif ?

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    42

    c) Pour combien d'chantillons peut-on s'attendre trouver une moyenne comprise entre 36,8et 38,3 kilogrammes ?

    2.6.4. Cinq cents rondelles ont un poids moyen de 5,02 grammes et un cart type de 0,30gramme. Trouver la probabilit pour quun chantillon de 100 rondelles choisies au hasard aitun poids total :a) Compris entre 496 et 500 grammes.b) Plus grand que 510 grammes.

    2.6.5. Les batteries d'un fabricant A ont une dure de vie moyenne de 1400 heures avec uncart-type de 200 heures, et celles d'un fabricant B ont une dure de vie moyenne de 1200heures avec un cart-type de 100 heures. Si l'on teste des chantillons de 125 batteries pourchaque marque, quelle est la probabilit pour que la marque A ait une dure de vie moyennequi soit au moins suprieure celle de la marque B de :a) 160 heures ?b) 250 heures ?

    2.6.6. Les piles d'une marque donne psent 0,50 gramme avec un cart-type de 0,02 gramme.Quelle est la probabilit pour que deux lots de 1000 piles chacun diffrent entre eux de plus de2 grammes ?

    2.6.7. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et uncart type de 150 heures. Trois ampoules sont branches de telle manire que, si lune dellesest grille, les autres continuent fonctionner. En supposant que les dures de vie suivent uneloi de Laplace Gauss, quelle est la probabilit pour que lclairage fonctionne, en moyenne :a) Au moins pendant 5000 heures ?b) Au plus pendant 4200 heures ?

    2.6.8. Les poids de 1500 pices suivent une loi de probabilit normale de moyenne 22,40 kg etdcart type 0,048 kg Dterminer pour 300 chantillons alatoires de taille 36 de cettepopulation la moyenne et l'cart type thorique de la distribution d'chantillonnage desmoyennes :a) L'chantillonnage tant non exhaustif.b) Lchantillonnage tant exhaustif.c) Combien d'chantillons alatoires ont leur moyenne comprise entre 22,39 et 22,41 kg ?

    2.6.9. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un carttype de 50 kg, Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur unmonte-charge dpassent la limite de scurit du monte-charge, qui est 8200 kilogrammes.

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    43

    2.6.10. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives4000 et 4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100cbles de la marque A et 50 cbles de la marque B, quelle est la probabilit pour que larsistance de rupture moyenne de B ait :a) Au moins 600 kilogrammes de plus que A ?b) Au moins 450 kilogrammes de plus que A ?

    2.6.11. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec uncart type de 200 heures.a) Trouver la probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyennede vie suprieure 1825.b) Trouver la probabilit qu'un chantillon alatoire de 100 Units de ce bien ait une moyennede vie de pas plus de 1775 et pas moins de 1760.

    2.7. SOLUTIONS DES EXERCICES DAPPLICATION.

    2.7.1. Solution de lexercice 2.6.1.

    Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon estnon exhaustif.

    E(X ) = m = 9

    987654321 = 5

    =22

    ix

    n

    x = 9 987654321 - 5 = 6,67

    V(X ) =

    n

    = 1067,6

    = 0,667

    Lerreur standard est alors :nX = 667,0 = 0,82

    2.7.2. Solution de lexercice 2.6.2.

    a) La moyenne de la population.

    m = 5118632

    = 6

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    44

    b) Lcart type de la population.

    =22

    ix

    n

    x = 5 118632 - 6 = 10,80c) La moyenne de la distribution d'chantillonnage des moyennes.

    E(X ) = m = 6

    d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreur standard.

    Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon estnon exhaustif.

    V(X ) =

    n

    = 280,10

    = 5,40

    Lerreur standard est alors :nX = 40,5 = 2,32

    e) Cas dun chantillon exhaustif.

    - Moyenne de la distribution d'chantillonnage des moyennes.

    E(X ) = m = 6

    - Ecart type de la distribution d'chantillonnage des moyennes.

    V(X ) = 1N

    nN

    n

    = 1525

    280,10

    = 4,05

    Lerreur standard est alors : 05,4 = 2,01

    2.7.3. Solution de lexercice 2.6.3.

    Dsignons par X le poids des ovins. X suit une loi normale de moyenne 38 kg et dcart type 5kg.

    La taille de lchantillon est n = 25

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    45

    a) Cas dun chantillon non exhaustif.

    Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.

    - Moyenne de la distribution d'chantillonnage des moyennes.

    E(X ) = m = 38 kg

    - Ecart type de la distribution d'chantillonnage des moyennes.

    V(X ) =

    n

    = 255

    = 1

    Lerreur standard est alors : 1 = 1 kg.

    b) Cas dun chantillon exhaustif.

    Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.

    - Moyenne de la distribution d'chantillonnage des moyennes.

    E(X ) = m = 38 kg

    - Ecart type de la distribution d'chantillonnage des moyennes.

    V(X ) =

    1NnN

    n

    =

    13000253000

    255

    = 0,992

    Lerreur standard est alors : 992,0 = 0,996 kg.

    c) Nombre d'chantillons dont la moyenne est comprise entre 36,8 et 38,3 kilogrammes.

    Calculons la probabilit que la moyenne soit comprise entre 36,8 et 38,3 kg. La moyenne suitune loi normale de moyenne 38 et dcart type 1 kg.

    p(36,8 328) = 1 - ( 10

    300328 )

    p(x > 328) = 1 - (2,80) = 1 0,9974 = 0,0026 = 0,26 %

    2.7.10. Solution de lexercice 2.6.10.

    Il sagit de la diffrence de deux moyennes dchantillons indpendants.

    La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants

    suit une loi normale de moyenne (m2-m1) et dcart type2

    2

    1

    1

    n

    n .

    E( 2x

    - 1x

    ) = m2 - m1 = 4500 4000 = 500 kg

    V( 2x

    - 1x

    ) =2

    2

    1

    1

    n

    n = 50

    200100

    300 = 1700

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    52

    Lcart type est donc 1700 = 41,23 kg

    La diffrence entre les dures de vie moyennes observes des deux chantillons indpendantssuit une loi normale de moyenne 500 kg et dcart type 41,23 kg.

    a) Probabilit pour que la marque B ait une charge de rupture dau moins 600 kg de plus que lamarque A.

    p( 2x

    - 1x

    > 600) = 1 - ( 23,41500600 )

    p( 2x

    - 1x

    > 600) = 1 - (2,43) = 0,0075b) Probabilit pour que la marque B ait une charge de rupture dau moins 450 kg de plus que lamarque A.

    p( 2x

    - 1x

    > 450) = 1 - ( 23,41500450 )

    p( 2x

    - 1x

    > 450) = 1 - (-1,21) = 0,88692.7.11. Solution de lexercice 2.6.11.

    Dsignons par X la dure de vie de moyenne 1800 heures avec un cart type de 200 heures.

    Dterminons la loi de probabilit de la moyenne.

    Il sagit dune population dont on connat la moyenne et la variance.

    - Moyenne de la distribution d'chantillonnage des moyennes.

    E(X ) = m = 1800 h

    - Ecart type de la distribution d'chantillonnage des moyennes.

    V(X ) =

    n

    = 100200

    = 400

    Lerreur standard est alors : 400 = 20 h.

  • Statistiques dcisionnelles 2. Loi de probabilit de la moyenne dchantillon

    53

    a) Probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne de viesuprieure 1825.

    p(x > 1825) = 1 - ( 20

    18001825 )

    p(x > 1825) = 1 - (1,25) = 0,1056

    b) Probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne de vie depas plus de 1775 et pas moins de 1760.

    p(1760 220) = 1 - p(V(X) < 220)

    p(V(X) > 220) = 1 - p(200

    )X(V.20 220) = 1 - p( < 24,2)En consultant la table de la fonction de rpartition de la loi Khi deux, 19 degrs de libert ontrouve :

    0,5 < p( < 24,2) < 0,9 aprs interpolation linaire on trouve :p( < 24,2) = 0,7645p(V(X) > 220) = 1 0,7645 = 0,2355

    d) Probabilit qu'un chantillon alatoire de 50 units de ce bien ait un cart type de viesuprieur 220.

    p(V(X) > 220) = 1 - p(V(X) < 220)

    p(V(X) > 220) = 1 - p(200

    )X(V.50 220) = 1 - p( < 60,5)Le nombre de degr de libert est grand, de ce fait, et par application du thorme centrallimite, on peut affirmer que la loi Khi deux tend vers une loi normale de paramtres k et

    k2 . Toutefois, la convergence vers la loi normale est relativement lente, l'approximation estgnralement satisfaisante lorsque k est suprieur 100. Pour un nombre de degr de libertcompris entre 30 et 100, on prfre faire usage de la racine carre. On peut en effet utiliser latransformation :

    Z = 1k22

    Z = 149.25,60.2 = 1,15p( < 60,5) p(Z < 1,15) = (1,15) = 0,8749p(V(X) > 220) = 1 0,8749 = 0,1251

  • Statistiques dcisionnelles 3. Loi de probabilit de la variance dchantillon

    70

    3.3.11. Solution de lexercice 3.2.11.

    m = 6 m = 0,10et n = 40- Moyenne de la distribution dchantillonnage des variances

    E(V(X)) = n

    1n = 40140

    . 0,102 = 0,00975

    - Ecart type de la distribution dchantillonnage des variances

    0022,0401,0

    x39x2n

    x)1n(2))X(V(V22

    b) Pour des chantillons de taille 60 on a :

    - Moyenne de la distribution dchantillonnage des variances

    E(V(X)) = n

    1n = 00983,0210,0x60

    160

    - Ecart type de la distribution dchantillonnage des variances

    0018,0601,0

    x59x2n

    x)1n(2))X(V(V22

    c) On peut lasticits demandes, en effet pour une variation de 50 % de la taille deschantillons on a :

    - Une lasticit des moyennes de distribution dchantillonnage des variances gale :

    %82,000975,0

    00975,000983,0

    - Une lasticit des cart-types de distribution dchantillonnage des variances gale :

    %18,180022,0

    0022,00018,0

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    71

    CHAPITRE 4LOI DE PROBABILITE DE LA PROPORTION DECHANTILLON

    4.1. POSITION DU PROBLEME.

    De mme que pour la moyenne et pour la variance, si lon considre une population infinie etque lon y prlve un chantillon alatoire et simple deffectif n, on dsigne par Xn le nombredindividus possdant, dans chaque chantillon, le caractre tudi.

    nXf nn est la frquence ou proportion des individus possdant, dans lchantillon, le

    caractre tudi.

    On dsigne par p la proportion des individus possdant, dans la population, le caractre tudi.

    Les chantillons successifs possdent les frquences :

    nXf nn

    n'X

    'f nn n

    "X"f nn

    Ces frquences peuvent tre considres comme des valeurs observes dune mme variablealatoire :

    nXf nn

    La variable alatoire Fn possde une distribution de probabilit, dite distributiondchantillonnage de la proportion. On peut donc calculer lesprance et la variance de cettedistribution, en supposant que lchantillon est alatoire et simple.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    72

    4.2. LOI DE PROBABILITE SELON LECHANTILLON.

    4.2.1. Echantillon non exhaustif.

    E(Fn) = E(n

    Xn ) =n1 E( nX ) =

    n1 n p = p

    V(Fn) = V( nXn ) =

    1n

    V( nX ) =n

    1 n p q =n

    pq

    n

    pqFn est appel erreur standard de la frquence dun chantillon alatoire et simple.

    En ce qui concerne la forme de cette distribution, on peut affirmer que la distribution de la

    proportion suit une loi normale de moyenne p et dcart typen

    pqFn condition que la

    taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p 5.4.2.2. Echantillon exhaustif.

    Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, unchantillon alatoire et simple deffectif n, lesprance mathmatique et la variance de lafrquence sont :

    E(Fn) = E(n

    Xn ) =n1 E( nX ) =

    n1 n p = p

    V(Fn) = V(n

    Xn ) =n

    1 V( nX ) =n

    11NnN

    n p q = 1NnN

    n

    pq

    Lerreur standard est alors :n

    pq1NnN

    Fn

    En ce qui concerne la forme de cette distribution, on peut affirmer que la distribution de la

    proportion suit une loi normale de moyenne p et dcart typen

    pq1NnN

    Fn

    condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p 5.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    73

    4.3. ENONCES DES EXERCICES DAPPLICATION.

    4.3.1. Lors dlections, les rsultats ont montr quun des candidats a obtenu 46 % des voix.Dterminer la probabilit pour que le vote donne une majorit de voix en faveur de ce candidatpour un chantillon de :

    a) 200 personnes choisies au hasard parmi le corps lectoral.b) 1000 personnes choisies au hasard parmi le corps lectoral .

    4.3.2. Trouver la probabilit pour que parmi les 200 prochains enfants natre :a) Il y ait moins de 40 % de garons.b) Il y ait entre 43 % et 57 % de filles.c) Il y ait plus de 54 % de garons.

    On supposera que la naissance d'un garon et la naissance d'une fille sont quiprobables.

    4.3.3. Etant donn 1000 chantillons de 200 enfants chacun, pour combien d'chantillons a-t-onune chance de trouver :a) Moins de 40 % de garons.b) Entre 40 % et 60 % de filles.c) 53 % ou plus de filles ?

    4.3.4. Les rsultats d'une lection montrent qu'un des candidats a obtenu 65 % des voix.Trouver la probabilit pour que deux chantillons alatoires, chacun correspondant 200votants, indiquent plus de 10 % de diffrence dans les proportions de gens qui ont vot pour cecandidat.

    4.3.5. On sintresse au taux de russite au sein dune cole.a) On considre un chantillon de 35 tudiants, quelle est la probabilit davoir plus de 70 %dadmis ?b) On considre deux chantillons indpendants de 100 tudiants chacun, quelle est laprobabilit davoir plus de 15 % de diffrence dans les taux de russite ?

    4.3.6. On considre une lection municipale dans laquelle deux candidats ont obtenurespectivement 34 % et 14 % des suffrages. Le nombre de votants est 12000.On prend un chantillon de 100 personnes, quelle est la probabilit pour que le candidat 1 aitplus de 25 % des suffrages et le candidat 2 ait plus de 20 % ?

    4.3.7. Un 1er test a donn un taux de pices dfectueuses gal 5 %. On ralise un test dequalit sur un chantillon de 1000 pices mcaniques.a) Quelle est la probabilit pour que ce dernier test donne une frquence de pices dfectueusesinfrieure ou gale 1 %, 2 %, 3 %, 4 % et 5 % ?b) Quelles sont ces probabilits avec un chantillon de 100 pices seulement au lieu de 1000.Interprter ces rsultats.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    74

    c) Quelle est la taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ougale 4 % avec une probabilit de 98 % ? Interprter ces rsultats.

    4.3.8. Une tude sur la notorit dune marque a port sur un chantillon alatoire de 400personnes.a) Quelle est la probabilit davoir un taux de notorit qui dpasse 55 % ?b) Calculer cette probabilit si on pense que la notorit est de 60 %.

    4.3.9. Un fournisseur affirme que le risque de vendre une pice dfectueuse est de 5 %. Pourvrifier laffirmation du fournisseur, un contrle a port sur un chantillon alatoire de 300pices. Laffirmation du fournisseur est-elle plausible ?

    4.3.10. 80 % des clients sont satisfaits, cest ce que pense le directeur dune socit de service.a) Quelle est la probabilit que sur un chantillon alatoire de 200 clients, moins de 70 %soient satisfaits ?b) Un deuxime chantillon alatoire de 300 clients est choisi indpendamment du premierchantillon. Quelle est la probabilit davoir plus de 2 % de diffrence entre les taux desatisfaction obtenus auprs des deux chantillons ?

    4.4. SOLUTIONS DES EXERCICES DAPPLICATION.

    4.4.1. Solution de lexercice 4.3.1.

    Soit F la variable alatoire qui dsigne la frquence des lecteurs qui voteront pour cecandidat.

    La distribution dchantillonnage de F suit une loi normale de moyenne p et dcart typen

    pq

    condition que la taille de lchantillon soit suprieure ou gale 30 (n30) et le produit np5.E(F) = p V(F) =

    n

    pqn

    pqF

    a) 200 personnes choisies au hasard parmi le corps lectoral.

    E(F) = 0,46

    V(F) = 20054,0.46,0

    = 0,0012 0,0012Fn = 0,035

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    75

    n = 200 > 30 et le produit n p = 200 . 0,46 = 92 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,46 et dcart type 0,035.

    Le vote donnera une majorit de voix en faveur de ce candidat si la frquence deslecteurs qui voteront pour ce candidat est suprieure ou gale 50 %.

    p(F 0,5) = 1 p(F < 0,5) = p(Z < 035,046,05,0 )

    p(F 0,5) = 1 (1,14) = 1 0,8729 = 0,1271 = 12,71 %

    b) 1000 personnes choisies au hasard parmi le corps lectoral.

    E(F) = 0,46

    V(F) = 100054,0.46,0

    = 0,0002484 0,0002484Fn = 0,016n = 1000 > 30 et le produit n p = 1000.0,46 = 460 > 5. La distribution dchantillonnage de Fsuit donc une loi normale de moyenne 0,46 et dcart type 0,016.

    Le vote donnera une majorit de voix en faveur de ce candidat si la frquence des

    lecteurs qui voteront pour ce candidat est suprieure ou gale 50 %.

    p(F 0,5) = 1 p(F < 0,5) = p(Z < 016,046,05,0 )

    p(F 0,5) = 1 (2,5) = 1 0,9938 = 0,0062 = 0,62 %

    4.4.2. Solution de lexercice 4.3.2.

    Soit F la variable alatoire qui dsigne la frquence des garons parmi les 200 prochains

    enfants natre.

    E(F) = p = 0,5

    V(F) =n

    pq= 200

    5,0.5,0= 0,0013 0,0013F = 0,0354

    n = 200 > 30 et le produit n p = 200.0,5 = 100 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,5 et dcart type 0,0354.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    76

    a) Probabilit pour que parmi les 200 prochains enfants natre il y ait moins de 40 % degarons.

    p(F < 0,4) = p(Z < 0354,05,04,0 ) = (-2,82) = 1 0,9976 = 0,0024

    b) Probabilit pour que parmi les 200 prochains enfants natre il y ait entre 43 % et 57 % defilles.

    p(0,43 < F < 0,57) = p(Z < 0354,05,057,0 ) - p(Z < 0354,0

    5,043,0 )

    p(0,43 < F < 0,57) = (1,98) - (-1,98)

    p(0,43 < F < 0,57) = 0,9761 0,0239 = 0,9522

    c) Probabilit pour que parmi les 200 prochains enfants natre il y ait plus de 54 % degarons.

    p(F > 0,54) = 1 - p(Z < 0354,05,054,0 )

    p(F > 0,4) = 1 - (1,13) = 1 0,8708 = 0,1292

    4.4.3. Solution de lexercice 4.3.3.

    Soit F la variable alatoire qui dsigne la frquence des garons parmi les 200 enfants de

    lchantillon.

    E(F) = p = 0,5

    V(F) =n

    pq= 200

    5,0.5,0= 0,0013 0,0013 F = 0,0354

    n = 200 > 30 et le produit n p = 200.0,5 = 100 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,5 et dcart type 0,0354.

    a) Nombre dchantillon de moins de 40 % de garons.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    77

    p(F < 0,4) = p(Z < 0354,05,04,0 )

    p(F < 0,4) = (-2,82) = 1 0,9976 = 0,0024

    Nombre dchantillon de moins de 40 % de garons est :

    1000 . 0,0024 = 2,4.

    On peut sattendre 2 ou 3 chantillons qui auront moins de 40 % de garons.

    b) Nombre dchantillon qui auront entre 40% et 60% de garons.

    p(0,40 < F < 0,60) = p(Z < 0354,05,060,0 ) - p(Z < 0354,0

    5,040,0 )p(0,40 < F < 0,60) = (2,82) - (-2,82)

    p(0,40 < F < 0,60) = 0,9976 0,0024 = 0,9952

    Nombre dchantillon qui auront entre 40% et 60% de garons est :

    1000 . 0,9952 = 995,2.

    On peut sattendre 995 chantillons qui auront entre 40 % et 60 % de garons.

    c) Nombre dchantillon de 53 % ou plus de filles.

    53 % ou plus de filles est quivalente 47 % de garons ou moins.

    p(F < 0,47) = p(Z < 0354,05,047,0 )

    p(F < 0,47) = (-0,85) = 1 0,8023 = 0,1977

    Nombre dchantillon qui auront 53 % ou plus de filles est :

    1000 . 0,1977 = 197,7

    On peut sattendre 198 chantillons qui auront 53 % ou plus de filles.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    78

    4.4.4. Solution de lexercice 4.3.4.

    Soit F1 la variable alatoire qui dsigne la frquence des gens du premier chantillon qui

    ont vot pour ce candidat.

    E(F1) = p = 0,65

    V(F1) =n

    pq= 200

    35,0.65,0= 0,0011 0,0011F1 = 0,0337

    n = 200 > 30 et le produit n p = 200.0,65 = 130 > 5. La distribution dchantillonnage de F1 suitdonc une loi normale de moyenne 0,65 et dcart type 0,0337.

    Soit F2 la variable alatoire qui dsigne la frquence des gens du deuxime chantillon qui

    ont vot pour ce candidat.

    E(F2) = p = 0,65

    V(F2) =n

    pq= 200

    35,0.65,0= 0,0011 0,0011F2 = 0,0337

    n = 200 > 30 et le produit n p = 200.0,65 = 130 > 5. La distribution dchantillonnage de F2 suitdonc une loi normale de moyenne 0,65 et dcart type 0,0337.

    Dsignons par F la diffrence entre les frquences des gens qui ont vot pour ce candidat danschaque chantillon.

    E(F) = E(F1 F2) = E(F1) E(F2) = 0,65-0,65 = 0

    V(F) = V(F1 F2) = V(F1) V(F2) = 0,0011+0,0011 = 0,0022

    0,0022F = 0,0469La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type0,0469.

    p( 21 FF > 0,1) = p( F > 0,1) = 1 - p( F 0,1)

    p( 21 FF > 0,1) = 1 p(-0,1 F 0,1)

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    79

    p( 21 FF > 0,1) = 1 [p(Z 0469,001,0 ) - p(Z 0469,0

    01,0 )]p( 21 FF > 0,1) = 1 [(2,13) - (-2,13)]p( 21 FF > 0,1) = 1 (0,9834 0,0166) = 0,03324.4.5. Solution de lexercice 4.3.5.

    a) Probabilit davoir plus de 70 % dadmis dans un chantillon de 35 tudiants.

    Soit F la variable alatoire qui dsigne la frquence des tudiants admis parmi les 35

    tudiants de lchantillon.

    Puisquon na pas dinformation sur le taux de russite dans cette cole, on le considre gal 50 %.

    E(F) = p = 0,5

    V(F) =n

    pq= 35

    5,0.5,0= 0,0071 0,0071F = 0,0845

    n = 35 > 30 et le produit n p = 35.0,5 = 17,5 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,5 et dcart type 0,0845.

    p(F > 0,7) = 1 - p(Z < 0845,05,07,0 )

    p(F > 0,7) = 1 - (2,37) = 1 0,9911 = 0,0089

    b) Probabilit davoir plus de 15 % de diffrence dans les taux de russite de deux chantillonsindpendants de 100 tudiants chacun.

    Soit F1 la variable alatoire qui dsigne la frquence des tudiants admis parmi les 100

    tudiants du premier chantillon.

    E(F1) = p = 0,5

    V(F1) =n

    pq= 100

    5,0.5,0= 0,0025 0,0025F1 = 0,05

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    80

    n = 100 > 30 et le produit n p = 100.0,5 = 50 > 5. La distribution dchantillonnage de F1 suitdonc une loi normale de moyenne 0,5 et dcart type 0,05.

    Soit F2 la variable alatoire qui dsigne la frquence des tudiants admis parmi les 100

    tudiants du deuxime chantillon.

    E(F2) = p = 0,5

    V(F2) =n

    pq= 100

    5,0.5,0= 0,0025 0,0025F2 = 0,05

    n = 100 > 30 et le produit n p = 100.0,5 = 50 > 5. La distribution dchantillonnage de F2 suitdonc une loi normale de moyenne 0,5 et dcart type 0,05.

    Dsignons par F la diffrence dans les taux de russite des deux chantillons indpendants de100 tudiants chacun.

    E(F) = E(F1 F2) = E(F1) E(F2) = 0,5-0,5 = 0

    V(F) = V(F1 F2) = V(F1) V(F2) = 0,0025+0,0025 = 0,0050,005F = 0,0707

    La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type0,0707.

    p( 21 FF > 0,15) = p( F > 0,15) = 1 - p( F 0,15)p( 21 FF > 0,15) = 1 p(-0,15 F 0,15)p( 21 FF > 0,15) = 1 [p(Z 0707,0

    015,0 ) - p(Z 0707,0015,0 )]

    p( 21 FF > 0,15) = 1 [(2,12) - (-2,12)]p( 21 FF > 0,15) = 1 (0,9830 0,0170) = 0,03404.4.6. Solution de lexercice 4.3.6.

    - Probabilit pour que le candidat 1 ait plus de 25 % des suffrages.

    Soit F1 la variable alatoire qui dsigne la frquence des votants qui voteront pour le

    candidat 1.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    81

    E(F1) = p = 0,34

    V(F1) = 1NnN

    n

    pq= 112000

    10012000

    100

    66,0.34,0= 0,0022

    0,0022F1 = 0,0472n = 100 > 30 et le produit n p = 100.0,34 = 34 > 5. La distribution dchantillonnage de F1 suitdonc une loi normale de moyenne 0,34 et dcart type 0,0472.

    p(F1 > 0,25) = 1 - ( 0472,034,025,0 )

    p(F1 > 0,25) = 1 - (-1,91) = 0,9719- Probabilit pour que le candidat 2 ait plus de 20 % des suffrages.

    Soit F2 la variable alatoire qui dsigne la frquence des votants qui voteront pour le

    candidat 2.

    E(F2) = p = 0,14

    V(F2) = 1NnN

    n

    pq= 112000

    10012000

    100

    86,0.14,0= 0,0012

    0,0012F2 = 0,0346n = 100 > 30 et le produit n p = 100.0,14 = 14 > 5. La distribution dchantillonnage de F1 suitdonc une loi normale de moyenne 0,14 et dcart type 0,0346.

    p(F2 > 0,20) = 1 - ( 0346,014,020,0 )

    p(F2 > 0,20) = 1 - (1,73) = 0,04184.4.7. Solution de lexercice 4.3.7.

    a) Probabilit pour que le dernier test donne une frquence de pices dfectueuses infrieure ougale 1 %, 2 %, 3 %, 4 % et 5 % dans un chantillon de 1000 pices.

    Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans

    lchantillon.

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    82

    E(F) = p = 0,05

    V(F) =n

    pq= 1000

    95,0.05,0= 0,0000475

    0,0000475F = 0,00689n = 1000 > 30 et le produit n p = 1000.0,05 = 50 > 5. La distribution dchantillonnage de Fsuit donc une loi normale de moyenne 0,05 et dcart type 0,00689.

    p(F 0,01) = p(Z < 00689,005,001,0 ) = (-5,8) = 0

    p(F 0,02) = p(Z < 00689,005,002,0 ) = (-4,35) = 0

    p(F 0,03) = p(Z < 00689,005,003,0 ) = (-2,90) = 0,0019

    p(F 0,04) = p(Z < 00689,005,004,0 ) = (-1,45) = 0,0735

    p(F 0,05) = p(Z < 00689,005,005,0 ) = (0) = 0,5

    b) Probabilit pour que le dernier test donne une frquence de pices dfectueuses infrieure ougale 1 %, 2 %, 3 %, 4 % et 5 % dans un chantillon de 100 pices.

    Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans

    lchantillon.

    E(F) = p = 0,05

    V(F) =n

    pq= 100

    95,0.05,0= 0,000475

    0,000475F = 0,02179n = 100 > 30 et le produit n p = 100.0,05 = 5. La distribution dchantillonnage de F suit doncune loi normale de moyenne 0,05 et dcart type 0,02179.

    p(F 0,01) = p(Z < 02179,005,001,0 ) = (-1,84) = 0,0329

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    83

    p(F 0,02) = p(Z < 02179,005,002,0 ) = (-1,38) = 0,0838

    p(F 0,03) = p(Z < 02179,005,003,0 ) = (-0,92) = 0,1788

    p(F 0,04) = p(Z < 02179,005,004,0 ) = (-0,46) = 0,3228

    p(F 0,05) = p(Z < 02179,005,005,0 ) = (0) = 0,5

    On constate que pour un chantillon de taille plus petite, les probabilits sont plus grandes.Plus la taille de lchantillon est grande plus le risque davoir des pices dfectueuses estgrand.

    c) Taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ou gal 4 %avec une probabilit de 98 %.

    Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans

    lchantillon de taille n.

    E(F) = p = 0,05

    V(F) =n

    pq=

    n

    95,0.05,0=

    n

    0475,0

    n

    2179,0n

    0475,0F

    p(F 0,04) = 0,98

    p(Z n = 1996 pices

    Un chantillon de 1996 pices peut garantir 98 % de chances davoir moins de 4 % de picesdfectueuses.

    4.4.8. Solution de lexercice 4.3.8.

    a) Probabilit davoir un taux de notorit qui dpasse 55 %

    Soit F la variable alatoire qui dsigne la frquence des personnes de lchantillon qui

    connaissent la marque.

    Puisquon na pas dinformation sur le taux de notorit dans la population, on le considregal 50 %.

    E(F) = p = 0,5

    V(F) =n

    pq= 400

    5,0.5,0= 0,000625 025,00,000625F

    n = 400 > 30 et le produit n p = 400.0,5 = 200 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,5 et dcart type 0,025.

    p(F > 0,55) = 1 - p(Z < 025,05,055,0 )

    p(F > 0,55) = 1 - (2) = 0,0228

    b) Probabilit davoir un taux de notorit qui dpasse 60 % si on pense que la notorit est de60 %.

    E(F) = p = 0,6

    V(F) =n

    pq= 400

    4,0.6,0= 0,0006 02449,00,0006 F

    p(F > 0,55) = 1 - p(Z < 02449,06,055,0 )

    p(F > 0,55) = 1 - (-2,04) = 0,9793

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    85

    4.4.9. Solution de lexercice 4.3.9.

    Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans

    lchantillon.

    E(F) = p = 0,05

    V(F) =n

    pq= 300

    95,0.05,0= 0,00016

    01258,00,00016 F n = 300 > 30 et le produit n p = 300.0,05 = 15 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,05 et dcart type 0,01258.

    Laffirmation du fournisseur est plausible si la probabilit davoir plus de 5 % de picesdfectueuses est faible.

    p(F 0,06) = 1 - p(Z < 01258,005,006,0 )

    p(F 0,06) = 1 - (0,79) = 0,2148

    Le contrle de 300 pices donne 21,48 % de chances davoir 6 % ou plus de picesdfectueuses. Laffirmation du fournisseur est probable 78,52 %.

    4.4.10. Solution de lexercice 4.3.10.

    a) Probabilit que sur un chantillon alatoire de 200 clients, moins de 70 % soient satisfaits.

    Soit F la variable alatoire qui dsigne la frquence des clients de lchantillon qui sont

    satisfaits.

    E(F) = p = 0,8

    V(F) =n

    pq= 200

    2,0.8,0= 0,0008

    0,028280,0008 F

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    86

    n = 200 > 30 et le produit n p = 200.0,8 = 160 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,8 et dcart type 0,02828.

    p(F < 0,7) = p(Z < 02828,08,07,0 )

    p(F < 0,7) = (-3,54) = 0,0002

    b) Probabilit davoir plus de 2 % de diffrence entre les taux de satisfaction obtenus auprsdes deux chantillons.

    Soit F la variable alatoire qui dsigne la frquence des clients du deuxime chantillon

    qui sont satisfaits.

    E(F) = p = 0,8

    V(F) =n

    pq= 300

    2,0.8,0= 0,00053

    0,023090,00053' F n = 300 > 30 et le produit n p = 300.0,8 = 240 > 5. La distribution dchantillonnage de F suitdonc une loi normale de moyenne 0,8 et dcart type 0,02309.

    Dsignons par F la diffrence dans les taux de satisfaction des deux chantillons indpendants.

    E(F) = E(F F) = E(F) E(F) = 0,8-0,8 = 0V(F) = V(F F) = V(F) + V(F) = 0,0008+0,00053 = 0,00133

    0,036470,00133 F La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type0,03647.

    p( 'FF > 0,02) = p( F > 0,02) = 1 - p( F 0,02)p( 'FF > 0,02) = 1 p(-0,02 F 0,02)

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    87

    p( 'FF > 0,02) = 1 [p(Z 03647,0002,0 ) - p(Z 03647,0

    002,0 )]p( 'FF > 0,02) = 1 [(0,55) - (-0,55)]p( 'FF > 0,02) = 1 (0,7088 0,2912) = 0,5824

  • Statistiques dcisionnelles 4. Loi de probabilit de la proportion dchantillon

    88

  • Statistiques dcisionnelles Partie 3. Principe de lestimation

    89

    PARTIE 3PRINCIPE DE LESTIMATION

    Les premiers problmes dinfrence statistique auxquels sapplique la thorie des distributionsdchantillonnage sont les problmes destimations. Le but poursuivi est destimer, partirdun chantillon, la ou les valeurs numriques dun ou de plusieurs paramtres de la populationconsidre et de dterminer la prcision de cette ou de ces estimations.

    DEFINITION DUN ESTIMATEUR.

    Soient une population quelconque, dont la distribution de probabilit L(X) est fonction dunparamtre : L(X) = f(X, ) et un chantillon alatoire et simple deffectif n extrait de cettepopulation.

    On appelle estimateur du paramtre , toute fonction alatoire des valeurs observes, X1, X2,X3,, Xn, susceptibles de servir estimer

    Tn = f (X1, X2, , Xn)

    On appelle estimation les valeurs numriques t1, t2, de cette variable alatoire Tn.

    QUALITES DUN ESTIMATEUR.

    Absence de biais

    La premire qualit dun bon estimateur est labsence derreur systmatique ou de biais. Cettequalit implique que la vraie valeur doit tre retrouve en moyenne :

    E(Tn) = Tout estimateur qui satisfait cette condition est dit sans biais ou non biais.

  • Statistiques dcisionnelles Partie 3. Principe de lestimation

    90

    Variance minimale

    Une deuxime qualit dun bon estimateur est de possder une prcision suffisante. Cetteprcision peut tre mesure par le moment dordre deux par rapport .

    E[(Tn - )]Pour les estimateurs non biaiss, ce moment se confond avec la variance :

    E[(Tn - )] = V(Tn)On peut dmonter qu tout paramtre correspond une valeur minimum de E[(Tn - )].La fonction qui correspond ce minimum, dfinit lestimateur de variance minimum.

  • Statistiques dcisionnelles. 5. Estimation de la moyenne dune population

    91

    CHAPITRE 5ESTIMATION DE LA MOYENNE DUNE POPULATION

    5.1. ESTIMATION DUNE MOYENNE.

    5.1.1. Estimation ponctuelle.

    La meilleure estimation de la moyenne m dune population, qui puisse tre dduite dunchantillon alatoire et simple, est la moyenne de lchantillon.

    X=m_^

    La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, estmesure par lerreur standard de la moyenne :

    nx

    Signalons ds prsent, comme nous le verrons, dans le chapitre suivant, que lestimationponctuelle et sans biais de la variance dune population mre, partir des rsultats obtenusdun chantillon simple et alatoire est :

    )x(v1-n

    n

    ^ = 1n)xx(

    n

    1ii

    5.1.2. Estimation par intervalle de confiance.

    5.1.2.1. Cas dune population normale.

    Si on sintresse la moyenne inconnue m dune population normale dcart type connu ,lestimation, par intervalle de confiance, consiste dterminer, de part et dautre de

    lestimateurX , les bornes 1X

    et 2X

    dun intervalle qui a un niveau de confiance (1-) de

    contenir m.

  • Statistiques dcisionnelles. 5. Estimation de la moyenne dune population

    92

    Les limites 1X

    et 2X

    sont telles que :

    p ( 1X

    m 2X

    ) = 1 - ou p (m < 1X

    ) = p (m > 2X

    ) = /2

    Si on dsigne par21Z la valeur de la variable normale centre et rduite lue dans la table,

    les limites de confiances sont :

    1X

    =

    X -

    2-1

    Z n

    et 2X

    =

    X +

    21

    Z n

    On notera lintervalle de confiance :

    X

    21

    Z n

    ou

    nZx;nZx 2121Cest un intervalle symtrique par rapport la moyenne.

    Dans le cas dune population normale dont on ne connat pas lcart type, on utiliselestimation ponctuelle et sans biais de lcart type, savoir :

    )x(V1n

    n

    5.1.2.2. Cas dune population de distribution inconnue.

    Pour une population de distribution de probabilit inconnue (cart type inconnu), on utilise laquasi-variance comme estimation de la variance de la population.

    Lestimation ponctuelle et sans biais de lcart type est :

    )x(V1n

    n

    Lintervalle de confiance de la moyenne sera dfini selon les cas.

  • Statistiques dcisionnelles. 5. Estimation de la moyenne dune population

    93

    5.1.2.2.1. Cas dun chantillon deffectif infrieur 30 (n < 30)

    Dans ce cas, la moyenne dun chantillon peut