ecart type experimental : quelle formule choisir ?
DESCRIPTION
Je viens de publier un billet sur mon blog qui traite de l'estimation d'un intervalle de confiance pour un écart-type (Suivre http://www.lametrologieautrement.com). Cela m'a rappelé une ancienne conférence, présentée en 2003 dans le cadre d'un congrès international de Métrologie. J'ai relu avec beaucoup de tolérance ce travail "d'il y a 10 ans", mais que de progrès réalisés depuis ...TRANSCRIPT
ECART-TYPE EXPERIMENTAL :QUELLE FORMULE CHOISIR ?
Jean-Michel POU :Dirigeant Fondateur de la société DELTA MU Conseil
Président du G.I.E QUANTUM METWORK
QUELLE FORMULE CHOISIR ?
Cet exposé a 2 objectifs :
1. Répondre à la question initiale concernant la façon de calculer un écart type expérimental à partir d’un échantillon de valeurs.
2. Montrer les perspectives que présentent l’utilisation de la simulation numérique.
QUELLE FORMULE CHOISIR ?
Dans le cas des évaluations d’incertitudes dites de « type A », la qualité de l’estimateur d’écart-type dépend du nombre d’échantillons (de mesures) utilisés.
La littérature présente différentes approches dans le cas des faibles échantillonnages. Certaines méthodes proposent de multiplier l’écart type calculé suivant la formule générale par un correcteur, d’autres de diviser l’étendue du prélèvement par un scalaire.
QUELLE FORMULE CHOISIR ?
La norme NF X 06-072 travaille en appliquant un correcteur à l’écart type théorique. Les coefficients, qui dépendent du nombre d’échantillons, sont les suivants :
Nb d ’échantillons 2 3 4 5 6 7
Correcteur 1,254 1,128 1,085 1,063 1,05 1,043
8 9 10 11 12 13 14
1,036 1,031 1,028 1,025 1,023 1,02 1,02
QUELLE FORMULE CHOISIR ?
La norme NF ENV ISO 14253-2 travaille elle aussi en appliquant un correcteur à l’écart type théorique. Les coefficients, différents des précédents, dépendent également du nombre d’échantillons :
Nb d’échantillons 2 3 4 5 6 7 8 9
Correcteur 7 2,3 1,7 1,4 1,3 1,3 1,2 1,2
QUELLE FORMULE CHOISIR ?
La norme FD X 07-021 propose de diviser l’étendue d’un prélèvement par un scalaire, lui aussi en fonction du nombre d’échantillons prélevés :
Nb d’échantillons 2 3 4 5 6
Diviseur 1,128 1,693 2,059 2,326 2,534
7 8 9 10 11 12
2,704 2,847 2,97 3,078 3,173 3,258
QUELLE FORMULE CHOISIR ?
Nb d’échantillons 2 3 4 5
Diviseur 1,41421 1,91155 2,23887 2,48124
6 7 8 9 10
2,67253 2,82981 2,96288 3,07794 3,17905
11 12 13 14 15
3,26909 3,35016 3,42378 3,49116 3,55333
16 17 18 19 20
3,61071 3,66422 3,71424 3,76118 3,80537
Le M.S.A (Measurement System Analysis) propose également de diviser l’étendue d’un prélèvement par un scalaire, fonction évidemment du nombre d’échantillons prélevés :
QUELLE FORMULE CHOISIR ?
Chaque méthode propose des solutions différentes qui conduisent, évidemment, à des estimateurs différents. La simulation numérique permet de définir l’approche la plus cohérente. La méthode proposée s’appuie sur la simulation numérique. A partir d’une population importante déterminée (plus de 100 000 éléments), on réalise des prélèvements, de 2 à 50 éléments, puis on compare l’écart type du prélèvement à l’écart type théorique déterminé à partir de toute la population. On recherche également la relation entre l’étendue du prélèvement et l’écart type de la distribution totale.Afin d’évaluer l’incertitude sur l’écart type, on prélève n fois 2 éléments, n fois 3 éléments, …, n fois 50 éléments puis on calcule l’écart type moyen et l’écart type de l’écart type pour chaque type de prélèvements (2, 3, … 50 éléments) et pour chaque formule. On fait de même concernant l’approche par rapport à l’étendue.
QUELLE FORMULE CHOISIR ?
La pertinence des résultats obtenus est directement liée à la qualité du simulateur numérique utilisé. Quatre lois sont utilisées (Uniforme, normale, dérivée d’arc sinus et triangle isocèle). Le simulateur utilisé donne, pour 10 000 tirages, les résultats suivants :
Loi Uniforme
Loi Dérivée d'arc sinus Loi normale
Loi Triangle isocèle
QUELLE FORMULE CHOISIR ?
La simulation numérique montre que toutes les approches proposées donnent des résultats différents, la plus éloignées de la réalité étant l’approche suivant la norme NF ENV ISO 14 253-2 (Cf actes du congrès 2003).
La simulation numérique permet de redéfinir des coefficients et de leur associer une incertitude.
La correction de l’écart-type expérimental est-elle fonction de la valeur de l’écart type ?
En réalisant n (500) prélèvements dans des distributions d’écart types théoriques variant de 0,01 à 100, il est possible de vérifier si l’écart type expérimental est influencé par l’écart type théorique :
Toutes lois confondues - 2 échantillons
y = 6E-05x + 1,2344
1
1,2
1,4
1,6
0 20 40 60 80 100 120
Toutes lois confondues - 3 échantillons
y = -7E-05x + 1,107
1
1,05
1,1
1,15
1,2
0 20 40 60 80 100 120
Toutes lois confondus - 4 échantillons
y = 9E-05x + 1,0642
1
1,02
1,04
1,06
1,08
1,1
1,12
1,14
1,16
0 20 40 60 80 100 120
Toutes lois confondues - 5 mesures
y = 6E-06x + 1,0469
1
1,02
1,04
1,06
1,08
1,1
1,12
0 20 40 60 80 100 120
Les graphes ci-dessus montrent que la correction n’est pas fonction de la valeur de l’écart type lui-même
La correction de l’écart-type expérimental est-elle fonction de la loi de distribution initiale ?
L’analyse du rapport entre l’écart type expérimental et l’écart type théorique d’une part, l’étendue du prélèvement et l’écart type théorique d’autre part, en fonction du nombre d’échantillons montre :
Ecart type théorique / Ecart type expérimental
0,9
0,95
1
1,05
1,1
1,15
1,2
1,25
1,3
0 10 20 30 40 50 60
Dérivée d'arcsinus
Normale
Uniforme
Triangle
Etendue du prélèvement / Ecart type théorique
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
0 10 20 30 40 50 60
Dérivée d'arcsinus
Normale
Uniforme
Triangle
Le rapport n’est pas indépendant de la loi initiale, dans les deux cas ! Néanmoins, et puisqu’il n’est pas possible, au préalable, de connaître la loi de distribution initiale dans le cas d’une expérimentation, la moyenne des résultats obtenus, pour toutes les lois initiales, sera retenue.
Dispersion des coefficients ?
Chaque simulation réalisée conduit à une rapport entre écart type expérimental et écart type théorique d’une part, étendue et écart type théorique d’autre part. n simulations donnent n rapports … on s’attachera à observer le rapport et l’écart type sur le rapport, écart type résultant des n simulations :
Rapport et incertitude sur le rapport (en fonction de l'écart type)
0,9000
0,9500
1,0000
1,0500
1,1000
1,1500
1,2000
1,2500
1,3000
1,3500
0 10 20 30 40 50 60
0,0000
0,0050
0,0100
0,0150
0,0200
0,0250
0,0300
0,0350
0,0400
0,0450
Coeff icient sur écart type
ÉcartTypeDeNouveau Coeff
Rapport et incertitude sur le rapport (en fonction de l'étendue)
0,0000
1,0000
2,0000
3,0000
4,0000
5,0000
6,0000
0 10 20 30 40 50 60
0,000
0,100
0,200
0,300
0,400
0,500
0,600
0,700
Coeff sur étendue
ÉcartTypeDeNouveau Coeff Etendue
La simulation numérique montre que l’incertitude sur le rapport est nettement plus grande lorsqu’on travaille sur les étendues plutôt que sur les écart types. Pour les faibles échantillonnages, l’incertitude semble néanmoins plus petite !
Incertitude globale sur les écart-types corrigésLorsqu’on travaille sur les écart types, la formule s’écrit : sCor = Sexp x Coeff.L’incertitude sur scor, par application de la loi de propagation, s’écrit :u² sCor = (dsCor/dsexp) x u²sexp + (dsCor/dCoeff) x u²Coeff Lorsqu’on travaille sur les étendues, la formule s’écrit : sCor = Etendue / Coeff.L’incertitude sur scor, par application de la loi de propagation, s’écrit :u² sCor = (dsCor/dEtendue) x u²Etendue + (dsCor/dCoeff) x u²Coeff L’applicatrion numérique montre, en fonction du nombre d’échantillons :
A partir de l'écart type expérimental
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
140,00%
160,00%
0 20 40 60 80 100 120
Incertitude %(2 mesures)
Incertitude %(3 mesures)
Incertitude %(4 mesures)
Incertitude %(5 mesures)
Incertitude %(10 mesures)
Incertitude %(15 mesures)
Incertitude %(20 mesures)
Incertitude %(30 mesures)
Incertitude %(40 mesures)
Incertitude %(50 mesures)
En fonction de l'étendue
0,00%
50,00%
100,00%
150,00%
200,00%
250,00%
0 20 40 60 80 100 120
Incertitude %(2 mesures)
Incertitude %(3 mesures)
Incertitude %(4 mesures)
Incertitude %(5 mesures)
Incertitude %(10 mesures)
Incertitude %(15 mesures)
Incertitude %(20 mesures)
Incertitude %(30 mesures)
Incertitude %(40 mesures)
Incertitude %(50 mesures)
L’incertitude globale sur l’écart type corrigé, calculée à partir des résultats obtenus par simulation numérique ( usexp, uCoeff et uEtendue) montre que l’approche à partir de l’étendue conduit à une incertitude sur l’écart type corrigé nettement supérieure à celle obtenue à partir de l’écart type expérimental
Distribution des écart-types expérimentaux
La distribution des écart-types expérimentaux, en fonction du nombre d’échantillons et de la loi initiale, prend les allures suivantes :
Loi initale normale - 2 échantillons Loi initiale normale - 3 échantillons Loi initale normale - 4 échantillons Loi initiale normale - 5 échantillons
Loi initiale Dérivée d'Arc Sinus - 2 échantillons Loi initiale Dérivée d'Arc Sinus - 3 échantillons Loi initiale Dérivée d'Arc Sinus - 4 échantillons Loi initiale Dérivée d'Arc Sinus - 5 échantillons
Loi initiale Uniforme - 2 échantillons
Tout écart-type, évalué sur la base d’un prélèvement inférieur à 5 échantillons, n’a pas de niveau de confiance appréciable !
Loi initiale uniforme - 3 échantillons Loi initiale Uniforme - 4 échantillons Loi initiale Uniforme - 5 échantillons
Coefficients sur écart-type retenus
Nb Mesures Coefficient sur écart type Incertitude (2s) Incertitude (2s) en % Coeff sur étendue Incertitude(2s) Incertitude (2s) en %
2 1,235 0,082 6,60% 1,146 0,075 6,58%
3 1,106 0,052 4,68% 1,718 0,077 4,47%
4 1,066 0,044 4,17% 2,066 0,074 3,58%
5 1,047 0,036 3,39% 2,302 0,095 4,13%
6 1,035 0,029 2,77% 2,479 0,138 5,57%
7 1,027 0,027 2,67% 2,616 0,195 7,46%
8 1,024 0,029 2,79% 2,719 0,242 8,90%
9 1,020 0,021 2,05% 2,809 0,304 10,83%
10 1,017 0,022 2,16% 2,881 0,350 12,16%
11 1,016 0,019 1,87% 2,942 0,399 13,55%
12 1,013 0,018 1,79% 3,001 0,447 14,89%
13 1,013 0,018 1,81% 3,046 0,485 15,92%
14 1,012 0,018 1,73% 3,088 0,527 17,06%
15 1,011 0,015 1,48% 3,127 0,568 18,16%
16 1,010 0,016 1,54% 3,161 0,603 19,07%
17 1,009 0,014 1,36% 3,194 0,641 20,08%
18 1,009 0,015 1,50% 3,219 0,666 20,70%
19 1,009 0,015 1,49% 3,245 0,698 21,51%
20 1,008 0,012 1,19% 3,272 0,733 22,41%
21 1,008 0,012 1,20% 3,292 0,760 23,08%
22 1,007 0,012 1,24% 3,315 0,788 23,77%
23 1,007 0,012 1,18% 3,333 0,809 24,27%
24 1,006 0,011 1,12% 3,352 0,836 24,94%
25 1,006 0,011 1,06% 3,368 0,859 25,51%
26 1,005 0,010 1,04% 3,388 0,885 26,13%
27 1,006 0,012 1,19% 3,400 0,901 26,50%
28 1,005 0,010 1,04% 3,418 0,929 27,19%
29 1,005 0,010 1,04% 3,431 0,949 27,67%
30 1,005 0,011 1,08% 3,444 0,963 27,98%