elaborazione dei dati sperimentali

36
Chimica Fisica Industriale Modulo A Teoria degli errori Elaborazione dei Dati Sperimentali

Upload: others

Post on 22-Nov-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Chimica Fisica Industriale Modulo A Teoria degli errori

Elaborazione dei Dati Sperimentali

Laboratorio di Chimica Fisica Teoria degli errori

67

MISURA DIRETTA DI UNA GRANDEZZA FISICA

Errori di misura, migliore stima e incertezza

La misura diretta di una grandezza fisica richiede:

la definizione della grandezza in esame;

la definizione di una opportuna unità di misura;

la determinazione del valore della grandezza come rapporto tra la

stessa e l‟unità di misura scelta.

Una volta eseguite le prime due operazioni, la misura consiste quindi

nell‟effettuare la determinazione del valore della grandezza in esame tramite un

opportuno strumento di misura; in questa operazione vengono sicuramente commessi

“errori” di tipo sistematico ed “errori” di tipo accidentale:

Errori sistematici: comportano incertezze sempre nello stesso senso (eccesso o

difetto); ad esempio: cordella metrica allungata errore sempre

in difetto.

Si eliminano (o, meglio, si riducono) utilizzando uno strumento di

misura opportunamente tarato.

Errori accidentali: sono di tipo casuale, quindi comportano incertezze di segno e

valore variabili. A differenza dei precedenti possono venire ridotti

ripetendo più volte la misura (vedi oltre).

La misura di una grandezza fisica X non fornisce quindi un valore numerico, bensì

un intervallo, detto di confidenza, esprimibile come:

X = x x ( unità di misura) (ad esempio: V = 56.4 0.1 ml)

dove: x rappresenta la migliore stima della grandezza X;

x rappresenta l‟incertezza stimata di x (x > 0). Tale incertezza definisce

normalmente l‟intervallo in cui il valore “vero” si trova con buona probabilità

e non con certezza assoluta (vedi oltre).

Laboratorio di Chimica Fisica Teoria degli errori

68

(vedi oltre).

L‟incertezza x dipende, in generale, da entrambi i fattori sopra esposti, per cui sarà

ottenibile, essendo i due tipi di errori indipendenti, come combinazione statistica di un

(x)sist e di un (x)accid , secondo la relazione:

x x x sist

2

accid

2

Per comprendere il significato dei due contributi consideriamo il seguente esempio.

Supponiamo di voler determinare la tensione di vapore di un liquido ad una certa

temperatura; per fare ciò misuriamo, con un manometro a colonna di mercurio, la

pressione di un sistema costituito da un liquido in equilibrio con il proprio vapore ad

una prefissata temperatura. Per fissare la temperatura del sistema utilizziamo un

termostato, il quale è costituito da un recipiente termicamente isolato (per ridurre gli

scambi di calore con l‟esterno) contenente un fluido (in genere acqua), da una unità

riscaldante (una resistenza elettrica che genera calore per effetto Joule), da una unità

raffreddante (un sistema frigorifero o, più semplicemente, una serpentina attraversata da

acqua fredda), e da un sistema di controllo della temperatura. Quando la temperatura

che si vuole raggiungere nel sistema, e quindi nel termostato (temperatura che viene

impostata nel sistema di controllo), è più elevata di quella del bagno termostatico, il

sistema di controllo agisce facendo passare corrente attraverso la resistenza. In tal modo

la temperatura del bagno termostatico sale, e quando raggiunge, o meglio supera di una

certa quantità, il valore impostato, il sistema di controllo disinserisce il riscaldamento e

mette in funzione il circuito di raffreddamento; in realtà, risulta spesso più conveniente,

da un punto di vista costruttivo, mantenere sempre in funzione il sistema di

raffreddamento e far funzionare a intermittenza il solo sistema riscaldante. In ogni caso,

tali operazioni comportano una oscillazione della temperatura del bagno nell‟intorno

del valore fissato, e l‟ampiezza di tali oscillazioni dipende dalle caratteristiche del

sistema di controllo. La qualità del termostato sarà quindi tanto più elevata quanto più

ristretta sarà l‟oscillazione della temperatura a regime; si possono costruire, ad esempio,

termostati a 1C, a 1/10C e a 1/100C.

Per misurare la pressione del sistema utilizziamo invece un manometro a mercurio,

e rileviamo l‟altezza della colonnina di tale fluido che equilibra la pressione dei vapori

Laboratorio di Chimica Fisica Teoria degli errori

69

con cui è a contatto. Per misurare tale altezza possiamo disporre di una comune cordella

metrica, che permette in genere di rilevare lunghezze al decimo di millimetro, oppure di

sistemi di rilevazione un po‟ più sofisticati che permettono di rilevare, ad esempio, il

centesimo di millimetro.

Lo scopo finale della misura è quello di determinare il valore della tensione di

vapore in corrispondenza di un certo valore della temperatura, per cui dovremo stabilire

per entrambi la migliore stima e la relativa incertezza. Va osservato, inoltre, che poiché

il sistema non “risponde” in modo immediato alle inevitabili “oscillazioni” della

temperatura, il valore di pressione misurato in un certo istante non può essere associato

direttamente al valore di temperatura contemporaneamente rilevato, a meno che la

strumentazione non sia così poco sensibile da non permettere di evidenziare le

variazioni delle due grandezze. Vediamo la cosa più in dettaglio.

Utilizzando un termostato a 1/100C e rilevando la temperatura del sistema con un

termometro di sensibilità1 1/10C, le oscillazioni della temperatura non potranno essere

evidenziate (a meno che non derivino da altri fattori) in quanto esse si trovano

all‟interno dell‟intervallo di sensibilità del termometro utilizzato. In assenza di altri

fenomeni, nella determinazione della temperatura del sistema si può pensare quindi di

commettere essenzialmente un “errore sistematico”, in quanto questo non è eliminabile

con misure ripetute che fornirebbero sempre lo stesso valore numerico, e può essere

ridotto solamente utilizzando un termometro più sensibile. Tale incertezza è stimabile,

in assenza di indicazioni più specifiche circa le caratteristiche del termometro, come

metà della sensibilità del termometro stesso.

Se la temperatura del sistema rimane quindi compresa nell‟intervallo 0.05C,

possiamo scrivere (x)accid << (x)sist = (x)sens= 0.05C, per cui x (x)sens = 0.05C e

quindi, ad esempio:

se la temperatura oscilla tra le due tacche 32.5 e 32.6C

t = 32.55 0.05C;

se la temperatura oscilla nell‟intorno della tacca 32.6C

1

Per sensibilità intendiamo la quantità minima rilevabile dallo strumento, e come tale può

dipendere dalla scala scelta. In pratica, negli strumenti analogici essa rappresenta la “distanza”

tra due tacche contigue della scala, mentre negli strumenti digitali rappresenta la differenza

minima rilevabile tra due numeri consecutivi che appaiono sul display (normalmente una unità in

corrispondenza della cifra meno significativa riportata). Poiché normalmente si parla di

sensibilità tanto più elevata quanto più piccola è la quantità minima rilevabile, più correttamente

la sensibilità andrebbe considerata come il reciproco di quest‟ultima.

Laboratorio di Chimica Fisica Teoria degli errori

70

t = 32.60 0.05C.

In questo caso il risultato finale corrisponde a quello che si sarebbe ottenuto

effettuando una singola determinazione; la ripetizione delle misure è comunque servita

ad assicurare che le cause di tipo accidentale non sono significative, cosa che non si

sarebbe potuta stabilire con un‟unica lettura.

Supponiamo ora di disporre invece di un termostato a 1/10C e di un termometro a

1/100C; in questo caso si osserverà l‟oscillazione della temperatura del sistema in un

intervallo più ampio rispetto alla sensibilità del termometro. Per un singolo valore di

temperatura rilevato risulterà quindi (x)sens (x)accid , per cui x (x)accid.

L‟incertezza relativa alla determinazione della temperatura può però essere

opportunamente diminuita, a differenza del caso precedente, effettuando più misure e

mediandole, come vedremo più avanti; in ogni caso, non sarà comunque possibile

ridurre l‟incertezza globale al di sotto di quella definita dalla sensibilità dello strumento

utilizzato.

Analoghe considerazioni possono essere applicate alla determinazione della

pressione, in relazione all‟entità delle oscillazioni della stessa ed alla sensibilità dello

strumento di misura utilizzato. Va inoltre considerato che la determinazione della

pressione richiede la conoscenza della densità del mercurio e della accelerazione di

gravità del laboratorio, nonché delle relative incertezze, e l‟applicazione della teoria

della propagazione degli errori, come sarà più avanti analizzato.

Cifre significative

Una volta condotte le misure, è necessario riportare con il corretto numero di cifre

complessive, dette cifre significative, sia la migliore stima di X che la relativa

incertezza x. Poiché x rappresenta una stima dell‟incertezza, si usa riportare:

per l‟incertezza x solamente una cifra significativa se la prima cifra diversa da

zero è 3, con possibilità di riportare due cifre significative negli altri casi.

per la migliore stima x le cifre “corrispondenti” a quella/e di x.

Avvertenze:

è necessario arrotondare i valori determinati in base al numero di cifre

significative;

è opportuno usare la stessa potenza di 10 per x e x ;

Laboratorio di Chimica Fisica Teoria degli errori

71

se le migliori stime devono essere utilizzate in successivi calcoli, è

necessario impiegare più cifre di quelle significative (almeno una in più)

per evitare errori di arrotondamento, ed arrotondare poi il risultato finale in

base al relativo errore, calcolato mediante propagazione (vedi oltre).

Esempi: non corretto corretto

27.6 3 28 3

27.62 3.3 28 3

84.682 1.04 84.7 1.0

32.476 0.037 32.48 0.04

48.123 0.18 48.12 0.18

268.4 24 268 24

0.07864 0.00253 0.0786 0.0025 o meglio (7.86 0.25)10-2

Vediamo alcune definizioni:

Incertezza assoluta (errore assoluto): x

Incertezza relativa (errore relativo): x /|x | (adimensionale)

Incertezza relativa percentuale: 100 x /|x | (adimensionale)

Accuratezza: è un indice dell‟incertezza globale della misura; più piccola è

l‟incertezza relativa, più accurata è la misura. L‟elevata accuratezza implica

quindi piccoli errori sia sistematici che accidentali. Non deve essere confusa

con la precisione, anche se spesso i due termini vengono usati come

sinonimi.

Precisione: è un indice legato alla riproducibilità della misura. Una misura è

molto precisa quando i risultati che si ottengono ripetendola più volte sono

molto vicini tra loro, e quindi al valore medio; questo implica che gli errori

casuali siano di piccola entità. La precisione è legata alla deviazione

standard (vedi oltre), e risulta elevata se quest‟ultima è bassa.

Si può dire, per concludere, che una misura molto accurata è necessariamente

molto precisa, mentre una misura molto precisa può essere poco accurata per effetto di

elevati errori sistematici.

Laboratorio di Chimica Fisica Teoria degli errori

72

Determinazioni singole e ripetute

Sulla base di quanto analizzato in un precedente esempio, allo scopo di determinare

il valore dell‟incertezza più significativa per la grandezza in esame è opportuno

effettuare più determinazioni sperimentali, e poi definire l‟intervallo x x effettuando

una corretta analisi dei dati ottenuti. Se il numero di determinazioni è sufficientemente

elevato, questa analisi è essenzialmente basata su considerazioni di tipo statistico; se, al

contrario, è possibile effettuare una sola misurazione (come ad esempio nella

determinazione, in tempi successivi, della concentrazione di una specie chimica durante

il decorso di una reazione), la determinazione dell‟incertezza risulta alquanto delicata e

finisce spesso col basarsi solamente sul valore della sensibilità dello strumento

utilizzato, con la conseguente possibilità di ottenere un valore sottostimato.

Consideriamo a tale riguardo il seguente esempio.

L‟incertezza relativa alla concentrazione di una soluzione preparata sciogliendo

una quantità pesata di soluto in un solvente, e portando poi a volume in un matraccio

tarato, dipende, come sarà più avanti esposto nella teoria della propagazione degli

errori, dalle incertezze legate alla determinazione della massa e del volume. Le normali

bilance analitiche hanno in genere sensibilità di 0.1 mg, ma ciò non significa che

l‟incertezza che si commette nella pesata sia di tale entità, indipendentemente dalla

quantità pesata. A volte, infatti, l‟incertezza che accompagna la determinazione dipende

dalla scala scelta, ed in tal caso il costruttore riporta la precisione delle varie scale,

espressa in percentuale. Ad esempio, se si pesano 1.2368 g e nella scala utilizzata la

precisione è 0.1%, si deve scrivere m = 1.2368 0.0012 g, mentre se la precisione è

1% si deve scrivere m = 1.237 0.012 g, avendo calcolato le incertezze come 0.1 e

1% del valore pesato, rispettivamente, ed avendo opportunamente arrotondato le

incertezze stesse e, di conseguenza, la migliore stima della pesata effettuata.

In questo caso, l‟incertezza che accompagna la singola determinazione della massa

si basa quindi non sul valore della sensibilità della bilancia, che “risente” comunque di

una variazione della massa di 0.1 mg in qualunque scala utilizzata, ma su quello della

precisione data dal costruttore. Poiché questa incertezza è caratteristica dello strumento

utilizzato, non può essere eliminata ripetendo più volte la misura; per ridurla è

Laboratorio di Chimica Fisica Teoria degli errori

73

necessario usare una bilancia con una precisione maggiore nella scala adatta alla

determinazione della massa in questione.

D‟altro canto, ripetendo più volte la misura dello stesso campione si possono

ritrovare, come spesso accade, valori leggermente diversi per effetto di cause di tipo

accidentale, legate ad esempio allo spostamento dell‟azzeramento della bilancia, ad

errori di lettura (parallasse) nelle bilance con scala analogica, a “rumori” esterni che

influenzano l‟equilibrio della bilancia stessa, ecc.. Se le differenze tra i valori trovati

risultano piccole rispetto all‟incertezza calcolata sulla base della precisione della scala

utilizzata, allora le oscillazioni osservate sono in pratica prive di significato, in quanto

tutti i valori numerici, opportunamente arrotondati, risultano coincidenti; in questo caso

non ha quindi senso ripetere più volte la misura. Se, al contrario, tali oscillazioni

risultano maggiori dell‟incertezza calcolata sopra, è necessario tenerne conto sulla base

di opportune considerazioni di tipo statistico (come riportato più avanti), ed è quindi

utile ripetere più volte la determinazione della massa se si vuole ridurre il valore

dell‟incertezza.

Si deve inoltre osservare che nella definizione della quantità di sostanza pesata

possono entrare in gioco anche altri fattori, come ad esempio il grado di purezza della

sostanza stessa; se nel flacone che la contiene è indicata una purezza compresa tra il 90

ed il 96%, non ha senso ripetere più volte la misura per avere molte cifre significative,

in quanto si può al massimo ritenere che la quantità di sostanza che interessa è il

93 3% della massa pesata.

Al contrario di quanto può essere effettuato nella determinazione di una massa

mediante pesata, la determinazione del volume di una soluzione preparata in un

matraccio è unica, per cui non possono essere fatte considerazioni di tipo statistico; in

questo caso vanno opportunamente vagliate tutte le possibili fonti di imprecisione, sia

di tipo sistematico che accidentale.

Normalmente la vetreria tarata riporta il valore della tolleranza, che in pratica ne

esprime il grado di taratura, e che può essere interpretata come la più piccola

imprecisione che accompagna il valore del volume della vetreria stessa.

Ad esempio, il volume di un matraccio che riporta la dicitura 50 ml a 20C,

tolleranza 0.07 ml, può essere considerato come V = 50.00 0.07 ml. L‟incertezza

globale del volume dipende però anche da altre cause, quali la mancata termostatazione

Laboratorio di Chimica Fisica Teoria degli errori

74

del matraccio e della soluzione alla temperatura indicata, e l‟errore di “lettura” che si

commette quando si porta a volume.

La prima incertezza può essere indicativamente stimata sulla base del valore del

coefficiente di dilatazione termica della soluzione (spesso simile a quello del solvente),

tenendo conto che la temperatura di laboratorio è in genere di pochi gradi inferiore o

superiore a 20C; l‟errore che si commette quando si porta a volume può essere valutato

invece stimando la distanza menisco della soluzione-tacca del matraccio e l‟area del

collo del matraccio stesso. È importante osservare che tali incertezze sono stimate e

vanno quindi determinate in modo abbastanza grossolano, evitando l‟uso di molte cifre

nei calcoli.

L‟incertezza finale sul volume dipenderà naturalmente dalla combinazione delle

singole incertezze determinate, e andrà effettuata sulla base di quanto sarà più avanti

esposto nella teoria della propagazione degli errori.

Sulla base degli esempi riportati risulta quindi evidente che per alcune grandezze è

possibile effettuare una sola determinazione, mentre per altre può essere inutile o, al

contrario, indispensabile, effettuarne più di una. In quest‟ultimo caso il dato finale è

ottenuto sulla base di opportune considerazioni di tipo statistico, come verrà indicato

nel prossimo paragrafo.

DISTRIBUZIONE GAUSSIANA O NORMALE DELLE MISURE

Supponiamo di effettuare un numero elevato N di misure sperimentali di una

grandezza X utilizzando uno strumento di sensibilità sufficientemente elevata in modo

da poter evidenziare le oscillazioni delle misure dovute a cause accidentali. Tali misure

risulteranno distribuite in un intervallo più o meno ampio, e per N sufficientemente

elevato molti valori (la maggior parte) verranno letti più volte. Riportando in grafico i

valori ottenuti in ascissa e, in ordinata, il numero di volte che un dato valore è stato

ottenuto, si ottiene un istogramma con andamento a massimo centrato nell‟intorno di un

certo valore. Per N tale andamento è descrivibile statisticamente mediante la

relazione di Gauss:

222exp21 cxxxf

Laboratorio di Chimica Fisica Teoria degli errori

75

dove:

xc rappresenta il centro della Gaussiana;

è legata all‟ampiezza della curva (vedi Figura 1);

f(x) rappresenta la probabilità (normalizzata) di rilevare una misura

nell‟intervallo compreso tra x e x + dx, ed è massima in corrispondenza di xc ,

che rappresenta la migliore stima di X (vedi Figura 1).

Le probabilità di rilevare una misura all‟interno ed all‟esterno dell‟intervallo

xc r xc r (ricavabili mediante opportuna integrazione della funzione) sono

riportate nella tabella:

r Pinterna (%) Pesterna (%)

0.674 50 50

1 68 32

2 95.4 4.6

3 99.7 0.3

x c

x c x c

x c = 2

= 0.1

= 0.2

0

1

2

3

4

1 2 3x

f(x)

Figura 1. Andamento della funzione di distribuzione gaussiana per due

differenti valori di .

Laboratorio di Chimica Fisica Teoria degli errori

76

4 99.99 0.01

L‟intervallo di confidenza a cui si fa normalmente riferimento è quello con il 68%

di probabilità, definito dalla relazione X = xc ; negli intervalli xc 2 e xc 3

tale probabilità sale, rispettivamente, al 95.4 e 99.7%.

Nasce quindi il problema di come determinare xc e sulla base delle misure

sperimentali; la teoria statistica dimostra che date N misure sperimentali x1, x2, x3, ... ,

xN, si ha che:

a) la migliore stima di X, xc, è pari al valore medio delle xi , xm: N

x

x

N

i

i 1

m

b) la migliore stima di è x, nota come deviazione standard2:

1

1

2m

N

xxN

i

i

x

per cui l‟intervallo di confidenza della X (con il 68% di probabilità) verrà espresso

come:

X = xm x

È importante osservare che l‟incertezza espressa dalla x diminuisce all‟aumentare

di N, in quanto dipende solamente dalla presenza di errori casuali; non si deve tuttavia

dimenticare che l‟incertezza complessiva è legata, come già detto, alla precisione dello

strumento impiegato.

Inoltre la deviazione standard non deve essere confusa con l‟errore della media. La

deviazione standard definisce un intervallo di confidenza per la misura, mentre l‟errore

della media è dato dalla deviazione standard diviso la radice quadrata del numero delle

misure:

N

Xxm

Media pesata

2

Al denominatore compare N 1 anziché N in quanto gli N valori xi hanno già fornito un

dato, e cioè il valore medio xm.

Laboratorio di Chimica Fisica Teoria degli errori

77

Nella media precedentemente considerata ogni misura contribuisce con lo stesso

peso alla definizione del valore medio, e ciò è corretto se le N determinazioni x1, x2, ... ,

xN sono soggette ciascuna alla stessa incertezza (cioè allo stesso x), come normalmente

accade quando si effettuano più misure con lo stesso strumento. Al contrario, se questi

dati sono soggetti a incertezze differenti (x1, x2, ... , xN), è corretto effettuare una

media “pesata” o “ponderale”; ciò può avere significato, in particolare, quando ciascun

valore xi è stato ottenuto a sua volta da un insieme di determinazioni La media

“pesata” è espressa dalla relazione:

x

w x

w

i i

i

N

i

i

Nm

1

1

con w i xi 1

2 “peso” di ogni singola xi

mentre la deviazione standard (significativa per N 10) è calcolabile mediante la

relazione:

i

xw

1

L‟errore della media è sempre calcolato mediante la relazione:

N

Xxm

Eliminazione di alcuni dati utilizzati nel calcolo della media

Un valore utilizzato nel calcolo della media può essere scartato se sufficientemente

lontano dal valore medio trovato, tenendo conto del significato statistico delle misure.

Ad esempio, la probabilità di trovare un valore sperimentale al di fuori

dell‟intervallo xm 2x è di circa il 5%, e scende allo 0.3% se si considera l‟intervallo

xm 3x. Ciò significa che con 100 punti sperimentali è probabile che circa 5 punti

cadano al di fuori del primo intervallo, e che nessuno si trovi al di fuori del secondo;

con 10-20 punti ci si attende al massimo un punto nell‟intervallo più stretto. Questo

permette di scartare quindi, nelle normali condizioni operative, i punti per i quali

Laboratorio di Chimica Fisica Teoria degli errori

78

|xi xm| 2 o 3 volte x ; una volta scartati questi punti è necessario, ovviamente,

ricalcolare i valori di xm e di x .

Determinazione del valore medio con pochi dati sperimentali

Le relazioni sopra riportate sono di tipo statistico e risultano quindi valide se

applicate ad un numero sufficientemente elevato di dati sperimentali; si può ritenere

corretto applicarle quando si hanno a disposizione almeno una decina di punti

sperimentali. In caso contrario, si considera sempre come migliore stima di X il valore

medio, ma per quanto riguarda l‟incertezza ci si deve accontentare di stime più

grossolane, e quindi più elevate rispetto all‟errore definito in base alla deviazione

standard.

In quest‟ultimo caso normalmente si considerano come incertezze:

per N 3 la semidispersione massima, definita come (xmax xmin)/2

per 3 < N < 10 l‟errore medio, definito come N

i

i Nxx

1=

m ||

DETERMINAZIONE INDIRETTA DI UNA GRANDEZZA FISICA

La determinazione della maggior parte delle grandezze fisiche non viene effettuata in

modo diretto (per impossibilità o per convenienza), ma in modo indiretto, utilizzando le

relazioni matematiche che legano tale grandezza ad altre misurabili direttamente o, a

loro volta, determinabili indirettamente. Ad esempio, la determinazione di una

concentrazione può essere fatta misurando direttamente una massa ed un volume;

analogamente la determinazione di una velocità richiede la misura di uno spazio e di un

tempo. Nasce quindi il problema di definire la migliore stima e l‟incertezza della

grandezza in esame, sulla base dei corrispondenti valori trovati per le grandezze

direttamente misurate. Consideriamo quindi la grandezza Y funzione di Q grandezze

distinte X1, X2, ... , XQ :

QXXXFY ,...,, 21

Laboratorio di Chimica Fisica Teoria degli errori

79

e supponiamo che per ognuna delle grandezze Xi sia nota la migliore stima xi e la

relativa incertezza xi :

iii xxX

La teoria dimostra che la migliore stima (y) della grandezza Y è il valore da essa assunto

in corrispondenza delle migliori stime delle grandezze Xi :

QxxxFy ,...,, 21

L‟incertezza della Y è legata al modo in cui le singole incertezze delle Xi si combinano,

sommandosi o sottraendosi. Secondo la teoria della propagazione degli errori,

applicabile se le incertezze delle Xi sono percentualmente piccole (xi /|xi | al massimo

pari a qualche unità percentuale), si possono considerare due situazioni limite.

(1) Se le incertezze xi sono tutte indipendenti tra loro, per stimare l‟incertezza della Y

si utilizza la seguente relazione:

Q

i

i

i

y xX

F

1

2

2

Tale metodo di determinazione va applicato, come detto, quando le incertezze

relative alle grandezze Xi sono casuali e quindi possono sia sommarsi che

parzialmente compensarsi. (2) Se, al contrario, ci sono motivi per ritenere che le

incertezze xi possano prevalentemente sommarsi (ad esempio se gli errori stimati

sulle grandezze sono per la maggior parte di tipo sistematico piuttosto che casuale),

allora è più corretto considerare come incertezza della Y l‟errore limite propagato,

definito come:

i

Q

i i

xX

Fy

1

Laboratorio di Chimica Fisica Teoria degli errori

80

Tale valore risulta ovviamente maggiore di quello definito al punto 1 (o al massimo

uguale ad esso).

Per esempio, se Y è l‟area di un rettangolo e X1 e X2 sono i due lati, si deve considerare:

(a) l‟errore limite nel caso in cui i due lati vengano misurati con la stessa cordella

metrica e le relative incertezze siano preferenzialmente dovute a cause sistematiche

(bassa sensibilità e/o non buona taratura della cordella metrica utilizzata) in quanto

i due errori saranno entrambi in difetto od entrambi in eccesso e quindi

necessariamente si sommeranno;

(b) l‟errore definito al punto 1 se gli errori relativi alla misura dei due lati sono

essenzialmente di tipo casuale (cordella metrica tarata e sufficientemente sensibile)

e quindi possono combinarsi sia sommandosi che compensandosi.

Qualora si combinino tra loro incertezze derivanti da poche misure, per cui

l‟incertezza è valutata come semidispersione massima, o relative a valori tabulati per i

quali l‟incertezza venga valutata solamente sulla base del numero di cifre riportate (vedi

oltre), è opportuno calcolare l‟incertezza della Y come errore limite.

Nel caso in cui alcune delle grandezze Xi siano accompagnate da incertezze di

carattere statistico e le altre no, i relativi termini possono essere combinati sommando

in quadratura i primi e in valore assoluto i secondi. Si verifica spesso, comunque, che

l‟errore limite propagato risulta di poco superiore, in quanto alcuni termini della

sommatoria non pesano in modo significativo e, spesso, uno o due termini prevalgono

sugli altri; si deve inoltre considerare che l‟incertezza che ne deriva è comunque una

stima, e come tale deve essere arrotondata ad una o due cifre al massimo (secondo

quanto già visto in precedenza), e che poi andrà arrotondato in modo opportuno anche il

valore di y ottenuto3. Vediamo alcuni esempi:

(1) 21 XXY 21 xxy 2

2

2

1 xxy

21 XXY 21 xxy 2

2

2

1 xxy

N.B.: in entrambi i casi si esegue una somma degli errori assoluti (in valore assoluto

oppure in quadratura).

3A tale riguardo è opportuno ricordare come nei calcoli effettuati per la determinazione della migliore stima delle

grandezze sia necessario utilizzare più cifre di quelle significative, mentre, al contrario, nel calcolo della propagazione

delle incertezze è conveniente utilizzarne il minimo indispensabile e trascurare i termini poco significativi.

Laboratorio di Chimica Fisica Teoria degli errori

81

(2) KXY xKy (K = 0)

|||| xxyy X e Y hanno lo stesso errore relativo

(3) nKXY |||||| xxnyy Errore relativo moltiplicato per |n|.

Ad esempio: XKY xxyy 21||

XKY xxyy || come nel caso KXY

(4) 21XKXY |||||| 2

2

1

1

x

x

x

x

y

y

2

2

2

2

1

1

||

x

x

x

x

y

y

21 XKXY |||||| 2

2

1

1

x

x

x

x

y

y

2

2

2

2

1

1

||

x

x

x

x

y

y

N.B.: in entrambi i casi si esegue una somma degli errori relativi (in valore assoluto

oppure in quadratura).

(5) CXKY ln ||

||x

xKy

N.B.: l‟errore assoluto su Y è proporzionale all‟errore relativo su X.

CXKY exp xCy

y

||

||

N.B.: l‟errore relativo su Y è proporzionale all‟errore assoluto su X.

21ln CXXY 2

2

112ln x

x

xxCxy

esempio: t

bk

ln1 (metodo di Guggenheim)

oppure

22

ln

11

b

bbt

tk

k

poiché è in genere trascurabile, risulta

b

tbt

t

bk

1ln2

bb

b

t

t

k

k

ln

bb

b

k

k

ln

t

t

Laboratorio di Chimica Fisica Teoria degli errori

82

(6) Se Y è espressa come prodotto di più termini, si ricava facilmente una relazione tra

le incertezze relative. Infatti, se

Q

i

ini

Qn

Qnn

XXXKXY

1

22

11

... passando ai logaritmi si ha:

Q

i

ii XnKY

1

lnlnln

dalla quale, differenziando e sommando opportunamente, si ottengono:

y

i

i

ii

Q

yn

x

x| |

1

e

2

1||

Q

i i

ii

y

x

xn

y

che forniscono facilmente l‟errore relativo sulla Y come somma, “pesata” mediante

gli esponenti, degli errori relativi sulle Xi . Da tale espressione si vede facilmente

come i termini soggetti ad incertezze relative basse possano essere trascurati

rispetto agli altri; normalmente solo pochi termini (spesso uno o due soltanto)

contribuiscono alla definizione dell‟incertezza relativa della Y.

(7) A differenza del caso precedente, nel caso in cui si abbia la somma di più termini

“complessi”, occorre calcolare i differenziali; ad esempio, se:

B

AC

C

ABY

si ottiene:

2

2

2

2

2

cbay

b

a

c

ab

b

ac

c

a

b

c

c

b

Laboratorio di Chimica Fisica Teoria degli errori

83

Si noti che nel secondo e nel terzo termine della somma i due contributi hanno

segno opposto, mentre nel primo termine hanno lo stesso segno; per tale motivo, i

due contributi dovuti alle incertezze derivanti da B e C si compensano, mentre

quelli derivanti dall‟incertezza di A si sommano. Questo deriva dal fatto che le

variabili B e C compaiono una volta al numeratore ed un‟altra al denominatore, per

cui, ad esempio, un errore in eccesso su B determina un contributo in eccesso per il

termine AB/C ed uno in difetto per AC/B.

È opportuno notare che non è corretto considerare l‟incertezza della Y come

somma delle incertezze complessive relative ai due termini AB/C e AC/B, cioè:

22

baccaby

perché calcolando le incertezze relative a questi separatamente, si ottiene,

raccogliendo i termini:

2

2

2

2

2

cbay

b

a

c

ab

b

ac

c

a

b

c

c

b

che risulta maggiore del precedente.

Si può quindi concludere dicendo che l‟incertezza calcolata in più “stadi”,

utilizzando espressioni parziali, può risultare non corretta. A tale riguardo si

consideri anche il seguente esempio.

Si vuole calcolare l‟incertezza relativa alla determinazione della pressione

idrostatica P di una colonna di liquido di densità , avente altezza h, sottoposta

all‟accelerazione di gravità g, ricordando che:

pressione = forza peso/superficie di base della colonna: P = F/S

forza peso = massa per accelerazione di gravità: F = mg

massa = densità volume: m = V = Sh

Calcolando prima l‟incertezza di m mediante quelle di , S e h, poi quella di F

ed infine quella di P si otterrebbe:

Laboratorio di Chimica Fisica Teoria degli errori

84

2222

2

h

h

g

g

S

S

P

P

mentre calcolandola direttamente sulla base dell‟equazione globale P = gh si

ottiene:

222

h

h

g

g

P

P

nella quale non compare il termine dipendente dall‟incertezza di S; infatti, la

pressione non dipende dalla superficie di base della colonna.

È opportuno quindi applicare la propagazione direttamente all‟equazione che

lega la grandezza incognita a quelle note; tuttavia, se la combinazione delle

espressioni intermedie non comporta semplificazioni di grandezze, i due metodi

risultano del tutto equivalenti.

Per quanto riguarda il calcolo dell‟errore propagato, si osservi che nella

determinazione del valore di alcune grandezze si fa uso di dati tabulati, i quali spesso

sono riportati nei manuali senza le corrispondenti incertezze ed in questo caso esse sono

implicitamente espresse dal numero di cifre significative. In assenza di indicazioni

specifiche, si conviene che il dato venga riportato in modo tale che l‟intervallo

d‟incertezza massimo (cioè quello in cui la probabilità di trovare il valore “vero” è

estremamente elevata) abbia un‟ampiezza corrispondente ad una unità della penultima

cifra significativa, cioè sia pari a 5 unità dell‟ultima cifra.

Molto spesso, però, riferendosi ai concetti statistici visti in precedenza, si preferisce

utilizzare un intervallo meno esteso, corrispondente a 1 unità sull‟ultima cifra,

considerando un intervallo di probabilità elevata ma non elevatissima, analogo a quello

definito dalla deviazione standard. I dati riportati nei manuali vengono normalmente

trattati in quest‟ultimo modo.

Nel calcolo dell‟errore propagato vanno infine considerate le costanti di tipo

matematico (quali , e, ...) e fisico (Faraday, costante universale dei gas R, ...).

Laboratorio di Chimica Fisica Teoria degli errori

85

Le costanti del primo tipo sono normalmente note con un numero di cifre

significative estremamente elevato, per cui è sufficiente utilizzare tali costanti con un

numero opportuno di cifre significative, in modo che l‟incertezza che ne deriva sia

sicuramente trascurabile rispetto alle altre. Per far ciò, e per evitare nel contempo di

usare un numero di cifre eccessivamente elevato, è opportuno sceglierne un numero tale

per cui l‟incertezza che ne deriva sia uno o due ordini di grandezza al massimo più

piccola di quelle che derivano dai dati sperimentali. È su tale base che si è supposto,

negli esempi visti in precedenza, che K = 0 o C = 0, immaginando di usare, appunto,

un valore di K o di C con un opportuno numero di cifre significative.

Le costanti del secondo tipo sono, in sostanza, una via di mezzo tra quelle di tipo

matematico ed i dati tabulati. Se il numero di cifre significative di cui si dispone è

sufficientemente elevato, esse possono essere trattate come le costanti di tipo

matematico; in caso contrario, si deve tener conto del contributo della loro incertezza

sulla base di quanto sopra esposto per i dati fisici tabulati negli handbook.

Laboratorio di Chimica Fisica Teoria degli errori

86

“FITTING” DI DATI SPERIMENTALI

In laboratorio si determinano spesso coppie di valori di due grandezze, X e Y, che

sono legate tra loro. A volte la forma dell‟equazione che lega X e Y è nota in quanto

ricavata su basi teoriche; altre volte la forma di questa equazione non è nota e si deve

cercare quindi una funzione relativamente semplice per descrivere il legame tra le due

grandezze. In quest‟ultimo caso si parla di “equazione empirica”, e molto spesso si

utilizza allo scopo una serie di potenze poiché essa è normalmente in grado di

rappresentare una qualsiasi funzione ordinaria con buona approssimazione.

Esprimiamo quindi una delle due grandezze in funzione dell‟altra (ad esempio Y in

funzione di X), mediante una funzione che conterrà una serie di parametri incogniti a0,

a1, a2, ... , aP :

PaaaaXFY ...,,,,, 210

Definita quindi la forma della funzione F(X), partendo dalle N coppie di dati

sperimentali x1, y1; x2, y2; ....; xN, yN (misurati e/o ottenuti da altri dati), è necessario

ricavare i valori dei parametri contenuti nella funzione, e le relative incertezze.

L‟importanza di tutto ciò nasce dal fatto che dal valore di alcune di tali costanti è spesso

possibile ricavare quello di importanti grandezze fisiche.

Poiché i punti sperimentali non si trovano esattamente sulla curva cercata (se non

altro per effetto delle inevitabili incertezze sperimentali), è necessario determinare la

curva che meglio si accorda con il set di valori a disposizione. La teoria statistica

dimostra che la curva migliore, che fornisce i migliori valori dei parametri incogniti, è

quella per la quale risulta minima la somma dei quadrati delle distanze di (note come

“residuals”) tra i punti sperimentali ed i “corrispondenti” punti sulla curva cercata

(metodo dei minimi quadrati):

N

i

Pi aaadR

1

1022 ,...,,funzione

Laboratorio di Chimica Fisica Teoria degli errori

87

Fissato un set di N punti sperimentali e la forma della “curva” cercata, R 2 sarà

funzione dei parametri sperimentali incogniti a0, a1, a2, ... , aP, e risulterà minima in

corrispondenza dei valori per i quali risulta:

0...2

1

2

0

2

Pa

R

a

R

a

R

Resta quindi da chiarire quali siano i punti della curva “corrispondenti” a quelli

sperimentali; si possono considerare tre casi diversi, a seconda che le imprecisioni siano

da attribuire prevalentemente alla variabile Y, oppure alla variabile X, oppure siano tra

loro confrontabili.

Facendo riferimento ad un diagramma X-Y, nel primo caso il punto della curva che

corrisponde a quello sperimentale è quello in “verticale”, avente cioè lo stesso valore

della ascissa, xi , nel secondo caso è quello preso in “orizzontale”, avente lo stesso

valore della Y, yi , mentre nel terzo caso tale punto ha entrambe le coordinate diverse da

quelle sperimentali in quanto la distanza va presa con una certa inclinazione (vedi

Figura 2).

Analizzeremo più in dettaglio tali situazioni facendo riferimento al caso del

“fitting” con un polinomio di primo grado (regressione lineare).

Laboratorio di Chimica Fisica Teoria degli errori

88

REGRESSIONE LINEARE

In tal caso la funzione cercata ha la forma:

bXaY

Vediamo come si ottengono i valori di a e b e le relative incertezze nei tre casi

sopra considerati, supponendo (per ora) che tutti i valori sperimentali della X, e

analogamente tutti quelli della Y, siano soggetti alla stesso valore di incertezza, x e y,

rispettivamente (regressione non pesata).

Incertezza da attribuire prevalentemente alla variabile Y

Si realizza quando:

0e0 yx

(x i , a +

bx i )

Y = a +

bX

[(y i -

a )/b , y i ]

(x i *, y i *)

(x i , y i )

X

Y

Figura 2. Rappresentazione schematica di un punto sperimentale di coordinate (xi,

yi,) e delle distanze di questo dalla retta incognita, per i tre casi discussi

nel testo.

Laboratorio di Chimica Fisica Teoria degli errori

89

o meglio, essendo normalmente X e Y grandezze di tipo diverso, con differenti unità di

misura ed ordine di grandezza, quando:

x

x

y

y

dove e minmaxminmax yyyxxx (vedi Figura 3)

In pratica si applica qualora:

x

x

y

y

3

In tali condizioni si deve minimizzare la funzione di a e b:

N

i

ii bxayR

1

22 ponendo 022

b

R

a

R

Si ottiene così il seguente sistema di due equazioni in due incognite:

y

x

x

y

X

Y

Figura 3. Rappresentazione schematica dei punti sperimentali delle grandezze X e

Y, delle relative incertezze x e y, e delle variazioni complessive delle

grandezze stesse, x e y.

Laboratorio di Chimica Fisica Teoria degli errori

90

aN b x y

a x b x x y

i i

i i i i

2

che fornisce le due soluzioni:

iiiiiiiii yxyxNb

yxxyxa ;

2

dove 22

ii xxN

L‟incertezza che caratterizza i valori della Y espressi dalla funzione trovata, definiti

cioè dall‟espressione y = a + bx, non si ottiene mediante la propagazione degli errori

applicata a tale espressione (in quanto risulterebbe sovrastimata) ma dalla distanza

media dei punti sperimentali dalla retta trovata. A tale riguardo si considera la

deviazione standard, y , definita dalla relazione4:

22

1

22

NbxayN

R N

i

iiy

Le incertezze per i parametri a e b si determinano invece mediante la propagazione

degli errori applicata alle equazioni da cui sono stati ricavati tali punti; considerando

che le incertezze sono solamente relative alle yi , si ha:

2

1

2y

N

iia ya

2

1

2y

N

iib yb

dalle quali si ottengono le relazioni:

2

iya

x e

Nyb

Laboratorio di Chimica Fisica Teoria degli errori

91

Attendibilità della retta ottenuta

Prima di analizzare l‟attendibilità del risultato ottenuto, è opportuno verificare se

qualche punto sperimentale deve essere scartato, in quanto troppo “lontano” dalla retta

trovata. Analogamente a quanto visto nel caso della media pesata, si può ritenere di

dover scartare un punto se la distanza di è superiore a due-tre volte la deviazione

standard della Y:

yiii bxayd 2

Naturalmente, dopo aver scartato un punto è necessario ricalcolare i parametri e le

deviazioni standard e vedere se si deve escludere un altro punto, e così via.

Fatto ciò, si analizza l‟attendibilità della retta ottenuta in base all‟accordo esistente

tra y e l‟incertezza stimata sui dati sperimentali, y. A tale riguardo possiamo

considerare tre diverse situazioni:

(1) Se y y [(1/3) y y 3y] l‟accordo tra punti sperimentali e retta è buono, e

le incertezze su a, b e y sono a , b e y, rispettivamente.

(2) Se y y [y 3y] i punti sperimentali sono mediamente più distanti dalla retta

di quanto valutato (y); si realizzano allora due possibilità:

se i punti deviano dalla retta in modo casuale, allora è stato

presumibilmente sottostimato il y (vedi Figura 4); in tal caso la retta

trovata si può considerare ancora buona, con le incertezze riportate nel caso

1;

se i punti deviano in modo sistematico (apparente “curvatura” dei punti)

allora l‟andamento lineare non è corretto (vedi Figura 5, linea continua); in

tal caso:

4Al denominatore compare N 2 perché sono stati determinati i valori delle costanti a e b;

nel caso della media si ha invece, come già visto, N 1 poiché si determina solamente il valore

medio.

Laboratorio di Chimica Fisica Teoria degli errori

92

se la funzione lineare ha basi teoriche, potrebbe non essere valida in tutto

l‟intervallo sperimentale considerato, e quindi si deve ridurre

opportunamente l‟intervallo di applicabilità (vedi Figura 5, linea

tratteggiata);

se la funzione lineare è applicata empiricamente, allora non è adatta a

descrivere l‟andamento sperimentale e si deve passare ad analizzare un

polinomio di grado superiore, o anche una funzione di tipo diverso (vedi

oltre).

y

y

X

Y

Figura 5. Rappresentazione schematica dei punti sperimentali e delle rette

ottenute mediante regressione lineare (per y x) considerando tutti

gli 8 punti (linea continua), oppure solamente i 5 punti più a sinistra

(linea tratteggiata). Sono inoltre riportate le deviazioni standard della Y

calcolate nei due casi.

Laboratorio di Chimica Fisica Teoria degli errori

93

(3) Se y y [y (1/3)y] i punti sperimentali sono mediamente più vicini alla

retta di quanto ci si dovrebbe attendere sulla base dell‟incertezza valutata sulle

Y; se si ritiene che y sia stato correttamente stimato, il “buon allineamento”

dei punti sperimentali potrebbe essere casuale, specialmente se N non è molto

elevato. In tal caso è più corretto considerare come incertezza della Y non il

valore y calcolato sopra ma il y stimato; di conseguenza, è necessario

ricalcolare, mediante tale valore, quello di a e b , cioè:

y = y

2

iya

x

Nyb

Incertezza da attribuire prevalentemente alla variabile X

In questo caso si ha:

0e0 xy o meglio y

y

x

x

in pratica 3

y

y

x

x

y

X

Y

Figura 4. Rappresentazione dei punti sperimentali e della retta ottenuta

mediante regressione lineare (per y x) nel caso in cui la

deviazione standard y risulta elevata rispetto alle incertezze stimate

y.

Laboratorio di Chimica Fisica Teoria degli errori

94

per cui si possono trattare i dati come nel caso precedente, scambiando tra loro X e Y in

quanto la relazione tra le due variabili resta lineare.

In alternativa, si può operare analogamente a quanto fatto in precedenza

minimizzando la funzione somma dei residui:

R xy a

bi

i

i

N2

2

1

ottenendo così un sistema che risolto fornisce le due soluzioni:

ay x y x y

bN y y

i i i i i i i

2 22

;

dove è ora espresso dalla relazione N x y x yi i i i

La deviazione standard relativa alla variabile X el‟incertezza sulle costanti a e b è

espressa da relazioni simili a quelle viste nel caso precedente, ed analoghe

considerazioni devono essere fatte per ciò che concerne sia l‟attendibilità della retta

trovata sulla base del confronto tra x e x , sia la definizione delle incertezze relative

ad X, a e b.

Incertezze confrontabili della X e della Y

Si ha:

y

y

x

x

per cui la distanza tra i punti e la retta va presa con una certa inclinazione, che è

appunto definita dai valori relativi di x/x e y/y.

Minimizzando anche in questo caso la funzione R 2 si ottiene un sistema di due

equazioni nelle due incognite a e b, da cui si ricava l‟espressione:

Laboratorio di Chimica Fisica Teoria degli errori

95

b Q Q y x1 2

2 2

, dove

Q

xy

Ny y

x

Nx

xx y

Nx y

i

i

i

i

i i

i i

2

2

2 2

2

2

22

ed il valore di b che viene scelto è quello che fornisce il valore di R 2 più basso.

Tramite l‟altra equazione del sistema

aN b x yi i

si ricava il corrispondente valore di a5.

Successivamente si possono ricavare i valori delle deviazioni standard per X e Y,

tramite le relazioni:

y y

i

N i i

i

N

d

y a bx N

b x yi

2

1

2

1

2 2

2

1 e

x x

i

N i i

i

N

yd

x y a b N

y x bb x y

i

2

1

2

1

2 2

2

2

1

Per ciò che riguarda le deviazioni standard su a e b, mediante la teoria della

propagazione degli errori si può scrivere, tenendo conto che le incertezze ora riguardano

sia la X che la Y:

a

ii

N

x

ii

N

y

a

x

a

y

2

1

2

2

1

2 e

b

ii

N

x

ii

N

y

b

x

b

y

2

1

2

2

1

2

5

Si può facilmente verificare come tale caso si riconduca ai due precedenti qualora l‟incertezza della Y

prevalga in modo significativo su quella della X, o viceversa.

Laboratorio di Chimica Fisica Teoria degli errori

96

Data la difficoltà che si incontra, rispetto ai due casi precedenti, nel ricavare le

relazioni analitiche finali, tali deviazioni vengono calcolate utilizzando gli incrementi

finiti, approssimando cioè le singole derivate parziali ai corrispondenti rapporti

incrementali, per cui per a, ad esempio, si avrà:

a

x

a

x

a a

xi

x

i

x

i

i i

a

y

a

y

a a

yi

y

i

y

i

i i

dalle quali si ottiene:

a x

i

N

y

i

N

a ai i

2

1

2

1

dove i vari termini a rappresentano ciascuno la differenza tra il valore a ottenuto dalla

ennupla di coppie di valori x1, y1; x2, y2; ....; xN, yN, ed il valore ottenuto sostituendo ad

xi (o ad yi ) il valore xi x (o yi y).

Analogamente si procede per il calcolo di b.

Complessivamente il calcolo di a e di b va quindi effettuato una prima volta con la

ennupla di valori XY, e successivamente ripetuto 2N volte modificando via via un

singolo valore xi o yi per volta6.

Una volta calcolate le deviazioni standard si deve procedere al confronto tra x e

x e tra y e y allo scopo di verificare l‟attendibilità dell‟andamento lineare trovato, e

stabilire i valori delle incertezze su X, Y, a e b, analogamente a quanto visto in

precedenza.

Tuttavia X e Y sono in generale grandezze fisiche diverse con errori quadratici

medi diversi e questo metodo attribuisce lo stesso peso agli scarti su X e Y. Si

preferisce pertanto considerare affetta da errore soltanto una delle variabili, quella

6In alternativa, si potrebbe pensare di effettuare tali calcoli sostituendo ad xi e ad yi i valori

xi x e yi y, rispettivamente, come pure valutare i a con entrambe le sostituzioni, mediando

i valori ottenuti. In ogni caso, poiché le incertezze delle xi e delle yi sono percentualmente

piccole, il risultato finale non sarebbe significativamente diverso.

Laboratorio di Chimica Fisica Teoria degli errori

97

determinata in modo più „indiretto‟ che risente maggiormente di tutte le incertezze di

tutte le altre grandezze misurate direttamente.

Regressione lineare pesata

Qualora i valori sperimentali yi (e/o xi ) non siano soggetti ad un‟unica incertezze y

ma ad incertezze diverse y1, y2, ... , yN, non è corretto calcolare la retta di regressione

dando lo stesso peso a tutti i punti sperimentali; analogamente al caso esaminato per la

media ponderale, supponendo che gli errori prevalenti riguardino la variabile Y, si

ottiene:

iiiiiiiiiiiiiiiii ywxwyxww

b;yxwxwywxw

a2

dove w yi i 1 2 e 22

iiiii xwxww

Le deviazioni standard su a e b risultano di conseguenza espresse dalle relazioni:

a

i iw x 2

e b

iw

dove w w x w xi i i i i

22

Poiché punti soggetti a maggiore incertezza potranno risultare mediamente più

lontani dalla retta di quelli con incertezza minore, si può ritenere opportuno scartare i

punti per i quali la distanza dalla retta è maggiore (almeno il doppio) del corrispondente

valore di y : saranno in sostanza da scartare i punti in corrispondenza dei quali la retta

risulta “lontana” dalle barre di errore riportate nel grafico.

Laboratorio di Chimica Fisica Teoria degli errori

98

“FITTING” DI DATI SPERIMENTALI CON POLINOMI

A volte il legame tra le due grandezze X e Y risulta più complesso di quello

esprimibile mediante una funzione di primo grado, ma ci si può facilmente riportare ad

essa trasformando una relazione non lineare in una lineare cambiando opportunamente

le variabili; ad esempio:

KXAY exp può essere linearizzata considerando:

KXAY lnln per cui lnY risulta lineare in X.

nXKY può essere linearizzata considerando:

Y X ncontro se n è noto, oppure

lnY contro lnX se n non è noto, essendo XnKY lnlnln

Se la forma della funzione non permette una linearizzazione, è necessario

effettuare, analogamente a quanto esposto in precedenza, la derivazione delle equazioni

che forniscono i parametri cercati minimizzando il termine R 2 ricavato espressamente

per il caso in esame.

Accade a volte che il legame tra le due grandezze X e Y non sia noto in maniera

esplicita, cioè che non si sia a conoscenza della forma della funzione che lega tali

grandezze. In questo caso si cerca di esprimere tale legame attraverso l‟uso di funzioni

relativamente semplici, il cui andamento sia simile a quello dei dati a disposizione.

In particolare, si cerca di utilizzare un polinomio di grado opportuno, esprimibile in

generale come:

PP XaXaXaaY ....2

210

ricavando poi i valori dei parametri incogniti a0, a1, a2, ... che meglio esprimono

l‟accordo tra la funzione ed i valori delle N coppie di dati sperimentali; x1, y1; x2, y2; ....;

xN, yN.

Laboratorio di Chimica Fisica Teoria degli errori

99

Per semplicità consideriamo solamente il caso in cui gli errori prevalenti siano

relativi alla variabile Y (cioè y/y > x/x), per cui si dovrà minimizzare la quantità R 2

definita dalla relazione:

N

i

iii xaxaayR

1

22210

2 ...

Ponendo quindi (R 2/a0) = (R

2/a1) = ... = 0 si ottiene il seguente sistema

formato da P + 1 equazioni in P + 1 incognite:

iPi

PiP

Pi

Pi

Pi

iiPiPiii

iiPiPiii

iPiPii

yxxaxaxaxa

yxxaxaxaxa

yxxaxaxaxa

yxaxaxaNa

222

110

2242

31

20

132

210

2210

...

....................

...

...

...

che fornisce le P 1 soluzioni:

DDa kk per k 0, 1, 2, ..., P

dove D rappresenta il determinante della matrice formata dai coefficienti delle

equazioni del sistema e Dk il determinante della matrice ottenuta sostituendo la relativa

colonna dei coefficienti con quella dei termini noti.

La deviazione standard relativa alla Y è espressa dalla relazione:

1

2

PN

Ry

Le incertezze relative ad a0, a1, a2, ... , aP, calcolate sulla base della propagazione

degli errori (considerando che le incertezze interessano solamente la Y) ed espresse

dalla relazione:

Laboratorio di Chimica Fisica Teoria degli errori

100

N

i

iikka yya

1

22

sono complesse da ottenere analiticamente, per cui vengono valutate considerando la

derivata prima pari al rapporto incrementale, come già visto nel caso della regressione

lineare con errori significativi su entrambe le variabili:

i

ixk

i

ixk

i

k

x

a

x

a

x

a

per cui

N

iixkka a

1

2

I termini (ak )xi rappresentano, analogamente a quanto già visto, la differenza tra il

valore di ak ottenuto dalle migliori stime di X ed Y ed il corrispondente valore ottenuto

sostituendo ad xi il termine xi + xi. (vedere il caso precedentemente trattato). Tale

calcolo va eseguito, per ognuna delle P + 1 costanti ak, per tutti i valori di i da 1 ad N.

Determinazione del grado del polinomio

Nel caso in cui il metodo di “fitting” sopra esposto sia utilizzato in modo empirico,

il grado del polinomio, P, non è generalmente noto a priori. Esso viene ad essere

definito implicitamente dalla quantità di dati a disposizione e dalla loro incertezza, in

quanto non deve risultare né troppo basso né troppo elevato, onde evitare di ottenere

una espressione che sottostima, o al contrario sovrastima, i valori sperimentali

analizzati.

In pratica, conviene iniziare il calcolo con un polinomio di primo grado, cioè

effettuare una regressione lineare dei dati, e calcolare la deviazione standard della Y

(supposto che gli errori prevalenti siano quelli relativi a questa grandezza). Se tale

deviazione standard risulta confrontabile con l‟incertezza dei valori sperimentali della

Y, si può considerare la regressione lineare buona; se la deviazione standard risulta

invece maggiore dell‟incertezza sperimentale, allora si aumenta il grado del polinomio

e si effettua una regressione di tipo quadratico. Se la nuova deviazione standard risulta

sensibilmente inferiore alla precedente, allora la regressione quadratica è effettivamente

migliore.

Si procede, quindi, aumentando ogni volta di una unità il grado del polinomio, fino

a quando l‟ultima deviazione standard calcolata non risulta più sensibilmente inferiore

Laboratorio di Chimica Fisica Teoria degli errori

101

alla precedente. In questo caso, infatti, l‟aumento del grado del polinomio non è più

significativo, in quanto la nuova funzione non rappresenta l‟andamento dei dati meglio

della precedente, e perciò ci si deve arrestare al grado inferiore. D‟altro canto, se le

incertezze sperimentali sui valori della Y sono state attentamente valutate, si dovrebbe

trovare, alla fine, un valore di deviazione standard paragonabile a quello delle

incertezze sperimentali.

In accordo con quanto detto, si verifica che difficilmente si effettuano regressioni

con polinomi di grado superiore al terzo, e che le regressioni quadratiche risultano

normalmente sufficienti, in particolare quando la variazione dei dati sperimentali risulta

contenuta in un intervallo relativamente piccolo.

Va inoltre osservato che per descrivere il legame tra due grandezze fisiche in modo

empirico, a volte può risultare più opportuno utilizzare funzioni contenenti termini di

grado negativo. Ad esempio, la variazione della capacità termica con la temperatura

può essere convenientemente espressa, per alcune sostanze, mediante un polinomio di

secondo grado:

2CTBTAC

Per altre sostanze, tuttavia, è più appropriato l‟uso di una espressione del tipo:

2 CTBTAC

in quanto le deviazioni dalla linearità risultano meglio esprimibili mediante un termine

quadratico nel reciproco di T piuttosto che tramite un termine quadratico in T; per altre

sostanze ancora può risultare del resto più conveniente usare espressioni con potenze

diverse.

Per concludere, ricordiamo che l‟incertezza che accompagna i valori delle quantità

yi , determinabili mediante l‟espressione analitica trovata, sono espresse dalla

deviazione standard relativa alla grandezza Y, e non si ottengono applicando la

propagazione dell‟errore all‟espressione trovata.