teoria delle decisioni - unifi - disia - sito...

46
B. Chiandotto Versione 2017 INFERENZA STATISTICA Cap. 7 Teoria statistica delle decisioni 373 CAP. 7 TEORIA STATISTICA delle DECISIONI Introduzione Nella premessa a queste note didattiche si è affermato che la disciplina che si occupa della raccolta e del trattamento scientifico dei dati (manifestazioni dei fenomeni collettivi di interesse) per trasformarli in informazioni è la Statistica, se poi le informazioni stesse devono essere utilizzate per risolvere uno specifico problema decisionale, cioè un problema che si risolve nella scelta ottimale di una tra diverse alternative a disposizione, allora il contesto di riferimento è la Teoria delle decisioni. Nella fusione delle due discipline si sostanzia un’altra disciplina scientifica: “La Teoria statistica delle decisioni” o “Teoria delle decisioni statistiche” che per certi versi può essere intesa come generalizzazione ed estensione della Statistica che in questo modo risulta anche meglio caratterizzata nelle sue diverse connotazioni e meglio precisata nei contenuti. In altri termini si può anche definire la statistica come il fondamento logico e metodologico per la risoluzione dei problemi decisionali. In questa prospettiva la Statistica si caratterizza come disciplina scientifica che non si limita alla sola trasformazione dei dati in informazioni ma che si occupa anche della trasformazione delle informazioni in conoscenza utilizzabile a fini operativi di intervento (fini decisionali) 1 . 7.1 - Teoria delle decisioni Oggetto di studio della teoria delle decisioni è il processo decisionale. Attraverso l’analisi del comportamento degli attori (individui o gruppi) coinvolti nel processo, si procede, cioè, all’esame di come i decisori prendono o dovrebbero prendere delle decisioni. Allo sviluppo della teoria delle decisioni hanno contribuito cultori di discipline diverse: filosofi e logici, matematici e statistici, psicologi e sociologi, economisti, ecc. Gli sviluppi della teoria spaziano dalle speculazioni astratte, relative ad agenti idealmente razionali, ai suggerimenti pratici per la risoluzione ottimale di specifici problemi decisionali, all’analisi dei processi decisionali coi come si svolgono nella realtà. 1 Molti autori (Cox, 1958; Smith, 1965; Barnett, 1999) affermano che una distinzione deve essere fatta tra inferenza statistica e teoria statistica delle decisioni. Ma altri autori come Savage (1951) e Lindley (1965, 2006), e questo è anche il parere dell’autore di queste note didattiche, considerano la teoria statistica delle decisioni come una naturale e necessaria generalizzazione dell’inferenza statistica. Inoltre, l'approccio decisionale, combinando varie teorie di inferenza statistica, evita i dogmatismi che possono portare a situazioni paradossali, è esente da errori logici, è più efficace nel contesto applicativo e tratta con successo una gamma più ampia di problemi rispetto agli approcci tradizionali. L'approccio decisionale fornisce, cioè, una soluzione soddisfacente al cosiddetto problema pragmatico dell’induzione.

Upload: vulien

Post on 18-Feb-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

373

CAP. 7 – TEORIA STATISTICA delle DECISIONI

Introduzione

Nella premessa a queste note didattiche si è affermato che la disciplina che si occupa

della raccolta e del trattamento scientifico dei dati (manifestazioni dei fenomeni

collettivi di interesse) per trasformarli in informazioni è la Statistica, se poi le

informazioni stesse devono essere utilizzate per risolvere uno specifico problema

decisionale, cioè un problema che si risolve nella scelta ottimale di una tra diverse

alternative a disposizione, allora il contesto di riferimento è la Teoria delle decisioni.

Nella fusione delle due discipline si sostanzia un’altra disciplina scientifica: “La

Teoria statistica delle decisioni” o “Teoria delle decisioni statistiche” che per certi

versi può essere intesa come generalizzazione ed estensione della Statistica che in

questo modo risulta anche meglio caratterizzata nelle sue diverse connotazioni e meglio

precisata nei contenuti. In altri termini si può anche definire la statistica come il

fondamento logico e metodologico per la risoluzione dei problemi decisionali.

In questa prospettiva la Statistica si caratterizza come disciplina scientifica che non

si limita alla sola trasformazione dei dati in informazioni ma che si occupa anche della

trasformazione delle informazioni in conoscenza utilizzabile a fini operativi di

intervento (fini decisionali) 1

.

7.1 - Teoria delle decisioni

Oggetto di studio della teoria delle decisioni è il processo decisionale. Attraverso

l’analisi del comportamento degli attori (individui o gruppi) coinvolti nel processo, si

procede, cioè, all’esame di come i decisori prendono o dovrebbero prendere delle

decisioni.

Allo sviluppo della teoria delle decisioni hanno contribuito cultori di discipline

diverse: filosofi e logici, matematici e statistici, psicologi e sociologi, economisti, ecc.

Gli sviluppi della teoria spaziano dalle speculazioni astratte, relative ad agenti

idealmente razionali, ai suggerimenti pratici per la risoluzione ottimale di specifici

problemi decisionali, all’analisi dei processi decisionali coi come si svolgono nella

realtà.

1 Molti autori (Cox, 1958; Smith, 1965; Barnett, 1999) affermano che una distinzione deve essere fatta tra inferenza

statistica e teoria statistica delle decisioni. Ma altri autori come Savage (1951) e Lindley (1965, 2006), e questo è

anche il parere dell’autore di queste note didattiche, considerano la teoria statistica delle decisioni come una naturale

e necessaria generalizzazione dell’inferenza statistica. Inoltre, l'approccio decisionale, combinando varie teorie di

inferenza statistica, evita i dogmatismi che possono portare a situazioni paradossali, è esente da errori logici, è più

efficace nel contesto applicativo e tratta con successo una gamma più ampia di problemi rispetto agli approcci

tradizionali. L'approccio decisionale fornisce, cioè, una soluzione soddisfacente al cosiddetto problema pragmatico

dell’induzione.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

374

In questa ottica si è soliti distinguere la teoria delle decisioni in due filoni principali:

teoria normativa e teoria descrittiva. Chi si occupa di teoria descrittiva cerca di scoprire

come le decisioni vengono prese nei diversi contesti operativi; chi si occupa di teoria

normativa analizza il modo con cui le decisioni dovrebbero essere prese facendo

riferimento ad agenti idealmente razionali, procedendo, cioè, all’esame delle

conseguenze logiche di differenti regole decisionali o esplorando gli aspetti logico-

matematici o filosofici di diverse descrizioni di comportamento razionale. Questa

distinzione è utile ma alquanto artificiosa, essendo l’informazione sul modo effettivo di

prendere decisioni, certamente rilevante ai fini della fissazione di regole su come le

decisioni devono essere prese; d’altro lato nessuno studio sul comportamento effettivo

di agenti può consentire il conseguimento di risultati soddisfacenti se lo stesso non

viene, in qualche modo, posto a confronto con una sorta di comportamento ideale

(razionale).

La teoria descrittiva delle decisioni non interessa in questa sede essendo oggetto di

discipline specifiche quali la psicologia, la sociologia e, per alcuni aspetti, l’economia.

Qui verranno presentati gli elementi essenziali della teoria normativa delle decisioni2: ci

si occuperà, cioè, di come le decisioni dovrebbero essere prese per massimizzare il

proprio “benessere” e non di come le decisioni sono effettivamente prese.

Ma, come già sottolineato, il riferimento alla teoria normativa non può essere

assoluto, si deve, infatti, tenere conto di tutta una serie di vincoli e di condizionamenti

che emergono dall’analisi dei processi reali affinché le regole di comportamento

razionale possano tradursi in comportamenti effettivi utili al decisore.

Per caratterizzare e distinguere questo specifico sviluppo della teoria normativa delle

decisioni alcuni autori hanno suggerito la dizione teoria prescrittiva che si caratterizza,

appunto, per il fatto che le regole ideali di comportamento razionale analizzate devono

poter essere tradotte in comportamenti effettivi (sui quali, come già sottolineato, incide

una serie innumerevole di condizionamenti sia individuali che di contesto) tali da

consentire al decisore il conseguimento del beneficio massimo.

I fondamenti della moderna teoria delle decisioni o si trovano nell’opera di Von

Neumann e Morgenstern (1947). I due autori mostrano come, sulla base di alcuni

postulati o assiomi di comportamento razionale di colui che deve prendere una

decisione, sia possibile introdurre una funzione a valori reali detta, a seconda del

contesto in cui si opera, di valore, o di utilità, per cui una decisione fondata unicamente

sulla massimizzazione del valore atteso di tale funzione consente l’individuazione della

scelta ottimale in accordo al proprio schema di preferenze.

Critiche di varia natura sono state rivolte al criterio dell’utilità attesa. Esse possono

essere comunque ridotte e sintetizzate nei due punti seguenti:

1. quelle rivolte all’evidenza empirica degli assiomi di comportamento

razionale che sono alla base della moderna teoria dell’utilità;

2 Per un approfondimento dell’argomento si può utilmente consultare, tra gli altri, Chiandotto e Bacci (2015).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

375

2. quelle che sottolineano l’impossibilità pratica di derivare una funzione di

valore o di utilità significativa.

Alle critiche richiamate al punto 2 sono state fornite risposte che, nella generalità dei

casi, risolvono il problema dell’elicitazione della funzione di utilità in modo

soddisfacente3.

Per quanto riguarda, invece, le critiche richiamate al punto 1 si può rispondere che

esse hanno, ma non sempre, una certa rilevanza quando si considera il comportamento

di un agente e si voglia poi accertare fino a che punto egli segue le linee di

comportamento razionale attribuitegli. Quando però dal piano di verifica empirica di

una teoria, intesa in senso unicamente descrittivo, si passa al piano normativo della

stessa, tali critiche perdono, almeno in parte, di significato.

Il problema della rilevanza degli assiomi sul comportamento del decisore, va visto,

non nel senso di buona descrizione ma in quello di buona norma. Un tale problema

risulta però estremamente delicato in quanto, come già sottolineato, le implicazioni

normative degli assiomi, e quindi la bontà degli stessi, vanno giudicate in funzione dei

risultati operativi cui conduce la teoria che su di essi è fondata.

Qualunque decisione comporta una scelta tra più alternative, o azioni, o atti, ciascuna

delle quali produrrà una tra più conseguenze che dipenderà dalle condizioni del

contesto, lo stato di natura, nel quale il processo decisionale si svolge. Le decisioni,

sono, pertanto, costituite da azioni, stati e conseguenze, con le ultime che dipendono,

nella generalità dei casi, dallo stato di natura e dall’azione scelta.

Quando si analizza un problema di decisione, l’analista, che può essere lo stesso

soggetto che prende la decisione, deve individuare l’insieme rilevante delle azioni, degli

stati e delle conseguenze per caratterizzare in modo adeguato il problema stesso.

Attraverso l’individuazione di azioni, stati e conseguenze e costruendo, eventualmente,

una tavola o un albero di decisione, si procede alla specificazione del problema

decisionale.

Alcune interessanti questioni sono legate alla specificazione di un problema

decisionale. La prima riguarda la descrizione appropriata degli stati di natura. Ogni

problema decisionale implica delle conseguenze che il soggetto della decisione

considera migliori di altre, altrimenti non sussisterebbe un problema di scelta. In questo

contesto assume particolare rilevanza il principio della dominanza secondo il quale

devono essere escluse tutte le alternative che comportano conseguenze peggiori,

qualunque sia lo stato di natura, di una qualche specifica alternativa. Se c’è

un’alternativa che domina tutte le altre, il principio di dominanza porta a scegliere tale

alternativa ed il problema decisionale è risolto in modo ottimale. Sfortunatamente casi

del genere si riscontrano molto raramente nelle situazioni reali.

Una seconda interessante questione legata alla specificazione del problema

3 Si tratta di critiche analoghe a quelle rivolte all’approccio bayesiano soggettivo. In tale approccio, come illustrato

nel capitolo precedente, alla misura delle probabilità a priori si perviene attraverso una traduzione soggettiva delle

proprie conoscenze, cioè al patrimonio informativo disponibile al momento in cui si procede all’analisi dei dati

campionari (conoscenza oggettiva).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

376

decisionale è quella relativa alla distinzione tra decisione giusta e decisione razionale,

la decisione di chi agisce è giusta se si risolve in esiti ottimali. Se si disponesse di una

conoscenza completa del futuro basterebbe, pertanto, fare riferimento al solo principio:

prendi la decisione giusta. Purtroppo la maggior parte delle decisioni è basata sul ciò

che si ritiene possa accadere e non su quello che accadrà realmente. Nella quasi totalità

dei casi risulta quindi impossibile prendere una decisione giusta, si dovrà allora

prendere una decisione razionale, valutando al meglio l’insieme parziale di informazioni

a disposizione riguardo al vero stato del mondo, e non è affatto scontata l’equivalenza:

decisione razionale = decisione giusta.

Da quanto sopra detto emerge implicitamente una diversificazione tra situazioni

decisionali.

Usualmente si distinguono le decisioni a seconda del contesto informativo in cui

l’agente opera in:

1. decisioni in situazioni di certezza

2. “ “ “ “ rischio

3. “ “ “ “ incertezza

Se con 1 2 , ,..., ,...,i mA a a a a si indica l’insieme delle decisioni (azioni) alternative

possibili, con 1 2, ,..., ,...,j n l’insieme dei possibili stati di natura e con

11 12 ij mnC c ,c ,...,c ,...,c l’insieme delle conseguenze, dove le conseguenze ijc sono

funzione dell’azione ia e dello stato j

),a(fc jiij per i=1, 2, ..., m ; j=1, 2, ..., n

si può rappresentare il processo decisionale (dove è stato ipotizzato un numero discreto

di alternative ed un numero discreto di stati di natura) in modo appropriato facendo

ricorso alla tavola di decisione o all’albero di decisione:

1 11 11 12

2 21 22 2 2

1 2

1 2

1 2 j n

j n

j n

i i i ij in

m m m mj mn

AzioneStato di natura

c ca c c

a c c c c

a c c c c

a c c c c

Tab. 7.1 – Tavola di decisione

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

377

a1

a2

.

.

.

1

2

.

j

.

n

1

2

.

j

.

n

1

2

.

j

.

n

c11

c12

.

.

c1j

.

.

c1n

c21

c22

.

.

c2j

.

.

c2n

ci1

ci2

.

.

cij

.

.

cin

Nodo

decisionale

Azioni

am

Nodo

aleatorio

1

2

.

j

.

n

cm1

cm2

.

.

cmj

.

.

cmn

Stati Conseguenze

.

.

.

ai

Fig. 7. 1 - Albero di decisione

7.2 - Decisioni basate sulle sole informazioni a priori

Se l’agente, il decisore, conoscesse lo stato di natura, ad es.: j , il problema di scelta si

ridurrebbe al confronto tra m conseguenze (nell’es. mjijjj c,...,c,...,c,c 21 ) e la scelta

razionale equivarrebbe alla scelta giusta, sempre che siano note le conseguenze ed il

decisore sia in grado di esprimere, in modo razionale, le sue preferenze riguardo alle

conseguenze stesse. Il comportamento razionale consente, in altre parole,

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

378

l’individuazione dell’alternativa ottimale che comporta il conseguimento del massimo

beneficio.

Il problema di decisione introdotto può, pertanto, essere rappresentato nel modo

seguente:

Azioni Conseguenze

1a 1c

2a 2c

:

:

:

:

ia ic

:

:

:

:

ma mc

dove con A, ai A, si indica lo spazio o insieme delle azioni e con C, ci C, lo spazio o

insieme delle conseguenze.

Come già sottolineato in precedenza, le considerazioni che s’intendono svolgere

riguarderanno esclusivamente la teoria normativa delle decisioni; si considererà, cioè,

la teoria che si preoccupa di definire come le decisioni dovrebbero essere prese dagli

individui al fine di massimizzare il proprio benessere; essa, quindi, non fa riferimento ai

comportamenti effettivamente osservabili nella realtà ma fa riferimento ad un individuo

“idealmente razionale” e deduce, sulla scorta di assiomi e attraverso la dimostrazione di

teoremi, un insieme di regole di comportamento cui l’individuo stesso deve uniformarsi.

7.2.1 Assiomi di comportamento razionale (parte I)

Dato l’insieme di conseguenze 1 2, ,..., mC c c c e le relazioni di preferenza , , 4 ,

si possono definire i seguenti assiomi, esplicativi di un comportamento razionale:

Assioma 1: Comparabilità

jiji ccCcc ,, oppure ij cc oppure sono vere entrambe

Assioma 2: Transitività

Cccc kji ,, , se ji cc e kikj cccc

Assioma 3: Coerenza tra indifferenza e preferenza debole

Ccc ji , : ci cj (ci cj e cj ci)

4 La relazione di preferenza forte (a b sta a significare che l'agente - il decisore - preferisce strettamente

l'alternativa a all'alternativa. b). La relazione di preferenza debole (a b sta a significare che l'agente - il

decisore - preferisce debolmente l'alternativa a all'alternativa b). La relazione di indifferenza (a b sta a significare

che le due alternative forniscono all'agente - il decisore - esattamente lo stesso beneficio).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

379

Assioma 4: Coerenza tra preferenza forte e preferenza debole

Ccc ji , : ji cc cj ci

La rilevanza degli assiomi emerge con tutta chiarezza quando se ne evidenziano le

implicazioni operative. La confrontabilità implica la necessità per il decisore di operare,

comunque, una scelta tra due alternative anche se questa, in base al terzo assioma, può

comportare indifferenza tra le stesse. La transitività e gli assiomi di coerenza

rispondono a una richiesta di non contraddittorietà tra le preferenze espresse.

Se i quattro assiomi sono soddisfatti, valgono i teoremi sotto riportati5.

Teorema 1 (Esistenza della funzione di valore).

Per ogni insieme finito di oggetti (conseguenze) C={c1,c2, ...,cm} sul quale

viene introdotta una relazione che soddisfa gli assiomi 1 - 4 esiste, e può

essere costruita, una funzione a valori reali espressi in scala ordinale V(.)

tale da soddisfare la relazione

ci cj V(ci ) V(cj ).

Il teorema 1 stabilisce l'esistenza di una funzione a valori ordinali perfettamente

equivalente allo schema di preferenze del decisore.

Teorema 2 (Unicità della funzione di valore).

Per ogni insieme finito di oggetti (conseguenze) C={c1,c2, ...,cm} sul quale

viene introdotta una relazione che soddisfa gli assiomi 1 - 4, esistono due

funzioni di valore V(.) e W(.) che soddisfano le relazioni

ci cj V(ci ) V(cj ) e ci cj W(ci ) W(cj )

se e solo se V()=h(W(.)) dove h(.) è una funzione monotona crescente.

Il teorema 2 stabilisce che la funzione a valori reali espressi in scala ordinale è

unica a meno di una trasformazione monotona crescente.

Per lo sviluppo successivo della trattazione risulta conveniente introdurre una nuova

relazione tra oggetti, la relazione di scambio.

Definizione - La relazione di scambio (a b sta ad indicare la cessione di b per

avere in cambio a. Una generica relazione di scambio si indica con (ci cj) e si legge:

“lo scambio di cj con ci, vale a dire la cessione di cj per ottenere ci”. Anche sulle

relazioni di scambio ha senso introdurre le relazioni di preferenza forte, di preferenza

debole e di indifferenza (per distinguerle dalle analoghe relazioni sugli oggetti saranno

indicate con una “s” come pedice, s , s ,s).

7.2.2 Assiomi di comportamento razionale (parte II)

Assioma 5: Ordinamento debole

5 La dimostrazione dei teoremi è riportata, tra gli altri, in Chiandotto e Bacci (2004 e 2015).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

380

Sia la relazione che la relazione s soddisfano gli assiomi 1 – 4

Assioma 6: Coerenza tra e s

ci, cj, ck C: ci cj (ci cj ) s (ck ck ) ck C

Assioma 7: Coerenza interna della relazione di scambio

a) (ci cj ) s (ck cz ) (cz ck ) s (cj ci ).

b) (ci cj ) s (ck cz ) e (cj cl ) s (cz cy ) (ci cl ) s (ck cy ).

Assioma 8: Solvibilità

a) ci, cj, ck C y C tale che: (y ci ) s (cj ck )

b) ci, cj C y C tale che: (ci y ) s (y cj )

Assioma 9: Proprietà Archimedea

Ogni sequenza standard strettamente limitata è finita

1/ ;n n n nc y c c c s 01 cc ,

dove indica il condizionamento alle relazioni che lo seguono; nel caso particolare che

si sta trattando y cn significa che la sequenza è strettamente limitata e (cn c(n-1)) s

(c1 c0) implica che (c1 c0) s (c2 c1) s (c3 c2) s … s (cn c(n-1)), ossia che

la sequenza è standard.

Se gli assiomi fin qui elencati risultano soddisfatti valgono i seguenti teoremi.

Teorema 3 (Esistenza della funzione di valore misurabile)

Per ogni insieme finito di oggetti (conseguenze) C={c1,c2,...,cm} sul quale

vengono introdotte le relazioni e s che soddisfano gli assiomi 5 - 9

esiste, e può essere costruita, una funzione misurabile a valori reali espressi

in scala di intervallo V(.) tale da soddisfare le relazioni

ci cj V(ci ) V(cj );

(ci cj ) s (ch ck ) V(ci ) - V(cj ) V(ch ) - V(ck ).

Il teorema 3 stabilisce l'esistenza di una funzione di valore misurabile

perfettamente equivalente allo schema di preferenze del decisore.

Teorema 4 (Unicità della funzione di valore misurabile)

Per ogni insieme finito di oggetti (conseguenze) C={c1,c2,...,cm} sul quale

vengono introdotte le relazioni e s che soddisfano gli assiomi 5 - 9,

esistono due funzioni espresse su scala di intervallo V(.) e W(.) che

soddisfano le relazioni

ci cj V(ci) V(cj);

(ci cj ) s (ch ck ) V(ci) - V(cj) V(ch) - V(ck);

ci cj W(ci) W(cj);

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

381

(ci cj ) s (ch ck ) W(ci) - W(cj) W(ch) - W(ck)

se e solo se V(.)=+ W(.) per 0.

Il teorema 4 stabilisce che la funzione di valore misurabile è unica a meno di una

trasformazione lineare positiva.

Se lo stato di natura non è noto ma si dispone di una misura della probabilità dei vari

stati di natura, si parla di decisioni in situazioni di rischio.

La tavola di decisione sopra riportata potrà essere riscritta nei termini seguenti

Probabilità degli stati di natura

Azioni 1P 2P ..... nP

1a 11c 12c ..... c1n

2a 21c 22c ..... c2n

.... ..... ..... ..... .....

.... ..... ..... ..... .....

ma cm1 cm2 ..... mnc

Lo sviluppo della teoria delle decisioni in condizioni di rischio o incertezza risulta

notevolmente facilitato dal ricorso al concetto di lotteria. Nello schema delle lotterie le

conseguenze associate alle diverse azioni, sono, appunto, espresse come lotterie; tale

tipo di rappresentazione si rivela particolarmente utile nella esplicitazione degli assiomi

di comportamento razionale e nella dimostrazione dei teoremi, in quanto il riferimento

alle lotterie evidenzia in modo immediato sia il contenuto sintattico degli assiomi sia la

loro valenza semantica.

Una lotteria semplice

innijjiii cpcpcpcpl ,;......;,;......;,;, 2211

può essere messa in corrispondenza alle diverse azioni stabilendo una relazione di

equivalenza tra azioni stesse e lotterie nel senso che se si sceglie l’azione ai è come

scegliere la partecipazione alla lotteria li dove si ha la possibilità di ricevere il premio

cij con probabilità pj = p(j ).

Una lotteria composta è, invece, rappresentata nel modo seguente:

),;;.........,;,( irrii lqlqlql i2211

dove iri lll ,,........., i21 rappresentano le lotterie semplici e rqqq ,,........., 21

r

i

ii q,q1

10 rappresentano le probabilità di partecipare a tali lotterie.

Il risultato di una lotteria può consistere, quindi, nella partecipazione ad un’altra

lotteria od anche nel conseguimento di un premio finale; in questa sede si assume che il

numero di passaggi necessari per il conseguimento del premio finale (conseguenza) sia

finito.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

382

Ovviamente, il decisore che è in grado di esprimere le proprie preferenze nei

confronti di lotterie semplici è anche in grado di esprimere le proprie preferenze nei

confronti delle cosiddette lotterie di riferimento.

Se per convenienza e senza perdere in generalità si assume che

nccc ........ 21

Una qualunque lotteria di riferimento è espressa nella forma

nn cpcccpcpc ),1(.;;.........0, ;0, ;, 3211

dove 1c è la conseguenza preferita a tutte le altre e nc è la conseguenza meno

preferita; affinché il problema risulti non banale deve essere ncc 1 .

Si può osservare come le singole conseguenze possono essere interpretate come

lotterie degeneri6, infatti:

imjiijjiiiij ccccccc 0, ;;.........0, ;1, ;;0,;.........0, ;0, 1)(1)(21

Si procede ora nella descrizione della base assiomatica della teoria delle decisioni in

situazioni di rischio o incertezza trattando il problema di scelta facendo riferimento alle

lotterie.

Si sottolinea che il ricorso al linguaggio delle lotterie ha natura esclusivamente

strumentale e che l’obiettivo che si vuol perseguire è quello della individuazione di una

regola di comportamento ottimale. In particolare si dimostra che se il decisore è

disposto ad uniformare la propria condotta al rispetto di una serie di assiomi di

comportamento razionale, lo stesso conseguirà il massimo beneficio scegliendo

l’alternativa a* che soddisfa la relazione

m

j

ijj

n

iuPa

11

max

dove jiij auu , è una funzione a valori reali detta di utilità. Pertanto, il criterio di

decisione ottimale è quello della massimizzazione dell’utilità attesa.

Aggiungendo ai 9 assiomi di comportamento razionale, introdotti in precedenza,

quelli sotto riportati, si dimostra agevolmente quanto affermato

7.2.3 Assiomi di comportamento razionale (parte III)

Assioma 10: Ordinamento debole

Ribadisce semplicemente che le preferenze del decisore sull’insieme delle lotterie

1 2, ,..., mL l l l obbediscono agli assiomi 1 - 4.

Assioma 11: Continuità

l1, l2, l3 L, se l1 l2 l3 p (con 0 p 1) tale che l2 p l1 + (1-p) l3 .

6 Una lotteria è detta degenere quando dà una probabilità pari ad 1 di ottenere un risultato c, cioè quando

offre c con certezza.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

383

L’assioma risponde ad un’esigenza di continuità nelle preferenze. Ad esso sono state

mosse varie critiche di carattere logico: alcuni affermano che esistono “premi” per cui

nessun valore di p è tale, per il decisore, da consentire il rispetto della relazione di

indifferenza. Ad esempio, se la lotteria l3 ha come risultato unico possibile la morte del

decisore, questi preferirà sempre e comunque la lotteria l2. In realtà questa critica può

essere superata riconoscendo che ognuno di noi, ogni giorno, compie tante semplici

azioni che comportano pur sempre una possibilità di morire (per es., attraversare la

strada).

Assioma 12: Monotonia

Date due lotterie l1 e l2 L e tali che l1 l2 e due probabilità p e p’, allora

(l1 p l2) (l1 p’ l2) p p’

In altre parole, il decisore sceglierà sempre la lotteria che gli dà la probabilità più alta di

ottenere il risultato preferito.

Assioma 13: Riduzione delle lotterie composte

Sia data la lotteria composta l = (q1, l1; q2, l2; …..; qs, ls), avente, quindi, come premi le

lotterie semplici l1, l2, …, ls e dove lj = (pj1, c1; pj2, c2;…..; pjr, cr) con j = 1, 2, …, s è la

generica lotteria premio.

Sia, poi, l’ la lotteria semplice (p1, c1; p2, c2; …; pr, cr), dove pi = q1p1i + q2 p2i + …..+

qs psi per i = 1, 2, …r, allora l l’.

Assioma 14: Sostituzione o cancellazione

Siano i jc , c C tali che jc ~ ic ; siano, poi, l ed l’ due lotterie, semplici o composte,

tali che

l = (……;q, ic ;……)

l’ = (……; q, jc ; ……)

allora l l’

Assioma 15: Indipendenza

Dati i j hc , c , c C tali che jc ~ ic ) (~) ( hjhi cpccpc

Il rispetto degli assiomi 1-15 di comportamento razionale sopra riportati consente di

dimostrare l’esistenza e l’unicità della funzione di utilità di un generico soggetto

decisore.

Teorema 5 (Esistenza della funzione di utilità)

Se le preferenze di un individuo sull’insieme C obbediscono agli assiomi 1–15,

allora esiste una funzione di utilità u definita su C tale che:

a) ci cj u(ci ) u(cj ) ci, cj C (Proprietà di ordinabilità)

b) (p1, c1; p2, c2; ….; pr, cr) (p’1, c1; p’2, c2; ….; p’r, cr)

u(p1, c1; p2, c2; ….; pr, cr ) u(p’1, c1; p’2, c2; ….; p’r, cr )

p1u(c1) + p2 u(c2) + …..+ pr u(cr) p’1u(c1) + p’2 u(c2) + …..+ p’r u(cr)

ir

i

ii

r

i

i xupxup

1

'

1

(Proprietà di linearità).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

384

Il teorema 5 stabilisce l'esistenza di una funzione di utilità perfettamente

equivalente allo schema di preferenze del decisore.

Teorema 6 (Unicità della funzione di utilità)

Se u è una funzione di utilità su C, allora uw con > 0 è

anch’essa una funzione di utilità che rappresenta lo stesso schema di

preferenze. Analogamente, se u(.) e w(.) sono due funzioni di utilità su C

che rappresentano lo stesso schema di preferenze, allora esistono un > 0 e

un tali che uw .

Il teorema 6 afferma, dunque, che per ogni individuo esiste una ed una sola

funzione di utilità a meno di trasformazioni lineari positive.

Un individuo razionale (che soddisfa cioè gli assiomi 1 - 15 per ottenere il massimo

beneficio sceglierà l’azione a cui egli associa, in base al suo schema di preferenze,

l’utilità attesa maggiore. Cioè l’alternativa a* che soddisfa la relazione

*

1 1

mn

j iji J

a argmax P u

dove jiij auu , è una funzione a valori reali detta di utilità. Pertanto, il criterio di

decisione ottimale è quello della massimizzazione dell’utilità attesa.

7.3 - Decisioni in situazioni di estrema incertezza

Se non si dispone di alcuna informazione sulla probabilità dei vari stati di natura, si

parla di decisioni in situazioni di incertezza.

Alcuni autori, quelli che si richiamano alla scuola bayesiana-soggettivista, non

accettano la tripartizione sopra richiamata in quanto ritengono, non solo possibile, ma

anche necessario, per una risoluzione ottimale dei problemi decisionali, procedere

all’introduzione di una misura della plausibilità (probabilità soggettiva) dei vari stati di

natura facendo così cadere la distinzione tra situazioni di rischio e situazioni di

incertezza.

Su questo punto si avrà modo di ritornare successivamente, qui si accoglie la

possibilità dell’esistenza di situazioni che possono essere definite di estrema incertezza

o di ignoranza assoluta, nelle quali non si può o non si vuole procedere alla misura

della plausibilità dei vari stati di natura.

Si supponga ora che le conseguenze siano esattamente definite, che siano espresse in

termini di utilità

( , )ij ij i jy c u a per i=1, 2, ..., m ; j=1, 2, ..., n

e che ragionevolmente, un’utilità più elevata sia preferita ad una utilità più bassa.

L’azione ottima è, pertanto, quella cui corrisponde l’utilità più elevata. Quindi, nel

caso in cui il decisore si trova ad operare in situazioni di certezza, cioè di conoscenza

dello stato di natura, il problema decisionale è praticamente risolto: basterà, infatti,

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

385

scorrere la colonna delle utilità, individuare la più elevata e scegliere l'azione

corrispondente a tale valore.

Molto più problematico è il caso in cui il decisore si trova ad operare in situazioni di

estrema incertezza. Infatti, se si guarda alla Tab. 7.2, dove ai simboli algebrici ijc sono

stati sostituiti i simboli ijy , che rappresentano le utilità, si vede chiaramente come, non

essendo noto lo stato di natura, non sia possibile operare il confronto tra i valori

numerici riportati nella tavola a meno che non ci si riconduca ad una situazione analoga

a quella prospettata in precedenza (situazione di certezza) dove ad ogni azione diversa

corrisponde un solo valore numerico; si tratta, in altre parole, di passare, in qualche

modo, da n colonne ad una sola colonna.

Tab. 7.2 - Tavola di decisione con conseguenze espresse in termini di utilità

Il caso in cui l’agente non sia in grado o non voglia assegnare una distribuzione di

probabilità agli stati di natura s’incontra frequentemente in pratica. Risulta quindi

conveniente una breve rassegna dei criteri di decisione suggeriti per la risoluzione del

problema di scelta in tali situazioni (di estrema incertezza). Per semplificare

l’esposizione, senza perdere in generalità, ci si limiterà ad analizzare il caso discreto.

Tra i criteri suggeriti per la soluzione del problema di decisione in situazioni di

estrema incertezza assumono un certo rilievo: quelli che, grosso modo, fondano il

criterio di decisione su elementi caratteristici (ad esempio la realizzazione più

favorevole, quella meno favorevole, ecc.) della Tab. 7.2.

1. Criterio del max-min o criterio di Wald. Esso consiste nello scegliere l’azione a*

che corrisponde al massimo delle utilità minime

* ( )ijji

a argmax min y

Questo criterio è proprio del pessimista estremo il quale è convinto che, qualunque

azione egli scelga, si realizzerà sempre quello stato di natura (condizioni strutturali,

j n1 2

1j 1n1 11 12

2 21 22 2j 2n

i i1 i2 ij in

m m1 m2 mj mn

AzioneStato di natura

θ θθ θ

y ya y ya y y y y

a y y y y

a y y y y

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

386

economiche di produzione e di mercato, di lavoro, ecc.) che gli permetterà il

conseguimento del beneficio minimo. Quindi, egli si premunirà contro la natura

cercando di ottenere il massimo, tra i benefici minimi, che essa è disposta a

concedere.

2. Criterio del max-max. All’opposto del pessimista estremo c’è l’estremo ottimista, ed

è colui il quale ritiene che qualunque sia l’azione prescelta, la natura sarà tanto

benigna nei suoi confronti da concedere il beneficio massimo. La scelta ottimale

risulta dalla relazione

* ( )ijji

a argmax max y

3. Criterio di Hurwicz. Considerando l’espressione

* (1 )ij ijj ji

a argmax min y max y

per compreso tra zero ed uno, si deriva un criterio intermedio ai due sopra esposti.

L’ assume quindi il senso di indice di pessimismo; infatti, per = 1 si ha il criterio

del max-min, per = 0 si ha il criterio del max-max.

4. Criterio di Savage o del min-max rimpianto. Per applicare il criterio di Savage,

occorre sostituire agli elementi di ciascuna colonna della Tab. 2 la differenza tra

l’elemento che ha valore massimo e l’elemento che occupa quella posizione

ijiji

ij y y maxr

scegliendo poi l’azione a* per la quale il massimo rimpianto assume valore minimo

* ( )ijji

a argmin max r

Attraverso il criterio del min-max rimpianto l’operatore cerca di minimizzare i danni

di una decisione errata.

I quattro criteri di decisione presentati hanno tutti un certo carattere di accettabilità:

naturalmente gli argomenti che possono essere avanzati a sostegno dell’uno o dell’altro

criterio, sono di natura diversa, il che in effetti non presenta gravi inconvenienti.

L’aspetto più problematico riguarda invece l’applicazione dei quattro criteri: infatti

se essi vengono adottati in uno stesso problema di decisione ne può risultare una scelta

di quattro azioni differenti. Da alcuni autori tale fatto è stato preso a pretesto per

affermare che uno o più criteri devono essere necessariamente errati. Non sembra

comunque che esistano ragioni sufficienti a sostegno di tale punto di vista; pare invece

più giusta l’affermazione che tutti i criteri proposti hanno una portata applicativa

limitata, e che a seconda delle circostanze dovrà essere adottato il criterio più

opportuno.

Un ulteriore criterio cui si fa riferimento quando si deve operare in situazioni di

estrema incertezza è il cosiddetto criterio di Laplace o criterio della ragione

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

387

insufficiente. Il criterio di Laplace individua quale azione migliore a* quella cui

corrisponde il massimo della somma

1

*n

iji j

a argmax y

In base al criterio di Laplace, si attribuisce implicitamente a tutti gli stati di natura j

uguale probabilità; ciò viene fatto in quanto non si hanno motivi sufficienti per ritenere

che la distribuzione delle probabilità sia diversa da quella uniforme. Evidentemente una

tale giustificazione risulta del tutto insoddisfacente perché non sono chiari i motivi per i

quali lo stato d’ignoranza completa debba implicare necessariamente un’uguale

probabilità degli stati di natura. Pertanto, o si prende atto che si sta operando in

situazioni di estrema incertezza, e cioè di ignoranza completa riguardo alla plausibilità

(probabilità) dei vari stati di natura, e si agisce di conseguenza, oppure si dovrà

procedere esplicitamente alla valutazione (soggettiva)7 delle probabilità attraverso

procedure adeguate. In realtà, anche negli altri criteri si opera una sorta di introduzione

indiretta delle probabilità, ma si tratta comunque di una assegnazione di probabilità che

dipende più dalle azioni che dagli stati di natura. Infatti, se si considera, ad esempio, il

criterio del max-max, questo si risolve, in sostanza e distintamente per ciascuna azione,

nell’attribuzione di una distribuzione degenere di probabilità che assegna valore 1 alla

probabilità dello stato di natura cui corrisponde la conseguenza più favorevole, mentre

nel criterio del max-min si assegna valore 1 alla probabilità dello stato di natura cui

corrisponde la conseguenza più sfavorevole.

7.4 - Struttura del processo decisionale

In questo paragrafo, e nei due paragrafi successivi, verranno presi in considerazione gli

aspetti più elementari della teoria statistica delle decisioni seguendo gli schemi classici

introdotti da A. Wald nel 19508.

Si ricorda che nelle pagine precedenti sono stati analizzati i problemi decisionali in

situazioni di estrema incertezza (nessuna informazione sugli stati di natura) e in

situazioni di rischio o incertezza presupponendo la conoscenza della distribuzione delle

probabilità sugli stati di natura (decisioni basate sulle sole informazioni a priori),

verificando che, nel contesto della teoria dell’utilità classica, l’azione ottima per il

decisore è quella che massimizza l’utilità attesa.

Il decisore deve scegliere tra una gamma di azioni alternative possibili ma le

conseguenze di ciascuna azione dipendono da una situazione reale detta stato di natura.

Il decisore, sia in situazioni di estrema incertezza (mancanza assoluta di informazioni

sulle probabilità relative allo stato di natura), sia in quelle di rischio (conoscenza della

distribuzione di probabilità sugli stati di natura), può procedere nella scelta oppure

decidere di rinviare la scelta definitiva dell’azione procedendo all’acquisizione di

7 Su queste problematiche si veda quanto è stato detto nel capitolo precedente. 8 L'argomento viene trattato estesamente in Ferguson (1967), De Groot (1970), Berger (1985) e Piccinato (1996),

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

388

ulteriori dati (di tipo campionario). Si sottolinea in proposito che l’acquisizione di dati

comporta usualmente un costo che potrebbe non risultare compensato dal guadagno

informativo; ma sul valore dell’informazione campionaria si avrà modo di soffermare

l’attenzione successivamente.

Le diverse tipologie di problemi decisionali da affrontare e risolvere sono pertanto

di:

decisione in assenza assoluta di informazioni (teoria classica delle

decisioni);

decisione basata sulle sole informazioni a priori (teoria bayesiana delle

decisioni);

decisione basata sulle sole informazioni campionarie (teoria statistica

classica delle decisioni);

decisione basata su informazioni campionarie e informazioni a priori

(teoria statistica bayesiana delle decisioni).

Nel paragrafo successivo verrà affrontato il terzo problema, quello cioè della

risoluzione di problemi decisionali basandosi sulle sole informazioni campionarie, ma

prima di procedere nella illustrazione risulta conveniente una elencazione dei fattori che

entrano in gioco e che possono caratterizzare i problemi decisionali in tutte le loro

possibili articolazioni.

Gli elementi che possono caratterizzare lo svolgimento di un qualunque processo

decisionale, sia in termini di spazi di riferimento che di funzioni, nelle diverse

strutturazioni e fattispecie operative, sono:

spazio parametrico o spazio degli stati di natura; in molte situazioni

tale spazio è Rh e può trattarsi sia di uno spazio discreto che di uno spazio

continuo;

A spazio delle azioni finali (si assume che lo spazio sia discreto);

E spazio delle prove o degli esperimenti (si assume che lo spazio sia

discreto);

S spazio o universo dei campioni come risultato di ciascun

esperimento. Generalmente i risultati campionari vengono espressi da n

(dimensione campionaria) k-uple, se k sono i caratteri presi in

considerazione di numeri reali 1 2, ,..., ,...,i nX X X X dove iX , i = 1, 2,

….,n, è un vettore di dimensione k;

D spazio delle decisioni.

In aggiunta agli spazi appena definiti risulta conveniente introdurre esplicitamente

almeno tre funzioni:

la funzione di utilità ,U u a , definita in precedenza, la funzione

associa a ciascuna azione e stato di natura una conseguenza espressa in

termini di utilità;

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

389

la funzione di decisione a d x , funzione che proietta ciascun punto

dello spazio campionario nello spazio delle azioni9;

la funzione di perdita ,L l a , la funzione associa a ciascuna azione e

stato di natura una conseguenza espressa in termini di perdita.

Le relazioni tra i diversi elementi sopra definiti sono illustrate nella Fig. 7.2 dove è

riportata la struttura completa del processo decisionale le cui diverse articolazioni

saranno caratterizzate dalla presenza di specifici elementi e particolari relazioni: Ad

esempio, nella teoria classica delle decisioni (decisioni in situazioni di estrema

incertezza), entrano in gioco soltanto lo spazio degli stati di natura, lo spazio delle

azioni e lo spazio delle conseguenze (espresse in termini di utilità o di perdite).

Fig. 7.2 - Struttura del processo decisionale

L’introduzione della funzione di perdita ,alL (loss) consente la trattazione

della teoria statistica delle decisioni nei termini più tradizionali secondo l’impostazione

originaria data da Wald e che risulta più consona al tipico ragionamento statistico. A

sostegno di tale affermazione basta fare riferimento ai problemi classici di stima

statistica puntuale e di test delle ipotesi. Nel primo caso si ricorda che, una delle

9 Una regola di decisione (funzione di decisione) si dice semplice o non aleatoria se ad ogni punto Sx

corrisponde un solo punto Aa , mista od aleatoria se ad ogni punto Sx corrisponde una gamma di punti

Aa cui è associata una distribuzione di probabilità. Da rilevare che le regole di decisione semplici si ottengono

come caso particolare di quelle miste quando lo spazio delle probabilità è degenere.

Verosimiglianza

,f x

Probabilità a posteriori

/P x Probabilità a priori

Spazio delle azioni

A

Spazio dei

campioni

S

Spazio degli

esperimenti

E

Spazio

parametrico

(Stato di natura)

Θ

d x

a

x

Spazio delle

decisioni

D

Utilità

,aU

o

Perdite

,aL

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

390

proprietà “augurabili” per lo stimatore ˆ T X di è l’efficienza che

tradizionalmente viene misurata attraverso il computo dell’errore quadrato medio

qualunque sia il vero valore del parametro

2*ˆ ˆT min E T min EQM x X

basterà interpretare ˆ EQM come funzione di perdita che si vuol minimizzare. Nella

teoria del test delle ipotesi, fissata la probabilità di commettere un errore di I tipo si

cerca di minimizzare la probabilità di commettere un errore di II tipo; in questo caso, la

perdita che si vuol minimizzare è rappresentata dalla probabilità dell’errore di secondo

tipo.

Se si ragiona in termini di perdite, interpretate semplicemente come utilità negative,

si può riproporre la tabella di decisione esprimendo le conseguenze ijc in termini di

perdite ijjiij lalc , anziché in termini di utilità

ijjiij uauc , .

Decisioni Stato di natura

1 2 …… j ..... n

1d 1 1,l d 1 2,l d …… 1, jl d ..... 1, nl d

2d 2 1,l d 2 2,l d 2 , jl d ..... 2, nl d

.... ..... ..... ..... .....

id 1,il d 2,il d ,i jl d ….. ,i nl d

.... ..... ..... ..... .....

md 1,ml d 2,ml d ,m jl d ..... ,m nl d

Tab. 7.3 - Tavola di decisione con conseguenze espresse dalla funzione di perdita

Se il decisore opera in condizioni di estrema incertezza, cioè nelle situazioni nelle

quali non possiede informazioni sulla distribuzione di probabilità degli stati di natura, o

non vuole utilizzare quelle in suo possesso perché poco affidabili, per risolvere il

problema di scelta dovrà fare ricorso ad uno dei criteri proposti per risolvere i problemi

decisionali in situazioni di estrema incertezza. illustrati nel paragrafo precedente.

Di seguito vengono riproposti tre dei criteri introdotti considerando le perdite

jiij all , anziché le utilità) ,ij i ju l a .

Criterio del min-max o criterio di Wald. Esso consiste nello scegliere l’azione a* che

corrisponde al minimo della massima perdita

* )ijji

a argmin( max l

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

391

Come già sottolineato questo criterio è proprio del pessimista estremo il quale è

convinto che, qualunque azione egli scelga, si realizzerà sempre quello stato di natura

cui è collegata la perdita massima.

Criterio del min-min. All’opposto del pessimista estremo c’è l’estremo ottimista, ed è

colui il quale ritiene che qualunque sia l’azione prescelta, la natura sarà tanto

benigna nei suoi confronti da concedere la perdita minima. La scelta ottimale risulta

dalla relazione

ijji

a* argmin ( min l )

Criterio di Hurwicz.

*

ij ijj ji

a argmin α max l + (1- α) min l

per compreso tra zero ed uno, si deriva un criterio intermedio ai due sopra esposti.

L’ assume quindi il senso di indice di pessimismo; infatti, per = 1 si ha il criterio

del min-max, per = 0 si ha il criterio del min-min.

Se il decisore opera in condizioni di rischio, cioè nel presupposto che sia nota la

distribuzione delle probabilità sugli stati, soddisfacendo i postulati di comportamento

razionale sopra illustrati, il problema decisionale ha una soluzione immediata; infatti,

basterà sostituire il principio di massimizzazione dell’utilità attesa con quello della

minimizzazione della perdita attesa: Pertanto l’azione ottimale *a è definita dalla

relazione

1

* , ,i i

n

i j i j ja a i

a argmin E l a argmin l a P

Come già sottolineato, per risolvere il problema decisionale in situazioni di estrema

incertezza, degli elementi sopra definiti e riproposti in forma grafica nella Fig. 7.2,

quelli da considerare sono:

la funzione di perdita e il corrispondente spazio delle conseguenze;

lo spazio delle azioni;

lo spazio degli stati di natura;

mentre, per risolvere il problema decisionale in situazioni di rischio, degli elementi

sopra definiti e riproposti in forma grafica nella Fig. 7.1, quelli da considerare sono:

la funzione di perdita e il corrispondente spazio delle conseguenze;

lo spazio delle azioni;

lo spazio degli stati di natura;

la distribuzione delle probabilità (a priori) sugli stati di natura.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

392

7.5 - Decisioni basate sulle sole informazioni campionarie

Nelle due situazioni prospettate nel paragrafo precedente, l'operatore può procedere

all'individuazione dell'azione a*, nell'insieme potenziale delle azioni A, ritenuta ottimale

(attraverso l’impiego di uno dei criteri di decisione elencati, se si opera in condizioni di

estrema incertezza, quella che minimizza la perdita attesa, se si opera in situazioni di

rischio o incertezza), alternativamente, come già sottolineato, può decidere di acquisire

informazioni sullo stato di natura predisponendo un particolare esperimento da scegliere

dalla famiglia E di esperimenti potenziali. Da notare che qui l'esperimento va inteso in

senso ampio, includente cioè tutti i casi di acquisizione di dati quali la rilevazione

mediante indagine campionaria, la predisposizione di un esperimento in senso classico,

la raccolta di dati già pubblicati, lo spoglio di schede contenenti le manifestazioni di

certi fenomeni, ecc..

Ovviamente, l’acquisizione di informazioni campionarie, oltre a collocare il processo

decisionale nel contesto statistico (dalla teoria delle decisioni alla teoria statistica delle

decisioni), può comportare un costo che potrebbe non essere compensato dalla

riduzione dell’incertezza. Sorge così un nuovo problema decisionale che abbisogna di

soluzione; l’interrogativo a cui dare risposta è, quindi, se procedere o meno

all’acquisizione di informazioni campionarie il cui valore (e convenienza) potrà essere

misurato soltanto a posteriori, cioè dopo aver realizzato l’esperimento ed acquisito le

informazioni. Il tema del valore dell’informazione campionaria verrà trattato nel

paragrafo 7.7, il paragrafo 7.6 sarà dedicato, invece, alla illustrazione delle

problematiche connesse alla integrazione delle informazioni a priori con informazioni

campionarie (teoria statistica bayesiana delle decisioni), mentre in questo paragrafo si

affronterà il tema della scelta ottimale tra le diverse alternative utilizzando le sole

informazioni campionarie (decisioni basate sulle sole informazioni campionarie: teoria

statistica classica delle decisioni).

Come già sottolineato, seguendo una tradizione ormai consolidata, la presentazione

farà riferimento alle perdite e non alle utilità; in proposito, si sottolinea ancora una volta

che la funzione di perdita non è altro che una particolare caratterizzazione della

funzione di utilità.

L’argomento verrà introdotto attraverso l’illustrazione di un problema decisionale

divenuto ormai classico in letteratura perché, nonostante la sua estrema semplicità,

consente una trattazione approfondita di tutti gli aspetti di interesse: si deve decidere se

non procedere (azione 1a ) o procedere (azione

2a ) alla trivellazione di un pozzo non

disponendo di informazioni sulla presenza o meno del petrolio nel terreno. Se il petrolio

non è presente, lo stato di natura è 1 , se invece è presente, lo stato di natura è 2 , il

costo della perforazione è pari a 300mila $, gli introiti, in caso di presenza del petrolio,

sono pari a 900mila $; ovviamente l’introito in caso di assenza di petrolio è 0.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

393

Il problema decisionale è proposto nella Tab. 7.4, dove si fa riferimento alle utilità, e

nella Tab. 7.5, dove le conseguenze sono espresse in termini di perdite.

Se il decisore conoscesse le probabilità (a priori), ad esempio 50.01 P e

50.02 P , ne risulterebbe un’utilità attesa pari a 0, in corrispondenza dell’azione 1a ,

mentre l’utilità attesa per 2a è pari 150mila $, quindi la scelta ottimale è

2* aa . Per

contro, le perdite attese sarebbero, rispettivamente pari a 300mila $, per l’azione 1a , e

pari a 150mila $ per l’azione 2a ; ovviamente, anche se si ragiona di termini di perdita si

individua 2a come azione ottimale. L’esito peraltro risulta scontato; infatti se si ragiona

in termini di lotteria, puntando 300mila $ si ha una probabilità del 50% di ricevere la

propria posta triplicata. Ovviamente questa conclusione è valida solo presupponendo

una funzione di utilità lineare; un soggetto fortemente avverso al rischio potrebbe,

infatti, decidere di non procedere alla trivellazione.

Azioni Stato di natura

1 : assenza di petrolio 2 :presenza di petrolio

1a : non perforare 0 0

2a : perforare -300 600

Tab. 7.4 - Tavola di decisione: problema di trivellazione con utilità come conseguenze

Azioni Stato di natura

1 : assenza di petrolio 2 :presenza di petrolio

1a : non perforare 0 600

2a : perforare 300 0

Tab. 7.5 - Tavola di decisione: problema di trivellazione con perdite come conseguenze

Gli aspetti concernenti l’influenza degli atteggiamenti individuali nei confronti delle

scelte decisionali emergono anche nelle situazioni nelle quali non si possiede alcuna

informazione sulle probabilità degli stati di natura. Infatti, se si fa riferimento alla Tab.

7.4 e si ricorre al criterio del max-min (pessimista) l’azione ottima risulta essere 1a ,

mentre il criterio del max-max (ottimista) individua 2a come azione migliore. Nella

Tab. 7.5 si riportano le soluzioni del problema decisionale fornite dal criterio di Hurwitz

in corrispondenza di diversi valori assunti dal coefficiente (di pessimismo) .

L’equivalenza riscontrata tra gli esiti di questo criterio e quelli che derivano dal criterio

dell’utilità (perdita) attesa non è affatto generalizzabile a situazioni con stati di natura o

azioni superiori a due.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

394

Osservando i dati riportati in tabella si rileva il valore dell’indice di pessimismo che

induce il decisore a modificare la propria strategia, la soglia comporta la scelta

dell’azione 1a (non trivellare) rispetto all’azione

2a è 666.0 1 0.666P

.

Cioè, se si fa riferimento alla massimizzazione dell’utilità attesa, si decide di procedere

alla trivellazione (azione 2a ) se 333.02 P .

Valori dell’indice

di pessimismo

Azioni

1a : non perforare 2a : perforare

0 0 600

0,1 0 510

0,2 0 420

0,3 0 330

0,4 0 240

0,5 0 150

0,6 0 60

0,65 0 15

0,66 0 6

0,67 0 -3

0,68 0 -12

0,7 0 -30

0,8 0 -120

0,9 0 -210

1 0 -300

Tab. 7.6 - Problema di trivellazione con utilità come conseguenze: criterio di Hurwitz

Si supponga che il decisore abbia la possibilità di acquisire, a costo zero,

informazioni sulla presenza o meno di petrolio nel terreno utilizzando due sismografi

indipendenti. I possibili esiti dell’utilizzo dei sismografi sono riportati nella Tab. 7.7;

l’informazione fornita dai sismografi non è certa, le probabilità di errore, in

corrispondenza dei due diversi stati di natura sono riportati nella tabella.

Segnalazione

del sismografo

Stato di natura

1 : assenza di petrolio 2 : presenza di petrolio

Assenza di petrolio 0.6 0.3

Presenza di petrolio 0.4 0.7

Tab. 7.7 – Probabilità dell’esito del sismografo condizionato allo stato di natura

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

395

Il decisore potrà decidere se trivellare o meno sulla scorta dell’informazione

campionaria acquisibile il cui esito può essere:

entrambi i sismografi indicano assenza di petrolio,

entrambi i sismografi indicano presenza di petrolio;

un sismografo indica presenza di petrolio mentre l’altro indica assenza.

Se con 0 si indica assenza di petrolio e con 1 presenza di petrolio, lo Spazio

campionario S sarà costituito dai quattro punti campionari:

1,1,0,1,1,0,0,0S

cui sono associate le probabilità:

36.0/0/0/0,0 111 PPP 09.0/0/0/0,0 222 PPP

24.0/1/0/1,0 111 PPP 21.0/1/0/1,0 222 PPP

24.0/0/1/0,1 111 PPP 21.0/0/1/0,1 212 PPP

16.0/1/1/1,1 111 PPP 49.0/1/1/1,1 222 PPP .

I due punti campionari estremi indicano, rispettivamente, assenza di petrolio e

presenza di petrolio segnalata da entrambi i sismografi; mentre, i due punti intermedi

indicano che uno solo, dei due sismografi, segnala la presenza di petrolio. In sostanza si

è in presenza di tre punti campionari per due diversi stati di natura, quindi il numero

delle funzioni di decisione possibili è pari a 23 = 8: Si ricorda che la funzione di

decisione è una funzione che fa corrispondere ad ogni punto campionario una specifica

azione. Nella Tab. 7.8 è riportata l’esplicitazione delle 8 funzioni di decisione.

Punti campionari Funzioni di decisione

1d 2d 3d 4d 5d 6d 7d 8d

0,0 1a

2a 1a

1a 2a

1a 2a

2a

1,0 o 0,1 1a

2a 1a

2a 1a

2a 1a

2a

1,1 1a

2a 2a

1a 1a

2a 2a

1a

Tab. 7.8 – Probabilità dell’esito del sismografo condizionato allo stato di natura

Se si analizza quanto riportato nella Tab. 7.8 si rileva immediatamente la scarsa

razionalità di alcune funzioni di decisione, ad es., le funzioni 1d e 2d individuano,

rispettivamente, l’azione 1a e l’azione

2a qualunque sia l’esito campionario, mentre la

funzione 5d individua l’azione 2a (procedere alla trivellazioni) quando entrambi i

sismografi registrano assenza di petrolio, mentre individuano l’azione 1a (non procedere

alla trivellazione) quando uno o entrambi i sismografi registrano presenza di petrolio.

Prescindendo per il momento dalla ragionevolezza o meno delle funzioni di decisione,

si può procedere al calcolo delle perdite attese (rischi) associate a ogni funzione di

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

396

decisione in corrispondenza dei due diversi stati di natura. A titolo esemplificativo si

considera la funzione 6d , la procedura di calcolo è illustrata nella Tab. 7.9.

Punti

campionari

Azione

scelta

1 2 1 2 Col. 1 x Col. 2

Stato di natura1 Stato di natura

2 1

2

Perdita Prob. del

campione Perdita

Prob. del

campione

Perdita attesa

(Rischio)

0,0 1a 0 0.36 600 0.09 0 54

1,0 , 0,1 o

1,1 2a 300 0.64 0 0.91 192 0

Perdita attesa

(Rischio) 192 54

Tab. 7.9 – Calcolo delle perdite attese per la funzione di decisione 6d

Nella Tab. 7.10 sono riportate le perdite attese (rischi) per tutte le funzioni di

decisione introdotte.

Decisioni Stati di natura

1 : assenza di petrolio 2 :presenza di petrolio

1d 0 600

2d 300 0

3d 144 348

4d 48 306

5d 108 546

6d 192 54

7d 252 294

8d 156 252

Tab. 7.10 – Tavola delle perdite attese (rischi)

Se si osserva la tabella si evince immediatamente che la natura del problema che il

decisore deve risolvere è sostanzialmente analoga a quella già esaminata in precedenza;

si tratta, cioè, di scegliere tra le 8 decisioni possibili quella che minimizza la perdita

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

397

attesa non avendo informazioni sulla probabilità degli stati di natura (situazione di

estrema incertezza) facendo però riferimento a perdite e decisioni anziché a utilità e

azioni.

Il primo passo da compiere è, quindi, quello della verifica della presenza di

un’eventuale decisione dominante, quella cioè caratterizzata da rischio minimo

qualunque sia lo stato di natura. Osservando i valori riportati nella Tab. 7.9 si verifica

l’assenza di una tale eventualità. Il secondo passo consiste nell’individuazione (e

successiva eliminazione) di eventuali decisioni dominate da altre, ed è questo il caso

delle decisione 3d e 5d , che risultano dominate dalla decisione 4d , e della decisione

7d , che risulta dominata dalla decisione 8d .

Tornando al problema decisionale nei suoi termini più generali si può affermare che

la decisone ottima per l’operatore è quella che minimizza la perdita (massimizza

l’utilità) per qualunque stato di natura e risultanza campionaria, ma una tale strategia

difficilmente si riesce a determinare nella pratica; qualora si riuscisse ad individuarla si

parlerebbe di strategia "uniformemente migliore".

Per superare le difficoltà relative alla determinazione della strategia "ottima" è stato

proposto, tra l’altro di restringere la classe delle decisioni ammissibili; si tratta di un

metodo che prevede l'esclusione di strategie che non soddisfano a determinati requisiti

ritenuti "augurabili" dall'operatore. Un tale modo di procedere consente da un lato

l'eliminazione dall'analisi delle strategie meno efficienti, dall'altro incrementa le

possibilità di esistenza di strategie uniformemente migliori, facilitandone

l'individuazione, nella classe ristretta.

Una delle condizioni che può essere considerata per restringere la classe delle

decisioni possibili è l'invarianza. A giustificazione di tale restrizione si può dire che se

un problema di decisione risulta simmetrico od invariante rispetto a certe operazioni,

sembra ragionevole restringere la classe delle decisioni possibili a quelle che siano

simmetriche od invarianti nei confronti delle stesse operazioni.

Restringere la classe delle decisioni possibili si sostanzia nella introduzione di

vincoli che devono essere soddisfatti dalle decisioni stesse. Si tratta, sostanzialmente, di

una procedura del tutto analoga a quella adottata nel contesto della regressione lineare:

infatti, in tale contesto, imponendo il soddisfacimento dei vincoli di linearità e

correttezza è stato possibile individuare lo stimatore ottimale, cioè, lo stimatore BLU .

Assegnando all’errore quadratico medio la natura di funzione di perdita, è stato

possibile individuare la strategia dominante.

Il tema della restrizioni della classe delle decisioni non verrà qui affrontato

procedendo, invece, alla generalizzazione di quanto discusso nell’esempio sopra

illustrato. Si farà riferimento ad un generico numero n di stati di natura, ad un generico

numero r di funzioni di decisione e ad un generico vettore casuale 1 2, ,...., nX X X'

X

associato alla rilevazione campionaria frutto della conduzione di uno specifico

esperimento.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

398

In questo contesto la generica funzione di decisione assume la forma

1 2, ,...., na d x x x d x , dove 1 2, ,...., nx x x'

x rappresenta l’esito

dell’esperimento condotto (risultato campionario), cioè, la determinazione del vettore

casuale 1 2, ,...., nX X X'

X . Pertanto la perdita attesa (rischio) resta definita dalla

relazione:

, , ,R d R d E l d xx x .

Relazione che per un vettore campionario relativo ad una variabile discreta diventa

1 2

1 2 1 2

, , , /

, ,...., , , , ....... ,n

n nx x x

R d E l d l d P

l d x x x f x f x f x

x xx x x

dove ,ixf , per i=1,2,….,n, rappresenta la funzione di massa di probabilità della

variabile casuale iX associata all’i-esima unità campionaria.

Se le variabili casuali iX originano da una variabile casuale continua, l’espressione

algebrica del rischio (perdita attesa) è data da:

1 2

1 2 1 2 1 2

, , , /

...... , ,...., , , , ....... , .....n

n n nx x x

R d E l d l d P

l d x x x f x f x f x dx dx dx

xx

x x x

dove ,ixf , per i=1,2,….,n, rappresenta la funzione di densità di probabilità della

variabile casuale iX associata all’i-esima unità campionaria.

La tavola di decisione che riassume i termini del problema decisionale (cfr. Tab.

7.11) è del tutto analoga alla Tab. 7.3, anche se ora è espressa in termini di funzioni di

decisioni e di rischi (perdite attese) anziché di perdite; pertanto, per risolvere il

problema decisionale, basterà fare ricorso ai criteri illustrati nel paragrafo 7.4.

Decisioni Stato di natura

1 2 …… j ....... n

1d 11,dR 21,dR …… jdR ,1 ....... ndR ,1

2d 12 ,dR 22 ,dR …… jdR ,2 ....... ndR ,2

.... ………… ………… …… ………… ....... …………

id 1,idR 2,idR …… jidR , …... nidR ,

.... ………… ………… …… ………… ....... …………

rd 1,rR d 2,rR d …… ,r jR d ....... ,r nR d

Tab. 7.11 - Tavola di decisione con conseguenze espresse dai rischi (perdite attese)

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

399

7.6 - Decisioni basate su informazioni a priori e informazioni

campionarie

Nei paragrafi precedenti si è visto come l'operatore possa utilizzare l'insieme delle

probabilità a priori, che riflettono le sue "credenze" sulle possibilità di realizzazione dei

vari stati di natura, per determinare l'utilità attesa o, alternativamente, la perdita attesa

relativamente a ciascuna azione; è stato inoltre esaminato il caso in cui l'operatore,

prescindendo da ogni informazione a priori, utilizza le informazioni campionarie per il

computo del rischio. E' stato sottolineato anche il fatto che, generalmente, non è

possibile individuare una funzione di decisione capace di minimizzare il rischio in

corrispondenza di ciascuno stato di natura; cioè, nella generalità dei casi non esiste una

decisione dominante. A tale proposito è stata esaminata la possibilità di ricorrere con

opportuni adattamenti, ai criteri esposti nel paragrafo 7.4. Una seconda possibilità è,

ovviamente, quella d'introdurre una distribuzione di probabilità sugli stati di natura,

calcolando il rischio atteso, per poi procedere alla individuazione della decisione che

minimizza tale rischio atteso (decisione ottimale).

Evidentemente l'introduzione di una distribuzione di probabilità sugli stati di

natura attribuisce al problema decisionale un carattere completamente diverso da

quello discusso nel precedente paragrafo, assumendo una natura del tutto

analoga ad un problema decisionale nel quale l'operatore, disponendo di certe

informazioni a priori e non ritenendole sufficienti, decide di procedere

all’acquisizioni di dati aggiuntivi per incrementare il suo bagaglio di

conoscenze sul fenomeno in oggetto d’analisi.

In questo paragrafo si vedrà come l'applicazione del criterio (paradigma)

bayesiano alla tabella dei rischi conduca all’individuazione della decisione

ottimale; cioè, quella che minimizza il rischio atteso (analisi in forma

normale). Si vedrà, inoltre, come l'operatore possa integrare, con le

informazioni aggiuntive di tipo campionario, le informazioni a priori mediante

una loro revisione attraverso l'applicazione delle formule di Baye s (analisi in

forma estensiva) pervenendo agli stessi risultati. In proposito si deve

sottolineare che spesso la revisione delle probabilità a priori attraverso le

formule di Bayes può risultare un'operazione estremamente complessa; e ciò è

vero soprattutto se non si riesce ad individuare uno "statistic"10

la cui

distribuzione sia determinata univocamente dai dati campionari. Per contro, si

deve tener presente del fatto che quando si è in presenza di un numero elevato

di possibili stati di natura e di possibili risultanze campionarie risulta molto

complicata, a volte anche impossibile, la definizione di tutte le possibili

funzioni di decisione.

10 Si ricorda che uno statistic, statistica in italiano, è una funzione nota degli elementi campionari e che le probabilità

a priori revisionate vengono dette probabilità a posteriori.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

400

Nel paragrafo precedente è stato illustrato un esempio in merito alla decisone

di procedere o meno alla trivellazione di un pozzo per la ricerca del petrolio

esaminando la possibilità di acquisizione di informazioni campionarie

attraverso l’impiego di sismografi. Se si prende nuovamente in considerazione

l’esempio partendo dalla tabella dei rischi e si osservano i dati riportati nella

Tab. 7.11 si rileva immediatamente che se lo stato di natura più probabile è 1

le decisioni migliori risultano essere 1d e

4d , mentre se è più probabile lo stato di

natura 2 le decisioni migliori sono la

2d e la 6d . Si supponga ora che le probabilità

associate ai due stati di natura siano 2.01 P e 8.02 P , sulla scorta di tali

probabilità si possono calcolare i rischi attesi riportati nella Tab. 7.12.

Funzioni di

decisione

Stati di natura Dominanza

1 : assenza di petrolio 2 :presenza di petrolio

1d 0 600 -

2d 300 0 -

3d 144 348 Dominata

4d 48 306 -

5d 108 546 Dominata

6d 192 54

7d 252 294 Dominata

8d 156 252 -

Tab. 7.11 – Tavola delle perdite attese (rischi)

Per chiarezza espositiva risulta utile riproporre la tabella delle funzioni di

decisione

Punti campionari Funzioni di decisione

1d 2d 3d 4d 5d 6d 7d 8d

0,0 1a

2a 1a

1a 2a

1a 2a

2a

1,0 o 0,1 1a

2a 1a

2a 1a

2a 1a

2a

1,1 1a

2a 2a

1a 1a

2a 2a

1a

Poiché la decisione che minimizza il rischio atteso è 2d , cioè quella di

procedere alla trivellazione qualunque sia l’esito della rilevazione campionaria, la

conclusione cui si perviene è che l’informazione campionaria acquisita, in questo caso

specifico, è del tutto irrilevante.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

401

A prescindere dal risultato cui si è pervenuti ipotizzando l’acquisizione di

informazioni campionarie con dimensione del campione pari a 2 (n=2), il

problema decisionale poteva essere affrontato e risolto in modo diverso secondo

i passi di seguito indicati:

1. fissazione delle probabilità a priori sugli stati di natura;

2. esecuzione della rilevazione campionaria e registrazione dei

risultati;

3. revisione, utilizzando la formula di bayes, delle probabilità a priori

sugli stati di natura sulla base delle risultanze campionarie;

4. applicazione del criterio bayesiano per l’individuazione dell’azione

cui corrisponde la perdita attesa minima.

Se si fa ricorso a questa procedura, la tabella dei rischi non è più necessaria

in quanto il criterio di decisione bayesiano può essere applicato direttamente

alla tabella delle perdite utilizzando le probabilità a priori riviste; utilizzando,

cioè, le probabilità a posteriori. Comunque, le due diverse procedure

pervengono alla stessa conclusione.

Funzioni di

decisione

Stati di natura Rischi

attesi 1 : assenza di petrolio

2 : presenza di petrolio

2.01 P 8.02 P

1d 0 600 480

2d 300 0 60

4d 48 306 254

6d 192 54 82

8d 156 252 233

Tab. 7.12 – Tavola dei rischi attesi per le decisioni non dominate

Se si assume che le probabilità a priori siano quelle sopra introdotte,

2.01 P e 8.02 P , osservando i dati riportati nella Tab. 7.12 si individua 2d

quale decisione ottimale che, come osservato, è una decisione indipendente dal risultato

campionario. Si ipotizzi ora una diversa distribuzione delle probabilità a priori, ad

esempio, 55.01 P e 45.02 P , e si calcolano i rischi attesi si individua 6d quale

decisione ottimale (quella cui corrisponde il rischio atteso minimo). Si ricorda che la

decisione 6d prevede di non procedere alla trivellazione se entrambi i sismografi

segnalano assenza di petrolio, di procedere alla trivellazione quando uno o entrambi i

sismografi segnalano presenza di petrolio.

Pertanto, se anziché procedere nel modo sopra indicato, cioè all’introduzione delle

funzioni di decisione e al computo dei rischi attesi, si procedesse alla scelta dell’azione

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

402

ottimale basando il calcolo sulla distribuzione delle probabilità a posteriori si perviene

alla stessa soluzione finale; infatti, ricordando la formula di Bayes

/ /

/

f ff

f f

xx

x

e i valori definiti nel capitolo precedente

36.0/0/0/0,0 111 PPP

09.0/0/0/0,0 222 PPP

24.0/1/0/1,0 111 PPP

21.0/1/0/1,0 222 PPP

24.0/0/1/0,1 111 PPP

21.0/0/1/0,1 212 PPP

16.0/1/1/1,1 111 PPP

49.0/1/1/1,1 222 PPP .

cioè le probabilità che derivano dalla distribuzione binomiale

xnx qpx

n

0 2

1

2!0 / 0.4 0.6 0.36

0! 2!f

09.03.07.0

!2!0

!2/0 20

2

f

1 1

1

2!1 / 0.4 0.6 0.48

1! 1!f

42.03.07.0

!1!1

!2/1 11

2

f

2 0

1

2!2 / 0.4 0.6 0.16

2! 0!f

49.03.07.0

!0!2

!2/2 02

2

f

si deducono facilmente le probabilità a posteriori .

Nel caso che si sta trattando 2n mentre 4.0p se 1 , 7.0p se

2 ,quindi:

83.0

45.009.055.036.0

55.036.0

/0/0

/00/

2211

111

ffff

fff

17.00/10/ 12 ff

58.0

45.042.055.048.0

55.048.0

/1/1

/11/

2211

111

ffff

fff

42.01/11/ 12 ff

03.0

45.049.055.016.0

55.016.0

/2/2

/22/

2211

111

ffff

fff

97.02/12/ 12 ff .

Le tavole di decisione nei tre casi considerati sono di seguito riportate.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

403

Azioni

Stato di natura

Perdita attesa 1 : ass. di petrolio

83.00/1 P

2 : pres. di petrolio

17.00/2 P

1a : non perforare 0 600 102

2a : perforare 300 0 249

Tab. 7.13 - Tavola di decisione con probabilità a posteriori nel caso in cui i due sismografi

segnalano assenza di petrolio

Azioni

Stato di natura

Perdita attesa 1 : ass. di petrolio

58.01/1 P

2 : pres. di petrolio

42.01/2 P

1a : non perforare 0 600 252

2a : perforare 300 0 174

Tab. 7.14 - Tavola di decisione con probabilità a posteriori nel caso in cui un solo sismografo

segnala assenza di petrolio

Azioni

Stato di natura

Perdita attesa 1 : ass. di petrolio

03.02/1 P

2 : pres. di petrolio

97.02/2 P

1a : non perforare 0 600 582

2a : perforare 300 0 9

Tab. 7.15 - Tavola di decisione con probabilità a posteriori nel caso in cui i due sismografi

segnalano presenza di petrolio

Osservando quanto riportato nelle Tabb. 7.13, 7.14 e 7.15 si perviene alla

conclusione di non procedere alla trivellazione quando entrambi i sismografi

segnalano assenza di petrolio (cfr. Tab. 7.13), di procedere invece alla

trivellazione quando uno (cfr. Tab. 7.14) o entrambi (cfr. Tab. 7.15) i

sismografi segnalano presenza di petrolio, scelte queste che corrispondono

esattamente alla decisione 6d , cioè la decisione che minimizza il rischio atteso.

***

Si dimostra l’equivalenza tra la minimizzazione del rischio atteso (forma normale) e il

criterio bayesiano basato sulle probabilità a posteriori (forma estensiva).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

404

Per una qualunque funzione di decisione id è possibile procedere al computo

del rischio (perdita attesa) ,idR in corrispondenza di ogni stato di natura

Θ . Se si conosce la distribuzione di probabilità sugli stati di natura sarà,

inoltre, possibile procedere al calcolo del rischio atteso

fdRdRE ii ,, nel caso in cui lo stato di natura è discreto

dfdRdRE ii ,, nel caso in cui lo stato di natura è

continuo.

La scelta ottimale è la decisione

* ,i

id

d argmin R d f

nel caso in cui lo stato di natura è

discreto

* ,i

id

d argmin R d f d

nel caso in cui lo stato di natura è

continuo.

Si ricorda che:

1. la funzione di decisione è definita sullo spazio dei campioni, è cioè

una funzione che fa corrispondere a ciascun punto campionario una

specifica azione, 1 2, ,...., na d x x x d x ;

2. il rischio corrisponde alla perdita attesa,

, , ,R d R d E l d xx x ,

si avrà, pertanto,

, ,

,

i i

i

i id d

id

argmin E R d argmin E R d

argmin E E l d

x

x

x

.

Considerando, senza perdere in generalità, il caso in cui sia lo spazio

parametrico che lo spazio dei campioni sono discreti , si ha:

, ,

, / .

i i

i

i id d

id

argmin E R d argmin E E l d

argmin l d f f

x

x

x

x x

Se si cambia l’ordine di sommatoria, si tiene conto della relazione a d x e

dell’uguaglianza / /f f f f x x x si ha:

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

405

, , /

, /

, /

, / .

i i

i

i

i

i id d

id

id

d

argmin E R d argmin l d f f

argmin l d f f

argmin l d f f

argmin l a f f

x

x

x

x

x x

x x x

x x x

x x

dove, nell’ultimo passaggio, si è tenuto conto della relazione

1 2, ,...., na d x x x d x .

pertanto

*, , /

i i

id d

a argmin E R d argmin l a f x .

dove con *

a si è voluto indicare l’azione ottimale quando nel problema decisionale si

utilizzano sia le informazioni a priori che le informazioni campionarie, si tratta cioè

della perdita attesa calcolata utilizzando le probabilità a posteriori. Al riguardo si

ricorda che la corrispondente azione ottimale individuata utilizzando le sole

informazioni a priori è data da

* ,a

a argmin l a f

.

***

Questo risultato dimostra la completa equivalenza delle due diverse procedure,

forma normale e forma estensiva, che consentono la minimizzazione della

perdita attesa. I diversi passaggi hanno riguardato il caso in cui sia lo spazio

parametrico che lo spazio dei campioni siano discreti; procedimento del tutto

analogo vale anche nel caso in cui entrambi gli spazi siano continui o uno sia

discreto e l’altro continuo.

Nel caso in cui entrambi gli spazi sono continui si ha:

, , /

, /

, /

, /

i i

i

i

i

i id d

id

id

id

argmin E R d argmin l d f d f d

argmin l d f d f d

argmin l d f d f d

argmin l d f d f d

x

x

x

x

x x x

x x x x

x x x x

x x x x

cioè:

*, / , / i

a a

a argmin l d f d argmin l a f d

x x x

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

406

il che dimostra la completa equivalenza tra i due criteri. Cosa questa

d'altronde ovvia in quanto le due procedure sono basate sugli stessi dati e

calcoli, l'unica differenza risiede nell'ordine con cui le operazioni analitiche

vengono eseguite; infatti, entrambi si avvalgono delle probabilità a priori e delle

informazioni campionarie nel computo dei valori attesi (rischi o utilità).

L'operatore sceglierà, vista la completa equivalenza dei due criteri, quello

che risulta più facilmente trattabile dal punto di vista algebrico ed operativo.

Se si riflette sulle operazioni che devono essere effettuate per pervenire alla

individuazione della decisione ottimale ci si rende immediatamente conto, però,

dell’onerosità della procedura (forma normale) basata sull’introduzione delle

funzioni di decisione; si è visto, infatti, nell’esempio che per un semplice

problema decisionale in cui sono soltanto 2 le possibili azioni e 3 i possibili

risultati campionari, il numero delle funzioni di decisione possibili risulta pari a 328 ; anche se, al riguardo, si deve sottolineare che le funzioni di decisione

“ragionevoli”, cioè quelle da prendere in considerazione, sono soltanto 2: la 4d

e la 6d . Concettualmente più semplice, è la procedura ( forma estensiva) basata

sulla minimizzazione dell’utilità attesa considerando le probabilità a posteriori;

ma, come già sottolineato, anche in questo caso si possono incontrare notevoli

difficoltà.

Il paragrafo successivo sarà dedicato alla trattazione dei casi di

aggiornamento delle probabilità a priori sulla scorta dell’evidenza campionar ia,

cioè di derivazione delle probabilità a posteriori, che si incontrano più

frequentemente nella pratica. Mentre, a ulteriore chiarimento delle

considerazioni sopra svolte, si dedica la parte conclusiva di questo paragrafo

alla illustrazione di un altro caso decisionale.

Esempio 7.1

Si supponga che la proporzione di pezzi difettosi presenti in un lotto possa

assumere quattro diversi valori 05.0 ,04.0 ,03.0 ,02.0 4321 e che le

probabilità (a priori) dei diversi stati di natura siano

30.0 ,40.0 ,20.0 ,10.0 4321 PPPP , si supponga di aver estratto

un campione casuale bernoulliano (estrazione con ripetizione) di 100 pezzi dal

lotto e di aver riscontrato la presenza di 3 pezzi difettosi. Come si deve

procedere nella revisione dell’informazioni a priori tenendo conto delle

risultanze campionarie? Sostanzialmente quello che si vuol fare e passare da

jj fP a / /j jP f x x , per j = 1, 2, 3 e 4.

Se si indica con X il numero di pezzi difettosi riscontrabili nel lotto dei 100

pezzi esaminati, tale entità variabile potrà assumere i valori 0, 1, 2,…., x,….,

100 e la probabilità (verosimiglianza) di un qualunque risultato campionario

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

407

per uno specifico stato di natura è espressa dalla distribuzione binomiale

100100

/ 1

xxP X xx

. Pertanto, la probabilità totale è data da

1 2

3 4

1 1 2 2

3 3 4 4

100 100

/ /

/ /

100 100 0,02 1 0,02 0,10 0,03 1 0,03 0,

x xx x

X x X xP X x P

X x X x

P X x P P X x P

P X x P P X x P

x x

100 100

20

100 100 0,04 1 0,04 0,40 0,05 1 0,05 0,30

x xx x

x x

da cui

3 97

3 0,02 3 0,033

3 0,04 3 0,05

3 / 0,02 0,02 3 / 0,03 0.03

3 / 0,04 0,04 3 / 0,05 0,05

100 1 0,02 0,97 0,10

3

X XP X P

X X

P X P P X P

P X P P X P

3 97

3 97 3 97

00 0,03 0,97 0,20

3

100 100 0,04 0,96 0,40 0,05 0,95 0,30

3 3

0,18 0,10 0,23 0, 20 0,20 0, 40 0,14 0,30 0,186

Il valore 0,186 è, quindi, la probabilità che l’entità variabile X assuma la

determinazione 3, cioè la probabilità di ottenere il risultato campionario ipotizzato

3 3P X f .

Disponendo delle risultanze campionarie e delle probabilità a priori si può procedere

al computo delle probabilità a posteriori. Le elaborazioni sono riassunte nella Tab.

7.16.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

408

Stato

di

natura

Probabilità

a

priori

Probabilità

condizionata

(verosimiglianza)

Probabilità

congiunta Probabilità a posteriori

3/f 3/ f

4

1

3 / / 3

3 / i i

i

ff

f

0,02 0,10 0,18 0,018 0,097

0,03 0,20 0,23 0,046 0,248

0,04 0,40 0,20 0,080 0,430

0,05 0,30 0,14 0,042 0,225

1,00 0,186 1,000

Tab. 7.16 – Revisione delle probabilità a priori e computo delle probabilità a posteriori in

corrispondenza di un risultato campionario pari a 3 relativo ad un campione di dimensione

100

Come si può facilmente desumere analizzando i dati riportati nella Tab. 7.16, i

risultati campionari hanno prodotto delle variazioni nella distribuzione delle probabilità

sugli stati di natura; a questo punto il decisore può utilizzare tali valori per procedere al

calcolo delle perdite attese oppure procedere ad una ulteriore rilevazione campionaria, i

cui risultati consentono una seconda revisione delle probabilità, in questo processo di

revisione le probabilità a posteriori riportate nella tabella assumono la natura di

probabilità a priori nel secondo passo di aggiornamento della conoscenza. Si può

dimostrare senza eccessiva difficoltà che la procedura di aggiornamento delle

probabilità in due passi successivi produce gli stessi risultati della procedura che

congloba i risultati delle due rilevazioni in un solo campione che dovranno essere

utilizzati per revisionare le probabilità a priori iniziali.

I calcoli necessari per aggiornare le probabilità a priori sulla scorta dell’evidenza

campionaria nell’esempio sopra illustrato sono relativamente semplici, in altri casi la

soluzione non è cosi immediata. Fortunatamente, esistono situazioni, e sono abbastanza

frequenti, in cui il problema dell’aggiornamento delle probabilità a priori può essere

risolto in modo agevole, si tratta dei casi in cui è giustificato il ricorso alle distribuzioni

a priori coniugate già considerate nei capitoli 2 e 6 di queste note.

7.7 - Il valore dell’informazione

Si è detto nelle pagine precedenti come, in alcuni problemi di decisione,

l'operatore possa ritenere di non avere informazioni sufficienti sia in relazione

agli stati di natura (ed è il caso speci ficamente trattato) che alle

conseguenze. Si è pure visto come in tali condizioni egli possa procrastinare

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

409

il momento della scelta decidendo per l'acquisizione di ulteriori

informazioni, magari di tipo campionario.

Evidentemente la decisione di procedere all'acquisizione di ulteriori

elementi d'informazione deve essere presa a priori. Un tale fatto introduce nel

problema decisionale un elemento aggiuntivo d'incertezza relativo alle

risultanze campionarie e quindi alla bontà delle informazioni. L'operatore sa che

attraverso un'indagine potrà acquisire ulteriori informazioni che ridurranno

quasi certamente lo stato d'incertezza in cui è costretto ad operare, ma non

conosce esattamente la misura di tale riduzione. D'altra parte l'operatore sa

anche che l'effettuazione di un'indagine comporta delle spese, e che una

dilazione della decisione potrebbe risultare eccessiva ed implicare quindi

ulteriori costi. Nel caso della scelta degli investimenti pubblici, ad esempio,

può risultare impossibile o estremamente costosa una dilazione nell'inizio dei

lavori almeno per due ragioni, una legata a motivi di natura strettamente

politica, l'altra di carattere prevalentemente tecnico. Infatti, basta pensare,

all'urgenza di certe opere a carattere sociale, relativamente al primo caso, e al

fatto che dal momento in cui le informazioni vengono acquisite al momento in

cui una decisione d'investimento diviene operativa la situazione reale di

riferimento può essere notevolmente mutata, relativamente al secondo caso.

Riassumendo, in merito al problema dell 'acquisizione di ulteriori

informazioni si devono distinguere almeno tre fatti:

1. che l'indagine comporta un costo e. che non è noto con certezza

fino a che punto tale costo sarà compensato dalle informazioni

aggiuntive;

2. che per l'effettuazione dell'indagine, in genere, si può disporre di

un arco di tempo limitato;

3. che la decisione d'acquisire ulteriori informazioni deve essere

presa a priori.

Da quanto scritto ai punti 1 e 2 si capisce immediatamente come

un'indagine del genere debba avere quasi necessariamente carattere

campionario.

Va sottolineato il fatto che le informazioni aggiuntive possono essere

utilizzate, oltre che per modificare la distribuzione delle probabilità sugli stati di

natura, anche per modificare l'insieme delle conseguenze o la forma della

funzione di utilità.

Nelle pagine successive verrà descritto sommariamente il problema

dell'acquisizione di ulteriori informazioni attraverso indagini campionarie,

discutendo alcune procedure attraverso le quali può essere stabilito un piano

di campionamento ottimo in funzione di un problema decisionale, nei

termini esposti nel paragrafo precedente.

Poiché qui ci si limiterà, come già detto, a considerare il caso in cui i dati

campionari vengono utilizzati dall'operatore per modificare la distribuzione

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

410

della probabilità sugli stati di natura, quando si parlerà di piano di

campionamento ottimo, l'ottimalità andrà riferita a tale aspetto del problema

decisionale.

La bontà di un campionamento viene misurata attraverso il confronto tra

l'utilità/perdita attesa calcolata facendo uso dei dati aggiuntivi, e

l'utilità/perdita attesa ottenibile senza campionamento. In altri termini, se

l'utilità attesa relativa all'azione migliore, calcolata utilizzando le informazioni

campionarie e detraendo il costo sopportato è superiore all'utilità attesa

relativa alla migliore azione senza l'uso dei dati campionari, allora ci si

troverà in condizioni tali per le quali il costo del campionamento è più che

compensato dalla riduzione dello stato d'incertezza in cui si è costretti ad

operare; si procederà quindi all'effettuazione dell'indagine.

Un secondo problema relativo al campionamento (il primo è quello di

deciderne l'effettuazione) riguarda la dimensione campionaria.

Evidentemente, più si aumenta la dimensione del campione, maggiori

saranno le informazioni disponibili; d'altra parte ad una più elevata riduzione

dello stato d'incertezza corrisponderà un costo più elevato. Il piano di

campionamento ottimo sarà quello che massimizza l'utilità attesa alla luce di

questi due effetti contrastanti. In termini marginalistici si può affermare che

la dimensione del campione va aumentata fino a quando il costo di un’unità

d'informazione addizionale bilancia l'incremento/decremento nell'utilità/perdita

attesa (costo marginale pari all'utilità marginale).

Prima di procedere alla trattazione puntuale del problema del

campionamento conviene introdurre ulteriori concetti che si riveleranno di

grande utilità nel corso dell’esposizione. Si tratta essenzialmente di due

concetti:

il valore atteso dell’informazione perfetta (expexted value of

perfect information EVPI);

il valore atteso dell’informazione campionaria (expexted value of

sample information EVSI).

Il valore atteso dell’informazione perfetta viene è dato dalla differenza tra l’utilità o

la perdita attesa che corrisponde all’azione ottima, cioè quella cui corrisponde la

massima utilità attesa o la minima perdita attesa e l’utilità o perdita attesa calcolata

ipotizzando la conoscenza perfetta dello stato di natura, Se il decisore sa che lo stato di

natura è 1 lo stesso non avrà alcuna difficoltà ad individuare l’utilità/perdita

corrispondente l’azione migliore, allo stesso modo può procedere in corrispondenza di

tutti gli altri stati di natura 2 3, , ... , , ... , j n . Se si indica con

* min ,j i ji

l l a la perdita minima corrispondente a ciascun stato di natura, si

potrà procedere al computo della perdita attesa in situazione di incertezza ma sotto

l’ipotesi di informazione perfetta.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

411

* *

pa

a argmin l f

Ricordando che l’azione migliore in situazione di incertezza è data dalla relazione

,a

a argmin l a f

il valore atteso dell’informazione perfetta è espresso da

EVPI = * * * ,pa a

a a argmin l f - argmin l a f

Nel paragrafo precedente oltre ad aver dimostrato l’equivalenza tra forma normale e

forma estensiva, quando nei problemi decisionali si può disporre sia di informazioni a

priori che di informazioni campionarie, è stata individuata come azione ottimale quella

che risulta dalla relazione

, / a

a argmin l a f

x ,

a questo punto è possibile definire il valore atteso dell’informazione campionaria

(EVSI) che si ottiene, semplicemente, calcolando la differenza tra la perdita attesa

basata sulle probabilità a priori e la perdita attesa basata sulle probabilità a posteriori,

cioè

, , /a a

EVSI a a argmin l a f argmin l a f

x

Come già sottolineato qualunque rilevazione campionaria comporta un costo che può

essere definito dalla relazione

f vC n C n C

dove il costo totale del campionamento è costituito da una quota fissa più una quota

variabile il cui ammontare dipende dalla dimensione campionaria.

Pertanto il guadagno atteso netto associato alla rilevazione campionaria (expected net

gain from sampling ENGS) è dato da

vfvf n CCEVSIn CCEVSI nCEVSIENGS

dove l’ultimo membro dell’ultima espressione è la traduzione della funzione di costo

nell’ipotesi di linearità del costo stesso.

Ovviamente, la dimensione campionaria ottima è quella cui corrisponde il massimo

valore 0 ENGS ; inoltre, max EVPIC .

Se si riportano in un grafico alcune delle quantità sopra definite si perviene ad una

figura del tipo di quella di seguito riportata (cfr. Fig. 7.3), dove, per l’ipotesi di linearità,

il costo marginale del campionamento è costante, mentre la perdita attesa marginale

dopo il campionamento è supposta decrescente.

Un ulteriore grafico (cfr. Fig. 7.4) consente la visione e l’incidenza di altri elementi

rilevanti nello svolgimento dei processi decisionali.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

412

Fig. 7.3 - Effetto del costo di campionamento e perdita attesa in corrispondenza della

dimensione campionaria ottima.

Costo del campionamento = C(n)

Dimensione campionaria ottima

EVPI

EVSI

ENGS

Dimensione campionaria

Fig. 7.4 - Valore atteso dell’informazione perfetta, valore atteso dell’informazione

campionaria e guadagno netto atteso

Perdita attesa senza campionamento , min

fala

a

Perdita totale attesa minima

Perdita totale attesa =

a + C(n)

Costo del campionamento = C(n)

Dimensione campionaria ottima

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

413

Ad illustrazione di quanto detto si riprenda in considerazione il problema decisionale

di procedere o meno alla perforazione. La tabella di perdita relativa a questo problema

già considerata in precedenza è quella sotto riportata dove è stata aggiunta la probabilità

a priori sugli stati di natura e la perdita attesa in corrispondenza delle due azioni.

Azioni

Stato di natura Perdita

attesa 1 : assenza di petrolio

1 0,55P

2 : presenza di petrolio

2 0,45P

1a : non perforare 0 600 270

2a : perforare 300 0 165

Tab. 7.18 - Tavola di decisione: problema di trivellazione con perdite come conseguenze

Sulla scorta delle sole informazioni a priori il decisore sceglierà l’azione 2a cui

corrisponde la perdita minore. Comunque il decisore, non completamente convinto dei

valori assegnati alle probabilità a priori potrebbe decidere di acquisire ulteriori

informazioni. In precedenza è stata esaminata la possibilità di acquisire informazioni

sullo stato di natura impiegando dei sismografi a costo zero. Ma come più volte

sottolineato qualunque rilevazione campionaria comporta un costo: nel caso specifico si

ipotizza una funzione di costo lineare senza costi fissi 10 C n n , cioè l’uso di un

sismografo costa 10 $, 2 sismografi (indipendenti) costano 20, ecc. ; ovviamente in

questo caso la dimensione campionaria non potrà superare le 16 unità, con 17 unità si

andrebbe incontro ad un costo superiore al vantaggio conseguibile.

Nella tavola che segue sono riportate le probabilità che ha un sismografo di segnalare

assenza o presenza di petrolio.

Segnalazione

del sismografo

Stato di natura

1 : assenza di petrolio 2 : presenza di petrolio

Assenza di petrolio 0.6 0.3

Presenza di petrolio 0.4 0.7

Tab. 7.19 – Probabilità dell’esito del sismografo condizionato allo stato di natura

Tenendo conto di tali probabilità il decisore che intende acquisire ulteriori

informazioni può perseguire due diverse vie, la prima, che è sicuramente la più

efficiente ma non di facile attuazione, consiste nel procedere all’acquisizione di una

informazione campionaria per decidere sulla scorta dell’evidenza acquisita se

proseguire nel campionamento o operare la scelta definitiva. La seconda via è quella

della effettuazione di un’analisi completa, detta analisi a preposteriori, che consente la

individuazione della dimensione campionaria ottimale.

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

414

I due possibili esiti dell’utilizzo di un sismografo sono x = 0 (assenza di petrolio)

oppure x = 1 (presenza di petrolio) con le relative probabilità:

465,045,03,055,06,0 /0 /00 2211 PXPPXPXP

535,045,07,055,04,0 /1 /11 2211 PXPPXPXP

Ricordando la formula di Bayes

/ /

/

f ff

f f

xx

x

71,0

45,03,055,06,0

55,06,0

/0 /0

/00/

2211

111

PXPPXP

PXPXP

41,0

45,07,055,04,0

55,04,0

/1 /1

/11/

2211

111

PXPPXP

PXPXP

29,071,010/10/ 12 XPXP

59,041,011/11/ 12 XPXP

Si può ora riproporre la tabella di decisione inserendo le probabilità a posteriori

Azioni

Stato di natura

Perdita

attesa

1 : assenza di

petrolio

1

1

/ 0 0,71

/1 0,41

P

P

0 0,465P X

2 :presenza di

petrolio

2

2

/ 0 0,29

/1 0,59

P

P

1 0,535P X

1a : non perforare 0 600 X =0 174

1a : non perforare 0 600 X=1 354

2a : perforare 300 0 X =0 213

2a : perforare 300 0 X=1 123

Tab. 7.20 – Perdita attesa condizionata per un campione di dimensione 1

Come si desume dalla Tab. 7.20 se l’esito campionario è X = 0, l’azione

migliore è 1a non perforare (perdita attesa 174), se invece l’esito campionario è X =

1, l’azione migliore è 2a perforare (perdita attesa 123). L’analisi a preposteriori

fornisce gli elementi per decidere se procedere all’acquisizione dell’informazione

(utilizzo di un sismografo del costo di 10$).

La perdita attesa non condizionata è data da

min , / 174 0,465 123 0,535 146,72 a

a l a f

x .

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

415

Confrontando questa perdita con quella calcolata in corrispondenza della

migliore azione in assenza di informazioni campionarie si ha

18,1872,146165 aaEVSI

Se il decisore ritiene di dover proseguire nell’analisi a preposteriori e quindi

procedere all’utilizzo di due sismografi si otterrebbero i seguenti risultati. Si

precisa che si limiterà a riportare soltanto i valori relativi alle azioni ottimali

in corrispondenza dei diversi risultati campionari.

Le probabilità a posteriori sono date da

71,02/ ;42,01/ ;17,00/

29,02/ ;58,01/ ;83,00/

122

111

XPXPXP

XPXPXP

e le perdite attese condizionate corrispondenti alle azioni ottimali sono

1020

a

1741

a

872

a

Tenendo presente che 2385,00 XP , 4530,01 XP ,

308,02 XP , la perdita attesa non condizionata è pari a $ 129,99.

01,3599,129165 aaEVSI

ENGS = EVSI-C(2) = 35,01 – 20 =15,01.

La conclusione è che risulta conveniente procedere nell’utilizzo di due

sismografi. Ad analoga conclusione si perviene se si prevede l’utilizzo di tre

sismografi; infatti la perdita attesa ottimale non condizionata dell’esito

campionario è pari a $ 116,40, quindi

54,5540,116165 aaEVSI

ENGS = EVSI-C(3) = 55,54 – 40 =18,60.

Se si procede all’analisi ipotizzando l’utilizzo di 4 sismografi si perviene ad

una conclusione diversa; infatti, la perdita attesa ottimala non condizionata

dell’esito campionario è pari a $ 109,46, quindi

54,5546,109165 aaEVSI

ENGS = EVSI-C(3) = 55,54 – 40 =15,54.

Come si può rilevare il guadagno che si consegue in corrispondenza di un

campione di dimensione n = 4 è inferire a quello accertato per n= 3 (15,54

contro 18,60), si accerta cioè una riduzione del vantaggio marginale dato dal

campionamento, il che porta a fissare la dimensione ottima in n = 3.

7.8 – Teoria causale delle decisioni

Armendt (1986), nel trattare dei fondamenti della teoria causale delle decisioni,

distingue quattro filoni di ricerca, molto simili nei contenuti ma filosoficamente diversi

che vengono fatti risalire, rispettivamente a Gibbard e Harper (1976), Sobel (1978),

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

416

Skyrms (1979) e Lewis (1981). Tutti i filoni si caratterizzano per l’introduzione di un

insieme di assiomi di preferenza razionale e per la derivazione di un teorema di

esistenza della funzione di utilità in grado di rappresentare le preferenze dei decisori.

Nonostante le generalizzazioni, la teoria dell’utilità attesa sommariamente illustrata

nelle pagine precedenti, non risulta del tutto adeguata quale strumento di supporto nello

svolgimento dei processi decisionali. Infatti tale teoria tratta le situazioni nelle quali le

conseguenze cui il decisore va incontro dipendono dallo stato di natura nell’ipotesi che

l’azione non abbia alcun effetto sullo stato di natura; un’ipotesi questa che in molti

contesti decisionali non risulta soddisfatta. Accade spesso, infatti, di incontrare

situazioni nelle quali la scelta operata dal decisore può implicare una diversa

distribuzione delle probabilità sugli stati di natura (evidential decision theory) o anche

determinare in modo rilevante la distribuzione stessa (causal decision theory)11

.

Se la scelta operata dal decisore ha un impatto sullo stato di natura, nella

caratterizzazione della statistica quale strumento finalizzato alle decisioni, diventa

essenziale tutta la problematica relativa all’analisi della causalità, sia nei suoi aspetti

teorici che nelle sue implicazioni operative.

Se a ciascuna azione è associata una specifica distribuzione di probabilità, le

probabilità a posteriori oltre che dipendere dalle probabilità a priori e dall’evidenza

campionaria dipenderanno anche dall’azione prescelta, quindi, la probabilità sugli stati

di natura può essere rappresentata dall’espressione / , / ,j i j iP a P see a x x ,

nel caso si operi nel contesto dell’evidential decision theory, che diventa

/ / , / / ,j i j iP a P do a x x se il contesto è quello causale (causal decision

theory), l’azione prescelta determina la distribuzione di probabilità. Pertanto, nel

contesto causale la tavola di decisione assume la forma

Probabilità a posteriori condizionate

Azioni 1 / / , iP a x

2 / / , iP a x

.....

/ / ,n iP a x

1a 11u 1nu ..... 1nu

2a 21u 22u ..... 2nu

.... ..... ..... ..... .....

ia 1iu 2iu ..... inu

.... ..... ..... ..... .....

ma 1mu 2mu ..... mnu

Tab. 7.21 - Tavola di decisione con probabilità condizionate all’azione

11

Per un approfondimento su questo tema si può, tra gli altri, consultare Joyce (1999).

B. Chiandotto Versione 2017

INFERENZA STATISTICA

Cap. 7 – Teoria statistica delle decisioni

417

Riassumendo quanto illustrato si avrà, che nei contesti considerati, che la scelta

ottimale a* per il decisore razionale è quella che soddisfa la relazione

1 1

1

* min , / max , /

* max , / , osservo / ,

* ma

i

k k

i j j i j ja i

j j

k

i j j i j ii

j

a l a P u a P

a u a P a P a

a

Regola di decisione bayesiana

Regola di decisione bayesiana condizionata

x x

x x

1

x , / / , decido / / , .k

i j j i j ii

j

u a P a P a

x x

418