impostazione bayesiana di un problema di analisi discriminatoria nell'ambito di un modello non...

Download Impostazione Bayesiana di un problema di analisi discriminatoria nell'ambito di un modello non parametrico

Post on 10-Jul-2016

217 views

Category:

Documents

3 download

Embed Size (px)

TRANSCRIPT

  • LMPOSTAZIONE BAYESIANA DI UN PROBLEMA DI ANALISI DISCRIMINATORIA NELL'AMBITO DI UN MODELLO NON PARAMETRICO (*)

    GUIDO CONSONN1 lstituto di Metodi Quantitativi Universit& ~ Luigi Bocconi>> Milano, 1981

    Versione definitiva pervenuta il 24-9-81

    Seguendo l'impostazione predittiva delineata da J. Aitchison e I. R. Dunsmore (1975) viene proposto un modello non-parametrico di analisi discriminatoria dal punto di vista bayesiano.

    Si ricorre a tal fine ad una versione moclificata dello schema di scambiabilit~t parziale e si utilizza il processo introdotto da D. M. Cifarelli ed. E. Regazzini (1978). Si presenta infine un'applicazione del modello ad un tipico problema di diagnosi medica.

    1. Introduzione

    Dato un numero aleatorio (n.a.) X la cui legge di distribuzione p(-) dipende da un parametro aleatorio H- di cui, per il momento, non occorre precisare la natura - - la distribuzione del n.a. Xn+t, t = 1, 2 . . . . alla luce din osservazioni x '= (xl, . . . , xn) ~ data come noto da

    E {p( . ]H)} (l. l) HIx

    il valore atteso essendo fatto rispetto alia distribuzione finale di H. La (1.1) viene detta distribuzione predittiva.

    J. Aitchison e I. R. Dunsmore (1975) hanno messo in evidenza come la (1.1) possa essere utilmente impiegata per la soluzione, in ambito bayesiano, di alcuni classici problemi di analisi multivariata ed in particolare di un problema di ana- lisi discriminatoria.

    Con riferimento a quest'ultimo intendiamo proporre uno schema induttivo, legato alia nozione di parziale scambiabilith, che a nostro avviso consente di in- quadrare in modo naturale ed efficace il problema; successivamente estenderemo l'analisi esposta in [1] al caso non parametrico.

    (*) Lavoro eseguito nelrambito del GNAFA-CNR. L'argomento di questo lavoro mi stato suggerito dal professor Eugenio Regazzini. A quest'ultimo ed al prof. Donato Michele Cifarelli sono grato per avermi segnalato alcune oscurith nel testo originario.

    89

  • 2. Formulazione del problema

    Un problema di analisi discriminatoria pub essere cosi sintetizzato. Sia data una collettivith di elementi e sia pure data una partizione finita in k

    classi .(2 = (q01 . . . . . ~v k} di tale collettivit~t. Supponiamo che per ogni elemento sia possibile rilevare un vettore di carat-

    teristiche d-dimensionale, che indichiamo con X, le quali siano in qualche modo legate alia sua appartenenza ad una specifica classe, pur non essendo tale legame deterministico.

    Supponiamo ora di aver a disposizione un'ennupla di osservazioni z' = (Zl', . . . . z,,') = (xx', tpl), . . . , (x,,', q~n) su n elementi della collettivit~, dove

    x s 6 il vettore delle caratteristiche relativo al j .esimo elemento; 9~ 6 la classe a cui appartiene il j .esimo elemento.

    Va da s6 che penseremo xj e qg~ rispettivamente come una realizzazione del v.a. X 3 e del n.a. ~3".

    Consideriamo ora un nuovo elemento della collettivith il quale presenti un vettore delle caratteristiche y. I1 nostro problema consiste nell'assegnare tale ele- mento, alla luce delle osservazioni z, alia sua classe di appartenenza in modo da rendere minima la probabilifft di errore di classificazione.

    Una risposta al problema precedentemente formulato ~ rappresentata dalla cosiddetta distribuzione diagnostica (cfr. [1] pag. 220).

    P r{q~*=ty i ly , z} i----- l . . . . , k (2.1)

    dove ~b* rappresenta la classe a cui appartiene l 'elemento in questione. Natural- mente ~* pub assumere le k possibili determinazioni (~1 . . . . . tpe).

    Chiaramente assegneremo tale element o a quella classe in corrispondenza della quale la distribuzione (2.1) raggiunge il suo massimo. Qualora tale massimo non sia unico ma si realizzi in corrispondenza di p valori (p < k), allora risulta indifferente scegliere una qualunque delle rispettive p classi.

    3. II problema delranalisi diseriminatoria nell'ambito di un modello di scambiabi- lith parziale

    Ci sembra che il problema esposto nel precedente numero 2 possa essere con- venientemente riformulato nel contesto di un modello di scambiabilitb, parziale (scamb. parz.).

    Riteniamo utile, a questo punto, ricordare le condizioni nelle quali risulta opportuno ampliare 1o schema di scambiabilith (totale) a quello di scamb, parz.

    Esse si realizzano allorquando le osservazioni intorno alia successione {Xn}n = = 1, 2, . . . degli enti aleatori oggetto del nostro ragionamento induttivo avven- gono in concomitanza con l'osservazione di una o pifi circostanze oggettivamente verificabili, che per semplicifft indicheremo con il termine di qualit?~ osservabile (qual. osser.) e indicheremo con la lettera ~. q), in generale, pub essere un qualun- que ente: numero, vettore, funzione o altro ancora. Sar/~ tuttavia opportuno, per motivi di semplicith e praticifft, limitarsi al caso in cui q5 6 un numero.

    Potremo altresi ipotizzare che q~ possa assumere un numero finito, diciamo k, di valori che indicheremo con ~pl . . . . , q~k.

    90

  • Da un punto di vista sostanziale l 'osservazione, per ogni X~, di go ci consente di individuare in modo pi/1 preciso l'ente aleatorio in questione, di modo che noi r ipartiremo la successione di partenza {X,,} in k sottosuccessioni {Xi,n~} i = 1, . . . , k; n~ = 1, 2, . . . ciascuna delle quali risulta composta di elementi scam- biabili.

    Questi brevi richiami e la simbologia volutamente impiegata gi~t consentono di intravedere la linea che converr~ seguire per modellare un problema di analisi discriminatoria in termini di scambiabilifft parziale. Baster~ al l 'uopo identificare i termini qual. osser, e classe e precisare che X dipende da gO nel modo pifi naturale e intuitivo: ossia la distribuzione di X, subordinatamente a gO ----- 99 i, ~ in generale diversa da quella di X subordinatamente a gO ---- 99 ~, per ogni i ~ h (i, h = 1, . . . . k).

    Naturalmente la differenza tra il modello di scamb, parz., diciamo tradizionale, e la versione qui proposta consiste nell' ipotizzare che in quest'ult ima la qual. os- ser. sia aleatoria.

    Vorremmo tuttavia sottolineare che gO rimane pur sempre una qualifft ogget- t ivamente rilevabile secondo le indicazioni di B. de Finetti (1938 e 1970). Solo questioni di comodifft, economia o altro ci inducono a riguardarla come aleatoria. D'altro canto, per quanto riguarda i dati utilizzati nel procedimento inferenziale, ossia le coppie (x3, ~05), ~pj viene rilevata di volta in volta e pertanto ci sembra che il principio informatore dello schema di scamb, parz. venga rispettato, giusta l ' importante osservazione segnalata in [7] a pag. 605.

    I1 teorema di rappresentazione di una successione parzialmente scambiabile continua naturalmente a valere, purse opportunamente modificato. Supponendo, per semplicith, che l'ente aleatorio X sia un v.a. X, consideriamo l'evento

    E = (X3 < xs) (r = 95); (F~ . . . . , Fk) (3.1) j= l

    dove F i rappresenta la f.r. del generico v.a. X s subordinatamente a r = ~. Raggruppando insieme i v.a. X 3 che presentano la medesima realizzazione

    goj = 99 i possiamo riscrivere il vettore (XI ' , . . . . X~') cosi

    (X l " , . . . . Xn ' ) = (X l ,1 , 9 . . ,X l ,n l ; X2 ,1 . . . . . X2 ,n2 ; 9 . . ;Xk ,1 , 9 . . ,Xk ,nk)

    dove Xi.5~ i = 1, . . . , k; j~ = 1, . . . , n i ~ stato osservato congiuntamente a

    k

    goi.5~=q ~ e ~ n~=n

    Possiamo dunque scrivere k n~.

    Pr{E} = 1-'[ I-I F/(xi.5,) i=1 3i=1

    (3.2)

    Qualora ni -- 0 si pone per convenzione I-I~**=~ Fi(xi,3,) = 1. Dalla (3.1) e (3.2) discende immediatamente che

    k nt

    I~ I~ Fi(xi,Jt ) dO((P l , " ' ' , (P - ; i f1 , " ' ' , Fk) i=1 jill

    (3.3)

    91

  • dove

    ~ i a ~ F i 6 uno spazio funzionale: ~ = ~1 a ~e"2e . . . ~k a p 6 una misura di probabi l i tL

    Riguardo alia struttura di ~ ci sembra del tutto accettabile l'ipotesi di indi- pendenza stocastica tra i due v.a. ~ ' = (~1 . . . . . On) e F ' = (F1 . . . . . Fk). Se infatti si riflette sul significato sostanziale di ~ si nota che esso rappresenta un parametro che segnala 1'

  • 4. Un modello bayesiano non-parametrico di analisi diseriminatoria

    Sulla scorta di quanto detto al precedente n. 3 siamo ora in grado di formulare un modello bayesiano non-parametrico di analisi discriminatoria.

    Consideriamo una successione {Xn, r n = 1, 2 . . . . dove X,~ 6 un v.a. d- dimensionale e q5 nun n.a. discreto suscettibile di assumere k distinte determina- zioni (q01, . . . , cp k) = .(2.

    Subordinatamente a q5 --__ qgi, X,~ provenga dalla successione {Xi.n, } i ----- 1 . . . . . k; n i ---- I, 2 . . . . .

    Sia {X~,n~} una successione scambiabile, ossia composta di v.a. mutuamente indipendenti subordinatamente ad una f.r. Fi:Rd--* [0, 1] e identicamente di- stribuiti secondo la Fi.

    Subordinatamente a F' = (F 1 , : : : . , Fk) e a tb,~ = q~ la successione {Xn} risulti parzialmente scambiabile, ossia scomponibile in k sottosuccessioni {Xi.~,} i = 1, . . . , k che godono dei requisiti elencati al capoverso precedente.

    Sia {rb,} una successione scambiabile. Pifi precisamente gli elementi di {On} siano n.a. discreti mutuamente indipendenti subordinatamente ad un parametro

    Sulla scorta di quanto detto in chiusura del numero 3 assumiamo altresi che F e W siano stocasticamente indipendenti.

    In base a queste ipotesi e svolgendo calcoli del tutto simili, a lmeno formal- mente, a quelli riportati in [l] a pagina 219 si perviene alla espressione della di- stribuzione diagnostica

    P r ( r ----- q~i[ y, z} : P r (~* ---- q)i] r : r ] q~i, z) (4.1)

    Pr{r = q~;[r = q~}L(yl~v i, z) i=1

    dove r rappresenta la classe da cui proviene il vettore y, ~ ' : (~1 . . . . .

Recommended

View more >