nuovi strumenti virtuali per la sperimentazione clinica 2012/relazione enzo grossi.pdf ·...
TRANSCRIPT
Nuovi strumenti virtuali per la sperimentazione clinica
Enzo Grossi
Innovare l’innovazioneNuovi approcci alla R&D nel settore della saluteMilano, Auditorium Assolombarda23 ottobre 2012
• Costo medio per sviluppare un farmaco:100-400 milioni di dollari
• Tempo medio per registrarlo: 12 anni• Numero di composti valutati per selezionare il
candidato finale : 5.000• Numero minimo soggetti da studiare: 3.000• Numero pagine dossier registrativo:100.000
Processo di sviluppo dei farmaci : alcune cifre
PRECLINICAFAMIGLIA DI COMPOSTI
BREVETTO
SINTESI E TESTING
Fasi nella ricerca e sviluppo dei farmaci
RICERCA MARKETING
IDEA
SELEZIONE
SCELTA
CLINICAREGISTRAZIONE
LANCIO
POST MKT
12ANNICOSTI 35% 65%
SVILUPPO
Lo sviluppo clinico
• Lo sviluppo clinico si basa sulla effettuazione di prove sperimentali, che prendono il nome di studi clinici o sperimentazioni cliniche o clinicaltrials.
STUDI CONTROLLATI RANDOMIZZATI(Randomised Controlled Trials - RCT)
GRUPPO DI TRATTAMENTO
randomizzazionePOPOLAZIONE STUDIATA (CAMPIONE)
GRUPPO DI CONTROLLO
CONFRONTO ESITI
simili
T
E
M
P
O
POPOLAZIONE GENERALE
% esiti favorevoli % esiti favorevoli
Sviluppo clinico
Fase 1
Fase 2
Fase 3
20-100
100-300
1000-5000
12 mesi
1- 2 anni
2- 4anni
70 % 1.0
33 % 2.0
25 % 20
Numero dipazienti
Tempo Percentuale di insuccesso
Costi
(Mio euro)
Proof of concept di efficaciaConferma di efficacia su grandi numeri
M 1 M 2M 3
M 4 M 5
PROPOSTACANDIDATO SVILUPPO
PROFILO TARGET
IMPIANTO PILOTA
FASE 1 INIZIOINIZIO FASE 3
PUNTI DECISIONALI NELLO SVILUPPO FARMACEUTICO : le “milestones”
STUDIO CLINICO PILOTA CON ARRUOLAMENTO DI 80 PAZIENTI
40 SONO RANDOMIZZATI AL FARMACO ATTIVO E 40 AD UN PLACEBO
I TASSI DI RISPOSTA REGISTRATI NEI DUE GRUPPI SONO:
FARMACO ATTIVO: 55%
PLACEBO: 45%
VALE LA PENA INTRAPRENDERE UN TRIAL CON 500 CASI ARRUOLATI?
CON UN NUMERO PIU’ ALTO DI PAZIENTI I TASSI CAMBIERANNO?
SITUAZIONE TIPICA
L’incertezza nei piccoli numeriCampioni di piccole dimensioni ( es. 10-30 records) sonomolto sensibili a oscillazioni casuali di accuratezza distima.
Una apparente uguaglianza di distribuzione di due variabilipuò risultare non vera nel campione esteso o viceversauna apparente loro diversa distribuzione può scomparire in un campione più rappresentativo.
Ciò è particolarmente vero in situazioni come gli studi difase 2 in oncologia dove si studiano gruppi di pochedecine di pazienti e in cui il tasso di risposta di nuoviagenti utilizzati in monoterapia può essere dell’ordine del 10-50%.
05
101520253035
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
risposta 50% risposta40% risposta30%risposta20% risposta10%
Intervallo di confidenza per tassi di rispostaoscillanti tra 10 e 50%
% I.C
05
101520253035
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
risposta 50% risposta40% risposta30%risposta20% risposta10%
Intervallo di confidenza per tassi di rispostaoscillanti tra 10 e 50%
Caso NSCLC: la risposta apparentedel 20% oscilla in realtà tra 5% e 35%
% I.C
05
101520253035
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
risposta 50% risposta40% risposta30%risposta20% risposta10%
Intervallo di confidenza per tassi di rispostaoscillanti tra 10 e 50%
Caso cancro del colon: la rispostaapparente del 50% oscilla in realtà tra37% e 63%, eppure il gruppo era abbastanza numeroso
% I.C
Un problema in cerca di una soluzione
• Questo problema può essere importante in tuttiquei contesti in cui è importante prenderedecisioni critiche in fasi precoci di sviluppo di un farmaco.
• In questi casi è importante capire se il trend in atto è congruente con le aspettative e se è solo questione di scarsa numerosità.
• Un altra situazione dove questa esigenza si puòmanifestare è lo studio in fase più avanzata dimalattie rare; situazioni in cui la numerosità del campione è forzatamente piccola.
Nuovetecnologie
Sperimentazionicliniche
Driving forces Driving forces nellanellasperimentazionesperimentazione clinicaclinica
Dinamica, Adattamento, Cambiamento
Staticità, Regole, Standards.
Good Clinical Practices
Procedure operative standard
Nuove ideemetodologiche
A growing number of sciences, from atmospheric modellingto genomics, would not exist in their current form if it were notfor computers.
“Applied computer science is now playing the role which mathematicsdid from the seventeenth through the twentieth centuries: providing anorderly, formal framework and exploratory apparatus for othersciences.”George Djorgovski, Virtual Astronomy, Information Technology,and the New Scientific Methodology. 7th Int. WorkshopComput. Arch. for Machine Percept. 125–132 (2005).
The sciences rely on computers, but the benefits are two-way; each is drivingthe other forwards.
Computers and science
RETI NEURALI ARTIFICIALI• Sistema di computazione distribuita basato sul
processamento parallelo eseguito da unitàsemplici.
• La computazione neurale si ispira ai sistemineurali biologici, dei quali cerca di modellarne la struttura e di simularne le funzioni di base.
HIDDEN
OUTPUT
INPUT (n)
. . . . .1 2 3 4 5 6 n7 8
. . . . .1 2 3 4 5 n
. . . . .1 2 3 n
Cosa sono le reti neurali?Sistemi computerizzatiispirati al funzionamentodel cervello, basati su unanuova matematica, in grado di creare modelliadatti alla comprensionedi fenomeni complessialtamente non lineari.Rappresentano una delleespressioni più importantidel cosiddetto “Machine learning” una branca dellaintelligenza artificiale.
FRATTALICAOS
COMPORTAMENTO EMERGENTE
RETI COMPLESSE
MODELLIZZAZIONE E SIMULAZIONE
MATEMATICA DEI SISTEMI COMPLESSI
ATTRATTORI STRANI
INV
AR
IAN
ZA D
I SC
ALA
ORDINE DAL DISORDINE
EQUAZIONI RECURSIVE
ARCHITETTURA
COMPLESSA
RNA: Ispirazione Biologica
• La struttura del cervello permette:– robustezza e tolleranza agli errori. Le cellule
nervose nel cervello muoiono ogni giorno senza avere effetti significativi sulla performance totale del sistema;
– flessibilità. La struttura si può facilmente adeguare a un nuovo ambiente attraverso l’apprendimento
– gestione di informazioni confuse, probabilistiche, indefinite o inconsistenti;
– parallelismo; – struttura piccola, compatta e che dissipa veramente
poca energia.
Reti neurali
∑ −=N
j
nji
nji WuD );( ][
,][
;ii
ii
DD
DD
i eeeeJ −
−
+−
=
);()1()2()( ][,
][2][][,
nji
njiii
ni
nji WuJJJuW −⋅−⋅⋅−⋅⋅−=Δ
;][,
][,
]1[,
nji
nji
nji WWW Δ+=+
];1,1[ ; ][
][,
][ +−∈+⋅=∑
niOut
N
j
nji
Outn
i OutOffsetN
WScaleOut
MinWMaxWMinWMaxWOffset
MinWMaxWScale OutOut −
+−=
−= ;2
|;| ][][ ni
ni OutS =
;)()()(
)()(][][
,][
][][][][
][][][][
nj
ni
nj
ni
nj
ni
nj
ni
uSuS
uSuSn
jn
ijin
eeeeuSTanHS
+−+
+−+
+
−−=+−=Δ
2[ ] [ ] [ ],(1 );
Nn n n
i i j ij
LCoef u Sδ = ⋅ ⋅ − Δ∑[ ] [ ]
[ ] [ ][ ] [ ]( ) ;
n nj j
n nj j
N Nn n
i jj j
e eTanHe e
δ δ
δ δϕ δ
−
−
−= =
+∑ ∑
[ ] [ ] [ ];n n ni i iu δ ϕΔ = ⋅
[ 1] [ ] [ ].n n ni i iu u u+ = + Δ
Dinamica artificialevs dinamica reale
Le equazioni interagiscono con i dati dentro al computer e siinfluenzano a vicenda. Regolenascoste emergono dal basso.
Artificial Adaptive Systems Tree
Artificial Adaptive Systems
Artificial Neural NetworksEvolutionary Systems
From Data to (optimal) Rules
From Parameters, Rules, or Constraints to (optimal) Data
Population Oriented
Genetic AlgorithmsGenetic Programming
Natural AlgorithmEvolution StrategiesSwarm Intelligence
etc..
Associative Memoriesx = f (x,w*), wii = 0
Auto-Poietic ANNy(n+1) = f (x,y(n),w*)
Space or Time Prediction / Classification
Function Approximation
(Value Estimation)
Classifications (Patterns Recognition)- Multinomial- Binomial
IntelligentData Mining
C.A.M.
DynamicsScenarios’Simulation
PatternsReconstruction
NaturalClustering
DataPreprocessing
SelfClassification
Topographic Mapping
Multi-Dimensional
Scaling
Supervised ANNy = f (x,w*)
Goal: linear and non linear optimization
Algorithm Oriented
Simulate AnnealingDirect SearchLocal Search
etc..
Partnership Bracco – Semeion per l’Intelligenza Artificiale in medicina
www.semeion.it
•Pubblicazione di oltre 50 articoli scientifici su riviste nazionali e internazionali•Pubblicazione di due libri scientifici •15 brevetti internazionali depositati;•9 software applicativi, destinati ai medici specialistici
Applicazioni esistenti più note delle Reti Neurali
• Riconoscimento delle parole e della scrittura• Classificazione segnali Sonar• Compressione di dati e immagini• Controllo qualità nei processi di automazione
industriale• Detectors bersagli mobili• Valutazione rischi finanziari• Ricostruzione pattern incompleti
Capire in anticipo il futuro
• Le reti neurali hanno la capacità di predire l’evoluzione di un sistema dalla decodifica di segnali deboli presenti in fase iniziale.
• Questa capacità di cogliere “pezzi di futuro” intrappolati nei dati, già dimostrata nell’imaging diagnostico, permette la loro applicazione a data set di tipo clinico.
THEORY: Types of ANNsArtificial Adaptive Systems
Artificial Neural NetworksEvolutionary Programming
min f (x)gi (x) ≥ 0hi (x) = 0 Associative Memories
x = f (x,w*)wii = 0
AutoPoietic ANN
y(n+1) = f (x,y(n),w*)
Tools & Algorithms
• Genetic Algorithms• Genetic Programming• Natural Algorithm• Simulated Annealing• Evolution Strategies• etc..
Goallinear and non linearoptimization
Space / TimePrediction
ValuesEstimation
Classifications(Patterns Recognition)
- Multinomial- Binomial
IntelligentData Mining
CAM
DynamicsScenarios’Simulation
PatternsReconstruction
NaturalClustering
DataPreprocessing
SelfClassification
Mapping
From Data to (optimal) RulesFrom Parameters, Rules, or Constraints to (optimal) Data
SuperVised ANN
y = f (x,w*)
NR-NN è una nuova rete ricorrente dotata di un algoritmoin grado di trovare dinamicamente le migliori connessionireciproche tra tutte le variabili di un determinato data set durante la fase di addestramento attraverso una memoriaassociativa.
New recirculationneural network (NR-NN)
FIG.2 LEARNING PHASE OF THE NEW RECIRCULATION NEURAL NETWFIG.2 LEARNING PHASE OF THE NEW RECIRCULATION NEURAL NETWORKORK
Utilizzo delle memorie associative per predire il trend reale di una fase 3
•Una rete neurale autoassociativa, analizzando le informazioni diuna simulazione di fase II dall’esito incerto, è in grado di generaredei trend di risultati che corrispondono a quelli ottenibili in fase III .•La validazione è basata sulla estrazione di un piccolo subset dipazienti da uno studio di fase III reale.•Il subset presenta un quadro incerto di efficacia comparativarispetto a quello del data-set esteso dove esiste una chiara unadifferenza tra gruppi di trattamento.
Nutritional Supplementation With Branched-ChainAmino Acids in Advanced Cirrhosis: A Double-Blind,
Randomized TrialGIULIO MARCHESINI,* GIAMPAOLO BIANCHI,* MANUELA MERLI,‡ PIERO AMODIO,§ ARMINE PANELLA, CARMELA LOGUERCIO,¶ FILLIPO ROSSI
FANELLI,‡ and ROBERTO ABBIATI,# for the ITALIAN BCAA STUDY GROUPGASTROENTEROLOGY 2003;124:1792–1801
•43 variabili
•End Point: Ricovero Ospedaliero nell’anno successivo
Schema esperimento
Scopo dell’esperimento è di predire il trend del trial reale dai dati del trial ristretto simulato.
TRIAL GRUPPO N.PAZIENTI RICOVERO %Reale ATTIVO 150 14
PLACEBO 150 36
Simulato ATTIVO 30 25PLACEBO 30 30
Interrogazione della reteautoassociata
Vengono fatte interrogazioniper determinare
-il prototipo del trattamentoattivo e del placebo
-il prototipo dei pazientiricoverati e non ricoverati
Nel prototipo ci dovràessere ricovero no per l’attivo e ricovero sì per il placebo
Nel prototipo di dovràessere placebo e trattamento attivo rispettivamente
Conclusioni esperimento• L’utilizzo della new ricirculation permette di
stabilire una relazione chiara tra trattamento attivo e tendenza ad un basso numero di ricoveri, corrispondente a quella del trial reale. Questo nonostante che i dati a disposizione fossero estremamente ridotti e non evidenziassero una differenza certa tra i due gruppi di confronto.
Artificial Adaptive Systems Tree
Artificial Adaptive Systems
Artificial Neural NetworksEvolutionary Systems
From Data to (optimal) Rules
From Parameters, Rules, or Constraints to (optimal) Data
Population Oriented
Genetic AlgorithmsGenetic Programming
Natural AlgorithmEvolution StrategiesSwarm Intelligence
etc..
Associative Memoriesx = f (x,w*), wii = 0
Auto-Poietic ANNy(n+1) = f (x,y(n),w*)
Space or Time Prediction / Classification
Function Approximation
(Value Estimation)
Classifications (Patterns Recognition)- Multinomial- Binomial
IntelligentData Mining
C.A.M.
DynamicsScenarios’Simulation
PatternsReconstruction
NaturalClustering
DataPreprocessing
SelfClassification
Topographic Mapping
Multi-Dimensional
Scaling
Supervised ANNy = f (x,w*)
Goal: linear and non linear optimization
Algorithm Oriented
Simulate AnnealingDirect SearchLocal Search
etc..
Algoritmi evolutivi e NP hard problems
Gli algoritmi evolutivi sono in grado di risolvere problemi che se affrontati con la sola forza bruta del computer non sarebbero risolvibili per i tempi computazionali proibitivi.
Si tratta di un algoritmo “evolutivo” ovvero un sistema che anziché eseguire un programma con regole ed equazioni lineari predeterminate, è in grado di processare l’informazione in maniera intelligente, facendo in modo che siano i dati stessi a guidare la costruzione del modello matematico in grado di risolvere uno dei problemi più complessi della matematica moderna ovvero trovare la disposizione spaziale ottima di una serie di punti partendo dalla matrice delle loro distanze reciproche.
Algoritmo PST Semeion
• Posizionare tutti i punti nel piano in manierada soddisfare la matrice di distanze, partendodal presupposto che non necessariamente la mappa esista veramente.
• E’ possibile trovare una distribuzione ottimalesenza dover tentare a caso tutte le possibilicombinazioni ?
• E’ interessante notare che con solo 25 punti le combinazioni possibili sono un numero di 66 cifre
Il problema
PST: Distanze atomicheAt.1 At.2 At.3 At.4 At.5 At.6 At.7 At.8 At.9 At.10 At.11 At.12 At.13 At.14 At.15 At.16 At.17 At.18 At.19 At.20 At.21 At.22 At.23 At.24 At.25
At.1 0 -1 -1 480 -1 -1 -1 -1 -1 -1 -1 220 407 -1 -1 -1 688 -1 -1 -1 636 -1 -1 -1 -1At.2 -1 0 -1 -1 265 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 307 188 -1 -1 -1 -1 -1 -1 -1 345At.3 -1 -1 0 -1 474 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 400 554 -1 -1 572 -1At.4 480 -1 -1 0 238 -1 -1 -1 -1 -1 -1 670 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 350 -1At.5 -1 265 474 238 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1At.6 -1 -1 -1 -1 -1 0 -1 247 -1 -1 -1 -1 528 -1 -1 -1 -1 -1 341 -1 -1 -1 -1 -1 179At.7 -1 -1 -1 -1 -1 -1 0 168 -1 -1 -1 -1 -1 144 -1 567 -1 -1 -1 194 376 -1 -1 -1 -1At.8 -1 -1 -1 -1 -1 247 168 0 -1 -1 -1 -1 -1 222 -1 -1 -1 418 -1 -1 -1 -1 -1 -1 -1At.9 -1 -1 -1 -1 -1 -1 -1 -1 0 -1 -1 -1 160 -1 79 -1 -1 -1 -1 -1 -1 637 -1 -1 -1At.10 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 289 -1 463 -1 -1 -1 -1 -1 320 123 -1 236 -1 -1 -1At.11 -1 -1 -1 -1 -1 -1 -1 -1 -1 289 0 -1 -1 -1 -1 -1 -1 692 -1 -1 -1 -1 -1 -1 218At.12 220 -1 -1 670 -1 -1 -1 -1 -1 -1 -1 0 -1 -1 515 -1 695 -1 -1 -1 -1 -1 -1 -1 -1At.13 407 -1 -1 -1 -1 528 -1 -1 160 463 -1 -1 0 -1 286 -1 -1 -1 383 -1 -1 -1 -1 -1 -1At.14 -1 -1 -1 -1 -1 -1 144 222 -1 -1 -1 -1 -1 0 220 548 -1 -1 -1 -1 -1 -1 -1 -1 -1At.15 -1 -1 -1 -1 -1 -1 -1 -1 79 -1 -1 515 286 220 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1At.16 -1 307 -1 -1 -1 -1 567 -1 -1 -1 -1 -1 -1 548 -1 0 -1 -1 -1 521 -1 -1 913 -1 -1At.17 688 188 -1 -1 -1 -1 -1 -1 -1 -1 -1 695 -1 -1 -1 -1 0 716 543 -1 -1 -1 -1 -1 -1At.18 -1 -1 -1 -1 -1 -1 -1 418 -1 -1 692 -1 -1 -1 -1 -1 716 0 -1 -1 -1 -1 -1 -1 -1At.19 -1 -1 -1 -1 -1 341 -1 -1 -1 320 -1 -1 383 -1 -1 -1 543 -1 0 250 -1 -1 614 564 -1At.20 -1 -1 400 -1 -1 -1 194 -1 -1 123 -1 -1 -1 -1 -1 521 -1 -1 250 0 -1 -1 -1 -1 -1At.21 636 -1 554 -1 -1 -1 376 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 -1 353 -1 -1At.22 -1 -1 -1 -1 -1 -1 -1 -1 637 236 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 403 -1 -1At.23 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 913 -1 -1 614 -1 353 403 0 -1 -1At.24 -1 -1 572 350 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 564 -1 -1 -1 -1 0 -1At.25 -1 345 -1 -1 -1 179 -1 -1 -1 -1 218 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0
Studio ALPI ( data set Mario Negri)
• In un gruppo di 305 pazienti tumorali trattati con 5 FU ci sono 98 pazienti che sviluppano unarecidiva di tumore (evento) e 207(67.8%) chenon sviluppano la recidiva (non evento).
• Il data set è composto di 7 variabili indipendentie 2 dipendenti( evento- non evento).
• Il rapporto tra 98 e 207 è = 0.47
USE OF ARTIFICIAL NEURAL NETWORKS (ANN) IN PREDICTING RESPONSE TO INFLIXIMAB TREATMENT IN
PATIENTS WITH CROHN'S DISEASE
Kohn Anna*, Grossi Enzo**, Mangiarotti Roberto*, Prantera Cosimo*
181 pazienti
Remissione: 136 pz
Non remissione: 45 paz
Rapporto= 0.33
b
aRapporto a/b= 0.34
• Nei primi 30 pazienti consecutivi il tasso dirisposta è pari al 50% ovvero la frequenza deidue eventi identica.
• Ci aspettavamo che la elaborazione con PST dimostrasse un rapporto dei due assi = 1.0