nuovi strumenti virtuali per la sperimentazione clinica 2012/relazione enzo grossi.pdf ·...

Nuovi strumenti virtuali per la sperimentazione clinica

Enzo Grossi

Innovare l’innovazioneNuovi approcci alla R&D nel settore della saluteMilano, Auditorium Assolombarda23 ottobre 2012

• Costo medio per sviluppare un farmaco:100-400 milioni di dollari

• Tempo medio per registrarlo: 12 anni• Numero di composti valutati per selezionare il

candidato finale : 5.000• Numero minimo soggetti da studiare: 3.000• Numero pagine dossier registrativo:100.000

Processo di sviluppo dei farmaci : alcune cifre

PRECLINICAFAMIGLIA DI COMPOSTI

BREVETTO

SINTESI E TESTING

Fasi nella ricerca e sviluppo dei farmaci

RICERCA MARKETING

IDEA

SELEZIONE

SCELTA

CLINICAREGISTRAZIONE

LANCIO

POST MKT

12ANNICOSTI 35% 65%

SVILUPPO

Lo sviluppo clinico

• Lo sviluppo clinico si basa sulla effettuazione di prove sperimentali, che prendono il nome di studi clinici o sperimentazioni cliniche o clinicaltrials.

STUDI CONTROLLATI RANDOMIZZATI(Randomised Controlled Trials - RCT)

GRUPPO DI TRATTAMENTO

randomizzazionePOPOLAZIONE STUDIATA (CAMPIONE)

GRUPPO DI CONTROLLO

CONFRONTO ESITI

simili

T

E

M

P

O

POPOLAZIONE GENERALE

% esiti favorevoli % esiti favorevoli

Sviluppo clinico

Fase 1

Fase 2

Fase 3

20-100

100-300

1000-5000

12 mesi

1- 2 anni

2- 4anni

70 % 1.0

33 % 2.0

25 % 20

Numero dipazienti

Tempo Percentuale di insuccesso

Costi

(Mio euro)

Proof of concept di efficaciaConferma di efficacia su grandi numeri

M 1 M 2M 3

M 4 M 5

PROPOSTACANDIDATO SVILUPPO

PROFILO TARGET

IMPIANTO PILOTA

FASE 1 INIZIOINIZIO FASE 3

PUNTI DECISIONALI NELLO SVILUPPO FARMACEUTICO : le “milestones”

STUDIO CLINICO PILOTA CON ARRUOLAMENTO DI 80 PAZIENTI

40 SONO RANDOMIZZATI AL FARMACO ATTIVO E 40 AD UN PLACEBO

I TASSI DI RISPOSTA REGISTRATI NEI DUE GRUPPI SONO:

FARMACO ATTIVO: 55%

PLACEBO: 45%

VALE LA PENA INTRAPRENDERE UN TRIAL CON 500 CASI ARRUOLATI?

CON UN NUMERO PIU’ ALTO DI PAZIENTI I TASSI CAMBIERANNO?

SITUAZIONE TIPICA

L’incertezza nei piccoli numeriCampioni di piccole dimensioni ( es. 10-30 records) sonomolto sensibili a oscillazioni casuali di accuratezza distima.

Una apparente uguaglianza di distribuzione di due variabilipuò risultare non vera nel campione esteso o viceversauna apparente loro diversa distribuzione può scomparire in un campione più rappresentativo.

Ciò è particolarmente vero in situazioni come gli studi difase 2 in oncologia dove si studiano gruppi di pochedecine di pazienti e in cui il tasso di risposta di nuoviagenti utilizzati in monoterapia può essere dell’ordine del 10-50%.

05

101520253035

10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50

risposta 50% risposta40% risposta30%risposta20% risposta10%

Intervallo di confidenza per tassi di rispostaoscillanti tra 10 e 50%

% I.C

05

101520253035

10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50



Caso NSCLC: la risposta apparentedel 20% oscilla in realtà tra 5% e 35%

% I.C

05

101520253035

10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50



Caso cancro del colon: la rispostaapparente del 50% oscilla in realtà tra37% e 63%, eppure il gruppo era abbastanza numeroso

% I.C

Un problema in cerca di una soluzione

• Questo problema può essere importante in tuttiquei contesti in cui è importante prenderedecisioni critiche in fasi precoci di sviluppo di un farmaco.

• In questi casi è importante capire se il trend in atto è congruente con le aspettative e se è solo questione di scarsa numerosità.

• Un altra situazione dove questa esigenza si puòmanifestare è lo studio in fase più avanzata dimalattie rare; situazioni in cui la numerosità del campione è forzatamente piccola.

Nuovetecnologie

Sperimentazionicliniche

Driving forces Driving forces nellanellasperimentazionesperimentazione clinicaclinica

Dinamica, Adattamento, Cambiamento

Staticità, Regole, Standards.

Good Clinical Practices

Procedure operative standard

Nuove ideemetodologiche

A growing number of sciences, from atmospheric modellingto genomics, would not exist in their current form if it were notfor computers.

“Applied computer science is now playing the role which mathematicsdid from the seventeenth through the twentieth centuries: providing anorderly, formal framework and exploratory apparatus for othersciences.”George Djorgovski, Virtual Astronomy, Information Technology,and the New Scientific Methodology. 7th Int. WorkshopComput. Arch. for Machine Percept. 125–132 (2005).

The sciences rely on computers, but the benefits are two-way; each is drivingthe other forwards.

Computers and science

RETI NEURALI ARTIFICIALI• Sistema di computazione distribuita basato sul

processamento parallelo eseguito da unitàsemplici.

• La computazione neurale si ispira ai sistemineurali biologici, dei quali cerca di modellarne la struttura e di simularne le funzioni di base.

HIDDEN

OUTPUT

INPUT (n)

. . . . .1 2 3 4 5 6 n7 8

. . . . .1 2 3 4 5 n

. . . . .1 2 3 n

Cosa sono le reti neurali?Sistemi computerizzatiispirati al funzionamentodel cervello, basati su unanuova matematica, in grado di creare modelliadatti alla comprensionedi fenomeni complessialtamente non lineari.Rappresentano una delleespressioni più importantidel cosiddetto “Machine learning” una branca dellaintelligenza artificiale.

FRATTALICAOS

COMPORTAMENTO EMERGENTE

RETI COMPLESSE

MODELLIZZAZIONE E SIMULAZIONE

MATEMATICA DEI SISTEMI COMPLESSI

ATTRATTORI STRANI

INV

AR

IAN

ZA D

I SC

ALA

ORDINE DAL DISORDINE

EQUAZIONI RECURSIVE

ARCHITETTURA

COMPLESSA

RNA: Ispirazione Biologica

• La struttura del cervello permette:– robustezza e tolleranza agli errori. Le cellule

nervose nel cervello muoiono ogni giorno senza avere effetti significativi sulla performance totale del sistema;

– flessibilità. La struttura si può facilmente adeguare a un nuovo ambiente attraverso l’apprendimento

– gestione di informazioni confuse, probabilistiche, indefinite o inconsistenti;

– parallelismo; – struttura piccola, compatta e che dissipa veramente

poca energia.

Reti neurali

∑ −=N

j

nji

nji WuD );( ][

,][

;ii

ii

DD

DD

i eeeeJ −

−

+−

=

);()1()2()( ][,

][2][][,

nji

njiii

ni

nji WuJJJuW −⋅−⋅⋅−⋅⋅−=Δ

;][,

][,

]1[,

nji

nji

nji WWW Δ+=+

];1,1[ ; ][

][,

][ +−∈+⋅=∑

niOut

N

j

nji

Outn

i OutOffsetN

WScaleOut

MinWMaxWMinWMaxWOffset

MinWMaxWScale OutOut −

+−=

−= ;2

|;| ][][ ni

ni OutS =

;)()()(

)()(][][

,][

][][][][

][][][][

nj

ni

nj

ni

nj

ni

nj

ni

uSuS

uSuSn

jn

ijin

eeeeuSTanHS

+−+

+−+

+

−−=+−=Δ

2[ ] [ ] [ ],(1 );

Nn n n

i i j ij

LCoef u Sδ = ⋅ ⋅ − Δ∑[ ] [ ]

[ ] [ ][ ] [ ]( ) ;

n nj j

n nj j

N Nn n

i jj j

e eTanHe e

δ δ

δ δϕ δ

−

−

−= =

+∑ ∑

[ ] [ ] [ ];n n ni i iu δ ϕΔ = ⋅

[ 1] [ ] [ ].n n ni i iu u u+ = + Δ

Dinamica artificialevs dinamica reale

Le equazioni interagiscono con i dati dentro al computer e siinfluenzano a vicenda. Regolenascoste emergono dal basso.

Artificial Adaptive Systems Tree

Artificial Adaptive Systems

Artificial Neural NetworksEvolutionary Systems

From Data to (optimal) Rules

From Parameters, Rules, or Constraints to (optimal) Data

Population Oriented

Genetic AlgorithmsGenetic Programming

Natural AlgorithmEvolution StrategiesSwarm Intelligence

etc..

Associative Memoriesx = f (x,w*), wii = 0

Auto-Poietic ANNy(n+1) = f (x,y(n),w*)

Space or Time Prediction / Classification

Function Approximation

(Value Estimation)

Classifications (Patterns Recognition)- Multinomial- Binomial

IntelligentData Mining

C.A.M.

DynamicsScenarios’Simulation

PatternsReconstruction

NaturalClustering

DataPreprocessing

SelfClassification

Topographic Mapping

Multi-Dimensional

Scaling

Supervised ANNy = f (x,w*)

Goal: linear and non linear optimization

Algorithm Oriented

Simulate AnnealingDirect SearchLocal Search

etc..

Partnership Bracco – Semeion per l’Intelligenza Artificiale in medicina

www.semeion.it

•Pubblicazione di oltre 50 articoli scientifici su riviste nazionali e internazionali•Pubblicazione di due libri scientifici •15 brevetti internazionali depositati;•9 software applicativi, destinati ai medici specialistici

http://www.bentham.org/ebooks/9781608050420/index.htm

Applicazioni esistenti più note delle Reti Neurali

• Riconoscimento delle parole e della scrittura• Classificazione segnali Sonar• Compressione di dati e immagini• Controllo qualità nei processi di automazione

industriale• Detectors bersagli mobili• Valutazione rischi finanziari• Ricostruzione pattern incompleti

Capire in anticipo il futuro

• Le reti neurali hanno la capacità di predire l’evoluzione di un sistema dalla decodifica di segnali deboli presenti in fase iniziale.

• Questa capacità di cogliere “pezzi di futuro” intrappolati nei dati, già dimostrata nell’imaging diagnostico, permette la loro applicazione a data set di tipo clinico.

Mosca ciecabaricentro

futuro

presente

passato

Springer, October 2012

Lung cancer evolution – Fig. 7a

T0 image

T1 image

α (0.0) α (0.1) α (0.2)

α (0.3) α (0.4) α (0.5)

THEORY: Types of ANNsArtificial Adaptive Systems

Artificial Neural NetworksEvolutionary Programming

min f (x)gi (x) ≥ 0hi (x) = 0 Associative Memories

x = f (x,w*)wii = 0

AutoPoietic ANN

y(n+1) = f (x,y(n),w*)

Tools & Algorithms

• Genetic Algorithms• Genetic Programming• Natural Algorithm• Simulated Annealing• Evolution Strategies• etc..

Goallinear and non linearoptimization

Space / TimePrediction

ValuesEstimation

Classifications(Patterns Recognition)

- Multinomial- Binomial


CAM



NaturalClustering

DataPreprocessing

SelfClassification

Mapping

From Data to (optimal) RulesFrom Parameters, Rules, or Constraints to (optimal) Data

SuperVised ANN

y = f (x,w*)

Memorie associative

NR-NN è una nuova rete ricorrente dotata di un algoritmoin grado di trovare dinamicamente le migliori connessionireciproche tra tutte le variabili di un determinato data set durante la fase di addestramento attraverso una memoriaassociativa.

New recirculationneural network (NR-NN)

FIG.2 LEARNING PHASE OF THE NEW RECIRCULATION NEURAL NETWFIG.2 LEARNING PHASE OF THE NEW RECIRCULATION NEURAL NETWORKORK

REBUILD%REBUILD%

FIG. 5FIG. 5

DELETE %DELETE %

Fig 5 VALIDATION TESTFig 5 VALIDATION TEST

Utilizzo delle memorie associative per predire il trend reale di una fase 3

•Una rete neurale autoassociativa, analizzando le informazioni diuna simulazione di fase II dall’esito incerto, è in grado di generaredei trend di risultati che corrispondono a quelli ottenibili in fase III .•La validazione è basata sulla estrazione di un piccolo subset dipazienti da uno studio di fase III reale.•Il subset presenta un quadro incerto di efficacia comparativarispetto a quello del data-set esteso dove esiste una chiara unadifferenza tra gruppi di trattamento.

Nutritional Supplementation With Branched-ChainAmino Acids in Advanced Cirrhosis: A Double-Blind,

Randomized TrialGIULIO MARCHESINI,* GIAMPAOLO BIANCHI,* MANUELA MERLI,‡ PIERO AMODIO,§ ARMINE PANELLA, CARMELA LOGUERCIO,¶ FILLIPO ROSSI

FANELLI,‡ and ROBERTO ABBIATI,# for the ITALIAN BCAA STUDY GROUPGASTROENTEROLOGY 2003;124:1792–1801

•43 variabili

•End Point: Ricovero Ospedaliero nell’anno successivo

Schema esperimento

Scopo dell’esperimento è di predire il trend del trial reale dai dati del trial ristretto simulato.

TRIAL GRUPPO N.PAZIENTI RICOVERO %Reale ATTIVO 150 14

PLACEBO 150 36

Simulato ATTIVO 30 25PLACEBO 30 30

Validazione rete autoassociatasulle 43 variabili

Interrogazione della reteautoassociata

Vengono fatte interrogazioniper determinare

-il prototipo del trattamentoattivo e del placebo

-il prototipo dei pazientiricoverati e non ricoverati

Nel prototipo ci dovràessere ricovero no per l’attivo e ricovero sì per il placebo

Nel prototipo di dovràessere placebo e trattamento attivo rispettivamente

Ricovero no

Ricovero si

Interrogazione sul prototipo del trattamento con placebo

Conclusioni esperimento• L’utilizzo della new ricirculation permette di

stabilire una relazione chiara tra trattamento attivo e tendenza ad un basso numero di ricoveri, corrispondente a quella del trial reale. Questo nonostante che i dati a disposizione fossero estremamente ridotti e non evidenziassero una differenza certa tra i due gruppi di confronto.

Artificial Adaptive Systems Tree

Artificial Adaptive Systems

Artificial Neural NetworksEvolutionary Systems

From Data to (optimal) Rules

From Parameters, Rules, or Constraints to (optimal) Data

Population Oriented

Genetic AlgorithmsGenetic Programming

Natural AlgorithmEvolution StrategiesSwarm Intelligence

etc..

Associative Memoriesx = f (x,w*), wii = 0

Auto-Poietic ANNy(n+1) = f (x,y(n),w*)

Space or Time Prediction / Classification

Function Approximation

(Value Estimation)

Classifications (Patterns Recognition)- Multinomial- Binomial


C.A.M.



NaturalClustering

DataPreprocessing

SelfClassification

Topographic Mapping

Multi-Dimensional

Scaling

Supervised ANNy = f (x,w*)

Goal: linear and non linear optimization

Algorithm Oriented

Simulate AnnealingDirect SearchLocal Search

etc..

Algoritmi evolutivi e NP hard problems

Gli algoritmi evolutivi sono in grado di risolvere problemi che se affrontati con la sola forza bruta del computer non sarebbero risolvibili per i tempi computazionali proibitivi.

Si tratta di un algoritmo “evolutivo” ovvero un sistema che anziché eseguire un programma con regole ed equazioni lineari predeterminate, è in grado di processare l’informazione in maniera intelligente, facendo in modo che siano i dati stessi a guidare la costruzione del modello matematico in grado di risolvere uno dei problemi più complessi della matematica moderna ovvero trovare la disposizione spaziale ottima di una serie di punti partendo dalla matrice delle loro distanze reciproche.

Algoritmo PST Semeion

• Posizionare tutti i punti nel piano in manierada soddisfare la matrice di distanze, partendodal presupposto che non necessariamente la mappa esista veramente.

• E’ possibile trovare una distribuzione ottimalesenza dover tentare a caso tutte le possibilicombinazioni ?

• E’ interessante notare che con solo 25 punti le combinazioni possibili sono un numero di 66 cifre

Il problema

PST: Distanze atomicheAt.1 At.2 At.3 At.4 At.5 At.6 At.7 At.8 At.9 At.10 At.11 At.12 At.13 At.14 At.15 At.16 At.17 At.18 At.19 At.20 At.21 At.22 At.23 At.24 At.25

At.1 0 -1 -1 480 -1 -1 -1 -1 -1 -1 -1 220 407 -1 -1 -1 688 -1 -1 -1 636 -1 -1 -1 -1At.2 -1 0 -1 -1 265 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 307 188 -1 -1 -1 -1 -1 -1 -1 345At.3 -1 -1 0 -1 474 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 400 554 -1 -1 572 -1At.4 480 -1 -1 0 238 -1 -1 -1 -1 -1 -1 670 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 350 -1At.5 -1 265 474 238 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1At.6 -1 -1 -1 -1 -1 0 -1 247 -1 -1 -1 -1 528 -1 -1 -1 -1 -1 341 -1 -1 -1 -1 -1 179At.7 -1 -1 -1 -1 -1 -1 0 168 -1 -1 -1 -1 -1 144 -1 567 -1 -1 -1 194 376 -1 -1 -1 -1At.8 -1 -1 -1 -1 -1 247 168 0 -1 -1 -1 -1 -1 222 -1 -1 -1 418 -1 -1 -1 -1 -1 -1 -1At.9 -1 -1 -1 -1 -1 -1 -1 -1 0 -1 -1 -1 160 -1 79 -1 -1 -1 -1 -1 -1 637 -1 -1 -1At.10 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 289 -1 463 -1 -1 -1 -1 -1 320 123 -1 236 -1 -1 -1At.11 -1 -1 -1 -1 -1 -1 -1 -1 -1 289 0 -1 -1 -1 -1 -1 -1 692 -1 -1 -1 -1 -1 -1 218At.12 220 -1 -1 670 -1 -1 -1 -1 -1 -1 -1 0 -1 -1 515 -1 695 -1 -1 -1 -1 -1 -1 -1 -1At.13 407 -1 -1 -1 -1 528 -1 -1 160 463 -1 -1 0 -1 286 -1 -1 -1 383 -1 -1 -1 -1 -1 -1At.14 -1 -1 -1 -1 -1 -1 144 222 -1 -1 -1 -1 -1 0 220 548 -1 -1 -1 -1 -1 -1 -1 -1 -1At.15 -1 -1 -1 -1 -1 -1 -1 -1 79 -1 -1 515 286 220 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1At.16 -1 307 -1 -1 -1 -1 567 -1 -1 -1 -1 -1 -1 548 -1 0 -1 -1 -1 521 -1 -1 913 -1 -1At.17 688 188 -1 -1 -1 -1 -1 -1 -1 -1 -1 695 -1 -1 -1 -1 0 716 543 -1 -1 -1 -1 -1 -1At.18 -1 -1 -1 -1 -1 -1 -1 418 -1 -1 692 -1 -1 -1 -1 -1 716 0 -1 -1 -1 -1 -1 -1 -1At.19 -1 -1 -1 -1 -1 341 -1 -1 -1 320 -1 -1 383 -1 -1 -1 543 -1 0 250 -1 -1 614 564 -1At.20 -1 -1 400 -1 -1 -1 194 -1 -1 123 -1 -1 -1 -1 -1 521 -1 -1 250 0 -1 -1 -1 -1 -1At.21 636 -1 554 -1 -1 -1 376 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 -1 353 -1 -1At.22 -1 -1 -1 -1 -1 -1 -1 -1 637 236 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 403 -1 -1At.23 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 913 -1 -1 614 -1 353 403 0 -1 -1At.24 -1 -1 572 350 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 564 -1 -1 -1 -1 0 -1At.25 -1 345 -1 -1 -1 179 -1 -1 -1 -1 218 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0

PST: Soluzione in uno spaziobidimensionale

PST: Soluzione in uno spaziotridimensionale

Studio ALPI ( data set Mario Negri)

• In un gruppo di 305 pazienti tumorali trattati con 5 FU ci sono 98 pazienti che sviluppano unarecidiva di tumore (evento) e 207(67.8%) chenon sviluppano la recidiva (non evento).

• Il data set è composto di 7 variabili indipendentie 2 dipendenti( evento- non evento).

• Il rapporto tra 98 e 207 è = 0.47

RAPPORTO A/B = 0.49; molto vicino a 0.47

A

B

USE OF ARTIFICIAL NEURAL NETWORKS (ANN) IN PREDICTING RESPONSE TO INFLIXIMAB TREATMENT IN

PATIENTS WITH CROHN'S DISEASE

Kohn Anna*, Grossi Enzo**, Mangiarotti Roberto*, Prantera Cosimo*

181 pazienti

Remissione: 136 pz

Non remissione: 45 paz

Rapporto= 0.33

b

aRapporto a/b= 0.34

128 pazienti:

64 responders

64 non responders

Rapporto= 1.0

ab

Rapporto a/b = 0.99

• Nei primi 30 pazienti consecutivi il tasso dirisposta è pari al 50% ovvero la frequenza deidue eventi identica.

• Ci aspettavamo che la elaborazione con PST dimostrasse un rapporto dei due assi = 1.0

A

BRapporto A/B = 0.52

Ringraziamenti

nuovi strumenti virtuali per la sperimentazione clinica 2012/relazione enzo grossi.pdf ·...

Documents