fundamente de sisteme biologice Şi …adrianaa/teaching/fim/fim_cursul_05.pdf · actual) structura...

FUNDAMENTE DESISTEME BIOLOGICE ŞI

INFORMATICĂ MEDICALĂ

Cursul 526-10-2010

Ş.l.dr.ing. Adriana [email protected]

www.aut.upt.ro/~adrianaa

mailto:[email protected]

2

Sisteme decizionale (partea a treia)reţele neuronale artificiale (RNA)

Conţinut

3

Reţele neuronale artificiale

Inspirate din punct de vedere structural şifuncţional de creierul fiinţelor viiReprezintă un model matematic simplificat alsistemului nervos centralIdeea conceperii unei astfel de structuri aapărut odată cu recunoaşterea faptului cămodul în care creierul raţionează e diferit demaniera folosită de calculatoarele convenţio-nale, acestea din urmă luând deciziile pe bazaunor algoritmi şi reguli

4


Colecţie vastă de arhitecturi şi algoritmi deînvăţareCapabile să

asimileze noiasocieritiparedependenţe funcţionale

se adapteze mediului specific problemei pentrucare sunt utilizate

5


Avantaje:au posibilitatea de a lucra cu date imprecise sauincompleteprezintă abilitatea de a generaliza, putând operacu date de intrare care nu le-au fost prezentate întimpul procesului de antrenareposedă capacitatea de amemora informaţiipot realiza asocieri, clasificări, recunoaşterioferă posibilitatea utilizării lor în aplicaţii în timpreal

6


Alte caracteristicisisteme puternicedeţin tehnici sofisticate capabile de a modelafuncţionalităţi complexesunt uşor de utilizat

învaţă din exempleutilizatorul trebuie să aibă doar unele cunoştinţe privindselecţia şi pregătirea datelor de intrare, alegerea unui tipde reţea şi interpretarea rezultatelor

7

Neuronul biologic

Reţelele neuronale artificiale încearcă săreproducă (atâta cât se poate la momentulactual) structura creieruluiCreierul este alcătuit din aproximativ 1011

celule puternic interconectate (cam 104

conexiuni pe celulă), numite neuroniToate funcţiile creierului, inclusiv memorarea,sunt reţinute în aceste celule şi în conexiuniledintre ele

8

Neuronul biologic

Un neuron este format din trei părţi:dendritele (intrările neuronului) – fibre nervoasereceptive, au o structură arborescentă şi transmitsemnale electrice spre corpul celuleisoma (corpul celulei) – însumează semnaleleprimite şi în funcţie de valoarea obţinută producesau nu un semnalaxonul (ieşirea neuronului) – o fibră lungă cetransmite semnalul de la corpul celulei spre alţineuroni

Contactul dintre axonul unei celule şi odendrită a unei alte celule se numeşte sinapsă

9

Imagine simplificată a doi neuroni

10

Neuronul biologic

Plasarea neuronilor şi calitatea legăturilordintre ei determină modul de funcţionare areţelei neuronaleO parte a structurii neuronale este definită lanaştere; restul se dezvoltă pe parcursul vieţiiprin procesul de învăţare, proces caredetermină apariţia, dispariţia sau modificareadin punct de vedere chimic a conexiunilordintre neuroni

11

Neuronul biologic

FuncţionareCorpul celulei primeşte informaţii de la alţineuroni prin intermediul conexiunilorsinaptice ajustabileDacă valorile intrărilor determină activareaneuronului, atunci se vor produce impulsurinervoase, transmise prin intermediulaxonului spre alţi neuroni

12

Modelul neuronului artificial

Pe baza caracteristicilor neuronului biologicse poate construi neuronul artificialPăstrează aceeaşi structură:

un corp format dintr-un sumator şi o funcţie detransfero serie de intrări care ajung în corpul celulei prinelemente similare dendriteloro ieşire care simulează axonul

13

p1

p2

pn

INTRĂRI

pondere

w1

ponderew2

pondere

wn

∑ f ieşirey


14


Intrări – datele iniţiale sau ieşirile altor neuroniFiecare intrare are o conexiune numită sinapsă

caracterizată de o ponderevaloarea intrării este multiplicată cu această pondereconexiunea defineşte influenţa pe care intrarea o areasupra neuronului

Intrările ponderate sunt însumateIeşirea sumatorului reprezintă intrarea unei funcţiide transfer (numită şi funcţie de activare)Această funcţie determină ieşirea neuronului, carepoate reprezenta rezultatul problemei sau intrarepentru alţi neuroni

15


Funcţionare:

f – funcţie de transfer– vectorul ponderilor– vectorul de intrare

Funcţiile de transfer pot fi liniare sauneliniare şi sunt alese în raport cuspecificaţiile problemei care trebuie rezolvată

)x(fy = ∑=

=n

1iii pwx

[ ]Tn21 w...,,w,wW =

[ ]Tn21 p...,,p,pP =

16


Cele mai utilizate funcţii de transfer sunt:funcţia liniarăfuncţia treaptă (prag)funcţia prag simetrică (signum)funcţia de tip gaussianfuncţia sigmoidalăfuncţia tangentă hiperbolicăfuncţia de saturaţie (limitare)funcţia de saturaţie simetrică

17

Arhitecturi ale reţelelor neuronale

Pentru a crea o reţea neuronală artificială e necesar afi puşi laolaltă un număr de neuroniAceştia sunt aranjaţi pe mai multe straturi (niveluri)O reţea trebuie să aibă

un număr de intrări (prin care primeşte valorilevariabilelor externe)un nivel de neuroni care produc ieşirea (predicţia,rezultatul problemei)

Intrările şi ieşirile unei reţele neuronale artificialecorespund nervilor senzoriali, respectiv motorii aicorpului umanO reţea neuronală poate de asemenea conţine unnumăr de straturi ascunse de neuroni

18

Arhitecturi ale reţelelor neuronale

Există două mari tipuri de reţele neuronaleartificiale:feedforward – cu propagare progresivă

principala caracteristică a acestor reţele este faptul că unneuron primeşte semnale doar de la neuroni dinstratul/straturi precedent/precedente

feedback – recurente sau cu propagare regresivăaceste reţele sunt caracterizate de faptul că există unsemnal de reacţie din partea neuronilor de ordinsuperior, pentru cei de pe straturi inferioare sau chiarpentru ei înşişi

19

INTRĂRI

Ieşire

Niveluri ascunse Nivel de ieşire

Arhitectura unei reţele feedforward

20

Arhitectura unei reţele feedback

21

Antrenarea reţelelor neuronale

O reţea neuronală artificială poate fi antrenatăpentru a rezolva o anumită problemăpentru a avea un anumit comportament

Pe parcursul acestui proces, numit şi învăţaresau instruire, se produce schimbareaparametrilor reţelei:

ponderifuncţie de transferarhitectura

22

Antrenarea reţelelor neuronale

Învăţarea reprezintă modificarea permanentăa comportamentului pe baza experienţeiÎn funcţie de modul în care sunt modificaţiparametrii reţelei neuronale pe parcursulprocesului de instruire, se disting două tipuride învăţare:

supervizatănesupervizată

23

Învăţarea supervizată

Este caracterizată de prezenţa unui„supervizor” care cunoaşte legătura corectădintre intrări şi ieşiriCând o intrare este aplicată reţelei, se cunoaşteşi ieşirea dorită asociată respectivei intrăriPe parcursul procesului de învăţare

ieşirea oferită de reţea este comparată cu ieşireaţintăparametrii reţelei sunt ajustaţi astfel încât diferenţadintre cele două (numită eroare) să fie minimizată

24


Pentru a învăţa, o astfel de reţea neuronalăare nevoie de un set de valori de intrare,împreună cu ieşirile corecte (ieşirile ţintă)Dacă problema care trebuie rezolvată este dindomeniul medical

intrările = simptome, teste de laborator şi alteanalize specifice (chiar din domeniul imagisticiimedicale)ieşirea = diagnosticul sau altă predicţie

25


În cazul acestui tip de învăţare trebuie să seţină cont de următoarele două probleme:

din setul de antrenare se reţine un subset pentrutestare (care nu este utilizat pe parcursul stabiliriiparametrilor reţelei)se menţine un nivel acceptabil de eroare pe setulde antrenare pentru a evita supra-învăţarea(învăţarea detaliilor nesemnificative aleexemplelor folosite pentru antrenare)

26


Aşadar algoritmii utilizaţi pentru învăţareasupervizată se bazează pe corecţia erorilorAcest lucru se poate realiza prin modificareaparametrilor reţeleiCea mai simpla metodă constă în modificareaponderilorStructura algoritmilor cuprinde două etapeprincipale:

iniţializarea parametrilorajustarea lor printr-un proces iterativ

27


Backpropagation (propagarea regresivă aerorilor)

unul dintre cei mai utilizaţi algoritmi de corecţie aerorilorare loc transmiterea prin reţea a semnalului deeroare în sens invers faţă de modul în caresemnalele circulă în faza de funcţionare

Alţi algoritmi folosiţi pentru învăţareasupervizată:

sunt Widrow-Hoff (sau regula Delta)Boltzman (sau stocastic).

28

Învăţarea nesupervizată

Nu există un element „supervizor” care săaprecieze corectitudinea asocierilor dintreintrări şi ieşiriRăspunsul dorit nu e cunoscut⇒ nu sunt disponibile informaţii legate deeroare, care să fie folosite pentruîmbunătăţirea comportamentului reţeleineuronale

29


Trebuie implementat un mecanism deînvăţare care să autoadapteze parametriireţeleiPe baza semnalelor de intrare primite dinpartea mediului, sistemul descoperă trăsăturicaracteristiceAcest tip de învăţare este potrivit operaţiilorde clasificare

regula de includere a unui element într-o anumităclasă este dată de distanţa la care se află elementulfaţă de centrul unei clase

30


Reţelele neuronale care folosesc algoritmi deînvăţare nesupervizată trebuie să descopere

regulitipareposibilităţi de separare

Printre algoritmii utilizaţi în procesul deînvăţare nesupervizată se numără:

algoritmul Hebbianalgoritmul competitiv

31

Aplicaţii ale reţelelor neuronale artificiale în medicină

32

Aplicaţii ale RNA în medicină

Principalul avantaj al utilizării reţelelorneuronale artificiale este legat de faptul căacestea au capacitatea de a rezolva problemecare

sunt prea complexe pentru tehnologiileconvenţionalenu au o soluţie algoritmică

Aceste caracteristici apar adesea în medicină

33

Aplicaţii ale RNA în medicină

Din acest motiv reţelele neuronale artificialeau fost aplicate cu succes în sisteme pentru

diagnozăsunt foarte potrivite în domeniul diagnozei deoarece nuau nevoie de un algoritm referitor la modul deidentificare a unei afecţiuniele învaţă din exemple, aşadar au nevoie doar de un setde exemple reprezentative pentru toate variaţiilerespectivei boli

analize biomedicaleanaliza imaginilor medicaledezvoltări în domeniul farmaceutic

34

Cardiologie

Analiza nivelului de enzime limfatice stă labaza diagnosticării infarctului miocardicO reţea neuronală a fost antrenată pentruanaliza nivelului acestor enzime şi deasemenea a EKG-ului, simptomelor şimodificărilor apărute după administrarea demedicamente (nitroglicerină)

35

Gastroenterologie

A fost realizată o reţea neuronală pentruprevederea modului în care pacienţii suportăhepatectomia (rezecţia chirurgicală a uneiparţi a ficatului)Au fost folosiţi 54 de pacienţi pentru procesulde învăţare şi 11 pentru testare

36

Pneumologie

Medicii ftiziologi, împreună cu radiologii aulucrat la dezvoltarea unui sistem pentruclasificarea nodulilor pulmonari

37

Oncologie

Cancerul la sân este a doua cauză amortalităţii datorită cancerului în rândulfemeilorSunt disponibile aplicaţii pentrudiagnosticarea şi selecţia unei strategiiterapeutice în ceea ce priveşte cancerul de sânExistă RNA care determină posibilitateareapariţiei tumorilor analizând informaţiilegate de dimensiunea tumorii sau numărulnodulilor

38

Oncologie

Cancerul de plămâni este o altă afecţiunemortalăInformaţiile obţinute prin radiografie,tomografie computerizată, rezonantămagnetică, bronhoscopie şi biopsie pot fiutilizateO RNA a fost realizată pentru identificareacelulelor canceroase din imaginile biopsieirealizate persoanelor ce urmau a fidiagnosticate

39

Otorinolaringologie

Reţelele neuronale s-au dovedit a fi o metodăeficientă în modelarea auzuluiAceastă tehnică poate deveni folositoarepentru înţelegerea, modelarea vorbirii şitratarea problemelor de auz

40

Obstetrică şi ginecologie

Reţelele neuronale au fost utilizate pentrudeterminarea riscului administrării perinatalea medicamentelor precum şi pentru evi-denţierea parametrilor care influenţeazăgreutatea noului născut

41

Oftalmologie

Reţele neuronale artificiale au fost aplicate şiîn diagnosticarea deformaţiilor de cornee

42

Radiologie

Imaginile conţin o cantitate mare deinformaţii şi sunt atât de complicate încât esteimposibil să fie interpretate utilizândsistemele convenţionale bazate pe reguliSelectând seturi de exemple şi procedee deînvăţare potrivite, reţelele neuronale suntutilizate cu succes în detecţia unor boliarteriale, microcalcifiere în mamografiidigitale, diferenţierea bolilor de ficat

43

Citologie

Celulele maligne pot fi recunoscute cuajutorul reţelelor neuronale artificialeAcestea sunt folosite pentru a identificamodificări precancerose sau canceroase încancerul cervical, maximizând astfel şanselede vindecare

44

Genetică

O reţea neuronală a fost antrenată pentruclasificarea cromozomilor, bazat pe informaţiireprezentând forma, dimensiunea şi legăturilecromozomilor

45

Utilizarea reţelelor neuronale artificiale pentru realizarea de

predicţii referitoare la tratamentul hepatitei C

46

Predicţii pentru hepatita C

Hepatita C este o boală gravă şi frecventă,împotriva căreia nu există vaccin, iar evoluţiasa trebuie atent urmărită pe parcursultratamentuluiChiar dacă aceste tratamente suntîmbunătăţite continuu, totuşi infecţia cuvirusul hepatitei C rămâne o problemă îndiscuţie pentru următorii ani

47


Pacienţii luaţi în considerare au fost observaţide-a lungul a 12 luni pentru a stabili influenţape care tratamentul o are asupra evoluţieiunor indicatori biologiciAu fost aplicate trei scheme diferite detratament:

Interferon Simplu (IFN);Peg interferon α-2a;Peg interferon α-2b.

48


Sistemul realizează predicţii privind modul încare pacientul evoluează în funcţie detratamentul administratAceste predicţii sunt deosebit de utiledeoarece:

tratamentul hepatitei C este foarte scumppot apărea efecte adverse

Este deci foarte important a fi identificaţi aceipacienţi care au şanse mari de a reacţionapozitiv la tratament, astfel încât ceilalţi să fieprotejaţi de un tratament fără beneficii

49


Parametrii biologici au fost determinaţi dintrei în trei luniEvoluţia lor în timp a fost monitorizatăîncercându-se determinarea unor relaţii întrevalorile indicatorilor biologici (TGP, TGO,GGT, ARN VHC) şi timp, pe grupe depacienţi realizate în funcţie de răspunsul latratament

50


Tipurile de răspuns la tratament sunt:0 – pacientul răspunde la tratament1 – nu răspunde la IFN2 – nu răspunde la Peg IFN3 – recădere la IFN4 – recădere la Peg IFN5 – întreruperea tratamentului datorită efecteloradverse

51


Tipul de răspuns la tratament este aşadarstrâns corelat cu evoluţia indicatorilorbiologici TGP, TGO, GGT şi ARN VHCUtilizând o serie de reţele neuronaleartificiale, se fac sugestii despre tendinţa decreştere, de scădere sau de staţionare avalorilor celor patru indicatori biologici dintrei în trei luni, pe parcursul a 12 luni detratament

52


Sistemul este implementat în Matlab, mediucare are un instrument specializat îndezvoltarea reţelelor neuronaleSunt utilizate reţele neuronale de tipfeedforward, cu algoritm de învăţarebackpropagation

53


ARN VHC 0L

GGT 0L

TGO 0L

TGP 0L

TGP 12LTGP 9LTGP 6LTGP 3LNet TGP3 Luni

Net TGP6 Luni

Net TGP9 Luni

Net TGP12 Luni

TGO 12LTGO 9LTGO 6LTGO 3LNet TGO

3 LuniNet TGO

6 LuniNet TGO

9 LuniNet TGO12 Luni

GGT 12LGGT 9LGGT 6LGGT 3LNet GGT

3 LuniNet GGT

6 LuniNet GGT

9 LuniNet GGT12 Luni

ARN VHC 12LARN VHC 9LARN VHC 6LARN VHC 3L

Net ARN VHC

3 Luni

Net ARN VHC

6 Luni

Net ARN VHC

9 Luni

Net ARN VHC

12 Luni

VârstăSex

LocaţieTratament

Scorul KnodellFibroza

54


Sistemul a fost proiectat ca o reţea de reţeleneuronaleFiecare reţea neuronală are:

un strat cu 10 neuroni ascunşio ieşireun număr variabil de intrări

Pentru fiecare din cei patru indicatoribiologici studiaţi există patru straturi de reţeleneuronale

55


Reţelele de pe primul strat primesc ca date deintrare: vârsta pacientului, sexul, locaţia(rural/urban), schema tratamentului,răspunsul Knodell, scorul fibrozei hepaticeprecum şi valoarea parametrului pentru carese face predicţia la momentul iniţial (înaintede începerea tratamentului)Aceste reţele au ca ieşire valoareaparametrului la 3 luni

56


Reţelele de pe straturile următoare au aceeaşistructură ca şi cele de pe primul strat numaică au în plus ca intrări ieşirile reţeleloromoloage de pe straturile inferioareAstfel se va ajunge ca reţele de pe ultimulstrat să aibă în loc de şapte intrări (ca reţelelede pe primul strat), zece (intrările iniţiale, lacare se adaugă valorile indicatorilor biologicila 3, 6 şi 9 luni de tratament).

57


Avantajul acestei arhitecturi este că datelesunt prelucrate separat pentru fiecareindicator biologicDezavantajul constă în faptul că erorile sepropagă prin sistem deoarece rezultatelereţelelor de pe primele niveluri (împreună cuerorile lor) sunt folosite de reţelele de peurmătoarele niveluriAcest dezavantaj însă poate fi minimizat prinalgoritmul de învăţare

58


Aşa cum s-a arătat, reţeaua neuronală are oarhitectură fixă, antrenarea ei realizându-seprin modificarea ponderilorÎnvăţarea constă în două etape:

iniţializarea parametrilorprocesul iterativ de ajustare a lor

Aşadar calitatea reţelei neuronale nu depindedoar de felul în care sunt modificateponderile ei, ci şi de valorile iniţiale aleacestora

59


Din acest motiv, fiecare din cele 16 blocuri alearhitecturii reprezintă cea mai bună reţea din500 astfel de reţele create şi antrenatePentru a determina care este cea mai bunăreţea, se foloseşte un set de pacienţi testReţeaua cu acurateţea cea mai mare (din cele500 create) este reţinută şi utilizată înpredicţie

60


Acurateţea reţelelor neuronaleNet TGP Net TGO

3 luni 6 luni 9 luni 12 luni 3 luni 6 luni 9 luni 12 luni

94.40% 82.86% 78.26% 83.33% 91.94% 82.85% 95.65% 77.78%

Net GGT Net ARN VHC

3 luni 6 luni 9 luni 12 luni 3 luni 6 luni 9 luni 12 luni

91.67% 85.71% 76.93% 82.73% 92.68% 80.00% - -

61


Analizând tendinţa evolutivă a celor patruindicatori biologici, un medic poate estimadacă pacientul va răspunde sau nu la unanumit tratamentPentru a obţine aceste informaţii, el trebuie săintroducă o serie de date ale pacientului carevor fi interpretate de reţelele neuronale

63

Problemă

Utilizaţi reţelele neuronale artificiale înrealizarea unui sistem decizional

64

Bibliografie

1. Adriana ALBU: “Stabilirea de baze de datepentru diagnosticarea hepatitelor virale prinanaliza imaginilor ficatului obţinute printomografiere” – Teză de doctorat, EdituraPolitehnica, 2006

65

Vă mulţumesc pentru atenţie

fundamente de sisteme biologice Şi …adrianaa/teaching/fim/fim_cursul_05.pdf · actual) structura...

Documents