kÉpjellemzŐk tÁvolsÁgÁn alapulÓ digitÁlis kÉpfelismerŐ mÓdszer

18
KÉPJELLEMZŐK TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER Szerző: GOGOLÁK László V. évfolyam Témavezető: Mgr. LUKITY Tibor egyetemi tanársegéd 7. Vajdasági Magyar Tudományos Diákköri Konferencia

Upload: wang-jensen

Post on 04-Jan-2016

34 views

Category:

Documents


1 download

DESCRIPTION

7. Vajdasági Magyar Tudományos Diákköri Konferencia. KÉPJELLEMZŐK TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER. Szerző: GOGOLÁK László V. évfolyam Témavezető: Mgr. LUKITY Tibor egyetemi tanársegéd. Bevezet ő. A digitális képek matematikai ábrázolása - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

KÉPJELLEMZŐK TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ

MÓDSZER

Szerző: GOGOLÁK László V. évfolyam

Témavezető: Mgr. LUKITY Tibor egyetemi tanársegéd

7. Vajdasági Magyar Tudományos Diákköri Konferencia

Page 2: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Bevezető

• A digitális képek matematikai ábrázolása

• Egy matematikai algoritmus bemutatása amely alkalmazható digitális képek teljes pontosságú felismerésére.

• Matematikai algoritmus tesztelése híres képalkotások felismerésére.

• Az algoritmus implementálása a Matlab programcsomag környezetére.

Page 3: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A digitális kép

• A kép színek variációja a térben.

• A digitális kép - két dimenzióban elhelyezkedő képpontok (pixelek) halmaza által van ábrázolva

• Származás » Scannelés ( analóg kép digitalizálása)» Digitálisan létrehozott kép (digitális kamera)

Page 4: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Digitális kép ábrázolása

• A kép N pixel-sorból és M pixel-oszlopból áll.

• Az N és M egész számok határozzák meg a kép nagyságát.

• Az f(x,y) képfüggvény valamint az x,y koordináták értékei egyaránt diszkrét mennyiségek.

Page 5: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Digitális kép ábrázolása

• A külömböző matematikai műveletek elvégzéséhez a pixeleken, szükség van a képek mátrixos ábrázolására.

Page 6: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A Digitális kép színrendszerei

• RGB (Red, Green, Blue) színrendszer

• CMY (Cyan, Magenta, Yellow) színrendszer

• HSV (Hue, Saturation, Intensity)» Hue (színárnyalat) – Megmutatja melyik színárnyalat» Saturation (telítettség) – Színárnyalat telítettsége» Intensity (intenzitás) – A szín fényereje

Page 7: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A kép histogramja• A hisztogram a kép pixeleinek tónusuk

szerinti gyakoriság-eloszlását mutatja

Page 8: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A kép H-tagjának hisztogramja

Page 9: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A képfelismerés

• Előre definiált kép-adatbázis alapján, felismerni, azonosítani egy “ismeretlen” képet.

Adatbázis:

“Ismeretlen” kép azonosítása

* A sikeres felismeréshez a keresendő képnek szerepelnie

kell a kép-adatbázisban !

*

Page 10: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A kép vektor-képjellemző reprezentációja

Φ(A) =[ H1, H2, H3, …., H255]T .

Φ(A) az A kép vektor reprezentációja, mely a kép megfelelő képjellemzőit tartalmazza.

Esetünkben a kép H (hue - árnyalat) komponens értékeit tartalmazza,

Képfelismerő algoritmusunk 255 színárnyalatot használ.

Page 11: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

A távolságfüggvény Az A és B képek közötti távolságfüggvény, dΦ

definíciója

ahol d valós vektortérben értelmezett távolságfüggvény. Esetünkben,

A távolságfüggvény megmutatja hogy a két kép mennyiben külömbözik egymástól.

Page 12: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Az algoritmus előkészítése

• A képadatbázis létrehozása» A felismerésre szánt képek formázása» Az adatbázis képek színkomponenseinek (HSI)

feldolgozása és eltárolása

• Az adatbázis 20 kép adatait tartalmazza

B = {Ai | i=1,2,3…20 }

A= [ aij] NxM

Page 13: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Az algoritmus

Legyen X az adott ismeretlen kép. Az X kép

megfelelője a bázisban az A* kép, ahol

Az ismeretlen kép ahhoz a képhez áll

legközelebb amelyikre a távolságfüggvény

minimum értékű lesz.

Page 14: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Implementálás a MATLAB programcsomagba – ADATBÁZIS

s11=imread(‘bazis1.jpg'); Kép beolvaasásahs11=RGB2HSV(s11); RGB-ből HSI-behs11_255=uint8(round(hs11(:,:,1)*255)); Az árnyalatok

skalirozása 0 és 255 értékek közéH11=imhist(hs11_255); A H komponens histogramjaH_val(1,:)= H11'; A képek H komponens histogramjának

elmentése egy változóba

A beolvasást mind a 20 képre el kell végezni, hogy megkapjuk a teljes kép-adatbázist

Page 15: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Implementálás a MATLAB programcsomagba – FELISMERÉSx=imread(s); Az ismeretlen kép beolvaasása

HX=RGB2HSV(x); RGB-ből HSI-be

HX_255=uint8(round(hx(:,:,1)*255)); Az árnyalatok skalirozása 0 és 255 értékek közé

Hx=imhist(hx_255); A H komponens histogramja

[m n]=size(x); Az ismeretlen kép méretének meghatározása

for i=1:20 A távolság függvény számítása

raz(i)=sum(abs(H_log(i,:)-Hx')); end

[c I]=min(raz); A legkissebb távolságfüggvény érték keresése

Page 16: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Az adatbázisban szereplő képek listája.

Kísérleti eredmények

Az képek felismerése 100 % pontosságú az adatbázis 20 képén tesztelve.

Leonardo Da Vinci – Az utolsó vacsora, Mona Lisa,

Vinsent Van Gogh – Önarckép, Napraforgók

Csontváry Kosztka Tivadar – Keleti Pályaudvar

Munkácsy Mihály – Honfoglalás, Poros Út, Majális, Cigánytábor

Salvador Dali – Az emlékezet állandósága, Alvás

Edvard Munch – A kiáltás

Boticelli – Vénusz születése

Velazquez – Az udvarhölgyek

John Constable – Szénásszekér

Jan Van Eyck – Az Arnolfilni házaspár

Michelangelo – Ádám születése

Még más ismeretlen szerző képei....

Page 17: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Befejezés

• A kifejlesztette eljárás nagy előnye az egyszerűsége ami a felismerés gyorsaságára nagymértékben kihat.

• Az eljárás nem használható minimálisan eltérő képek felismerésére.

• Nem tud felismerni olyan képet amelynek képjellemzői hiányosak az adatbázisban

• Az eljárás kiegészíthető más képjellemzők bevonásával melyek lehetővé teszik a rosszabb képminőségű képek felismerését is.

Page 18: KÉPJELLEMZŐK  TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER

Szakirodalom

1) Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing, Second Edition, Pretince Hall, 2002.

2) Tibor Lukic, Natasa Sladoje, and Joakim Lindblad, Deterministic Defuzzication Based on Spectral Projected Gradient Optimization, Springer-Verlag, LNCS 5096, pp. 476-485, 2008.

3) Joakim Lindblad, Natasa Sladoje, and Tibor Lukic, Feature Based Defuzzification in Z2 and Z3 Using a Scale Space Approach, Springer-Verlag, Volume 4245 of LNCS, pp. 378--389, 2006.

4) Stoyan Gisbert, Takó Galina, Numerikus Módszerek 1. és 2., ELTE, Budapest, 1993.