algorytmy graficzne - strona główna · modele barw. charakterystyki obrazu. reprezentacja i opis....
Post on 01-Mar-2019
219 Views
Preview:
TRANSCRIPT
2
Zagadnienia, wykład, laboratorium
Wykład:
Światło i barwa. Modele barw.
Charakterystyki obrazu. Reprezentacja i opis.
Kwantyzacja skalarna i wektorowa obrazów cyfrowych.
Wyszukiwanie obrazów cyfrowych ze względu na treść.
Obrazy binarne i ich przetwarzanie.
Obrazy barwne i ich przetwarzanie.
Metody przetwarzania obrazu w dziedzinie przestrzennej.
Algorytmy kompresji danych obrazowych.
Wykład kończy się pisemnym zaliczeniem (ostatnie zajęcia w semestrze, 20 punktów).
Literatura:
Rafael C. Gonzalez, Richard E. Woods, „Digital Image Processing
Oceny
Zaliczenie pisemne: >10 punktów oraz
[26,30] – 3; [31-35] – 3+; [36,40] – 4; [41,45] – 4+; [46-50] - 5
Laboratorium:
Problemy do rozwiązania omawiane na wykładzie. Czas realizacji od 1 do 4 tygodni.
Maksymalnie: 30 punktów.
Możliwość zdobycia punktów na wykładzie.
3
Obszar zainteresowań wykładu
Dziedziny związane z tworzeniem i przetwarzaniem obrazów cyfrowych:
grafika komputerowa – generowanie obrazów, tworzenie obrazów sztucznych, przetwarzanie
obrazów naturalnych. Celem jest stworzenie obrazu,
cyfrowe przetwarzanie obrazów – celem jest wydobywanie lub podkreślanie istotnych informacji
zawartych w obrazie,
computer vision (widzenie komputerowe)
in/out obraz opis
obraz przetwarzanie obrazów (image processing)
computer vision (widzenie komputerowe)
opis grafika komputerowa sztuczna inteligencja
4
Układ wzrokowy człowieka
Siatkówka. Wyściela dno oka. Uważa się, że stanowi najbardziej wysuniętą na zewnątrz część mózgu.
Plamka żółta stanowi centralny obszar siatkówki i wraz dołkiem centralnym (fovea) jest obszarem najostrzejszego widzenia. Jednym z zadań zwężającej się źrenicy jest skupienie strumienia światła na plamce żółtej. Dlaczego nadmiar światła w oku jest niepożądany?
Komórkami fotoreceptorowymi oka są pręciki i czopki. Ich położenie oraz proporcje zależne są od konkretnego regionu siatkówki. Czopki dominują w regionach centralnych (plamka żółta i dołek centralny) tworząc obszar widzenia o największej rozdzielczości. Wraz z oddalaniem się od plamki żółtej maleje ilość czopków, przy jednoczesnym wzroście liczby pręcików. Plamka ślepa jest obszarem braku fotoreceptorów.
Związkiem absorbującym światło w pręcikach jest rodopsyna o maksimum absorpcji dla fal długości 500nm. Dla czopków istnieją trzy różne związki absorbujące (jodopsyny) o maksimach absorpcji 450nm, 530nm oraz 570nm, przy czym pojedynczy czopek zawiera jeden rodzaj opsyny.
Dwa systemy widzenia: pręcikowy (nocny, skotopowy) oraz czopkowy (dzienny, fotopowy). Przełączanie systemów regulowane jest przez natężenie światła docierającego do oka.
Proporcje pomiędzy pręcikami i czopkami zależą od trybu życia organizmu (u człowieka stosunek pręcików do czopków wynosi ok.. 120:6).
W oku zachodzi silna redukcja (i przekształcanie) informacji nie tylko przez rozpraszanie i absorpcję światła padającego na komórki pigmentowe, ale również przez uśrednianie sygnałów pochodzących z poszczególnych receptorów (pola receptorowe).
Absorpcja fotonów i wywołane tym reakcje można uważać za pierwszy etap procesu przetwarzania informacji niesionej przez promieniowanie elektromagnetycznie przez organizm.
Rys. (a) schemat ludzkiego oka, (b) schemat budowy pręcika i czopka.
a
b
5
Cechy detekcji ludzkiego oka (1)
Efekt pasm Macha (efekty graniczne, złudzenie kontrastu brzegowego) tłumaczy się zjawiskiem hamowania obocznego sąsiednich fotoreceptorów lub pól receptorowych. Prowadzi to do odczucia rozjaśnienia części jasnej i przyciemnienia części ciemnej wzdłuż granicy pól. Hamowanie oboczne interpretuje się jako proces wzmacniania poziomu sygnału do szumu (zwiększania kontrastu).
Rozdzielczość przestrzenna jest związana z gęstością upakowania fotoreceptorów w siatkówce. W określonych warunkach dwa punkty zewnętrzne emitujące światło są percepowane jako jeden punkt świetlny.
Rozdzielczość przestrzenna związana jest z natężeniem sygnału. Spadek natężenie sygnału pociąga za sobą poszerzenie otworu źrenicy, zwiększenie rozpraszania światła w gałce ocznej i zmniejszenie kontrastu (pobudzenie pól receptorowych o mniejszej rozdzielczości w peryferyjnych obszarach siatkówki).
Adaptacja do poziomu oświetlenia wiąże się z koniecznością przejścia z systemu czopkowego na pręcikowy lub odwrotnie Efektami adaptacji tego typu są m. in. oślepienie wskutek działania silnego bodźca świetlnego (globalne podwyższenie progu pobudzenia fotoreceptorów), utrzymujące się oślepienie po ustaniu działania bodźca, niższa wrażliwość na ciągłe zmiany jasności (natężenia) niż na zmiany skokowe (nieliniowa wrażliwość na zmiany jasności).
Prawo Webera – progowa wielkość dostrzegalnej różnicy jasności, I, jest proporcjonalna do wartości bodźca początkowego, I, tzn. I/I 0.02=const. Prawo to nie stosuje się dla skrajnie dużych i
małych wartości bodźca.
Kontrast równoczesny luminancji oraz barwy
Rozdzielczość czasowa (efekt stroboskopowy).Rys. Efekt pasm Macha (kontrast graniczny) wywołany przez
hamowanie oboczne pól receptorowych w ludzkim oku.
6
Cechy detekcji ludzkiego oka (2)
Rys. Zjawisko kontrastu jednoczesnego (a) luminancji oraz (b) barwy (chrominancji). W pierwszym przypadku pole znajdujące się na ciemniejszym tle wydaje się jaśniejsze w stosunku do identycznego pola na jaśniejszym tle.
W drugim przypadku dwa identyczne pola czerwone wydają się być różne pod względem barwy. Pole na niebieskim tle wydaje się być cieplejsze i o większym nasyceniu niż pole na tle żółtym.
a
b
7
Złudzenia wieloznaczne (sylwetki alternatywne)
ab
Rys. Sylwetki alternatywne: twarz i puchar. (a) – interpretacja obrazu jest zależna od definicji tła i obiektu. Wieloznaczna interpretacja rysunku (b) nie jest tak oczywista jak rysunku (a) (tzn. widać raczej puchar niż twarze).
10
Kontrast równoczesny – przykład 2
Rys. Pierścienie Koffka. Ilustracja kontrastu jednoczesnego luminancji.
a b
c
11
Światło i barwa
Elementem koniecznym zjawiska widzenia jest
triada optyczna (źródło światła, obiekt,
obserwator).
Barwa nie jest immanentną cechą obiektów
materialnych, ale wypadkową cech obiektu
(materiał, geometria), cech padającego
światła (skład fizyczny) oraz zjawisk
psychologicznych.
Czym jest światło?
Czym jest barwa?
Długość fali światła
[nm]
Wrażenie barwy przy postrzeganiu w warunkach
widzenia
fotopowego skotopowego
380-440 fioletowa
nie występuje
wrażenie barwy
440-470 Indygo
470-480 błękitna
480-490 niebieska
490-510 niebieskozielona
510-530 niebieskawozielona
530-560 zielona
560-580 żółtozielona
580-590 żółta
590-600 żółtopomarańczowa
600-610 pomarańczowa
610-620 pomarańczowoczerwona
620-780 czerwona
12
Czym jest barwa?
Światło odbite od poszczególnych pól powyższej sekwencji i rejestrowane przez ludzkie oko jakościowo identyczne. Różni się jakością.
Do opisu wrażenia wywołanego działaniem każdego bodźca świetlnego używa się wielkości ilościowych (jasność) oraz
jakościowych (chromatyczność):
jakość (chromatyczność) - odcień oraz nasycenie
ilość (jasność) - luminancja
Barwa (wrażenie barwne) jest wrażeniem wzrokowym powstającym na skutek oddziaływania (w określonych
warunkach) fali świetlnej z materią (receptorami). Rodzaj wrażenia barwnego zależy od: cech fizycznych fali
świetlnej (właściwości promieniowania), zjawisk fizjologicznych zachodzących pod wpływem światła oraz zjawisk
natury psychologicznej.
Barwa jest atrybutem każdego wrażenia świetlnego postrzeganego w warunkach widzenia fotopowego i określa
jakość tego wrażenia (światła).
13
Trójpobudzeniowa teoria percepcji barw
Zgodnie z teorią trójpobudzeniową wrażenia barwne powstają na skutek działania fali świetlnej na trzy rodzaje receptorów siatkówki oka: czopków S (B-blue, niebieskie), M (G-green, zielone) oraz L (R-ed, czerwone). Każdy z rodzajów czopków posiada szczytową czułość dla różnych zakresów długości fali i jest zdolny pobrać światło tylko z jednego zakresu widma.
Wrażenie barwne (barwa uświadamiana) jest funkcją stosunku trzech
sygnałów: : :
Suma + + wpływa na odczucie jasności (luminancji) bodźca świetlnego.
Równocenne pobudzenie trzech receptorów : : =1:1:1 prowadzi do
wrażenia bieli lub szarości (w zależności od sumy sygnałów).
Na gruncie teorii trójpobudzeniowej można wyjaśnić zjawisko
metameryzmu: =const., =const., =const.
Wniosek: oko nie analizuje fizycznego składu spektralnego światła, ale
uśrednia (całkuje) docierający sygnał. Całe promieniowane
elektromagnetyczne zostaje zredukowane do trzech czynników (silna
redukcja informacji). Skoro tak, to w metodach uzyskiwania barwnych
obrazów rzeczywistości nie trzeba odtwarzać właściwości spektralnych.
Przyjmując, że padające na receptory światło opisane jest przez funkcję
rozkładu spektralnego E( ), na wyjściu czopków pojawiają się sygnały:
14
Metameryzm
Światła (bodźce barwowe) o czterech podanych wyżej rozkładach widmowych wywołują to samo wrażenie barwne (podane obok), są zatem percepcyjnie nierozróżnialne – są metamerami.
Bodźce świetlne różniące się rozkładem spektralnym mogą wywoływać to samo wrażenie barwne (wrażenie
barwy). Bodźce takie nazywane są metamerami, a zjawisko - metameryzmem.
Na podstawie właściwości spektralnych (skład widmowy, skład fizyczny) bodźca świetlnego można
określić wrażenie barwne jakie bodziec ten wywoła.
Zależność w przeciwną stronę nie jest prawdziwa, tzn. barwa nie implikuje składu widmowego bodźca
świetlnego.
Czerwone światło żarówki (widmo ciągłe) i czerwone światło lasera (światło monochromatyczne)– skład
fizyczny świateł różny, a wrażenie barwne może być identyczne. Prosty eksperyment: ta sama fotografia
kolorowa oglądana w świetle obu źródeł wygląda inaczej! Jak?
Zależność widmo-barwa jest zależnością typu wiele do jednego.
Jak wyjaśnić zjawisko metameryzmu na gruncie trójpobudzeniowej teorii widzenia
W zastosowaniach technicznych nie odtwarza się składu widmowego światła, ale jedynie składowe , ,
.
15
Prawa Grassmanna (1853)
Trzy prawa addytywnego mieszania bodźców barwowych (Grassmann – 1853)
Każdy bodziec barwowy (wrażenie barwy) może być odtworzony jednoznacznie przez addytywne
zmieszanie trzech odpowiednio dobranych bodźców podstawowych (niezależnych). Należy podkreślić,
że taka synteza addytywna nie odtwarza własności fizycznych bodźca, ale jedynie efekt (wrażenie),
jaki on wywołuje w układzie widzenia (oku).
Jasność bodźca wynikowego jest równa sumie jasności bodźców składowych.
Różne bodźce świetlne (różniące się rozkładem spektralnym) wywołujące to samo wrażenie barwy
zmieszane w jednakowych stosunkach z innych bodźcem świetlnym dają jednakowe nowe bodźce
barwowe, tzn. wywołują jednakowe wrażenia barwne.
Wniosek:
Wrażenie barwne można odtworzyć bez konieczności rekonstrukcji składu widmowego bodźca.
Podstawowy wniosek wykorzystywany w realizacjach technicznych reprodukcji barw obiektów
występujących w rzeczywistości.
W praktyce różne barwy uzyskać można na dwa różne sposoby: w drodze syntezy addytywnej i
subtraktywnej.
16
Addytywna synteza barw
Cechy modelu
Określone wrażenie barwne uzyskiwane jest poprzez zmieszanie świateł (barw) podstawowych.
Z reguły stosuje się mieszanie świateł: czerwonego (R), zielonego (G) i niebieskiego (B). Teoretycznie można użyć innych świateł (o innych barwach) ale wówczas gama (gamut) barw odtwarzanych jest mniejsza. Jednocześnie podobne efekty można uzyskać przez mieszanie więcej niż trzech świateł.
Równocenne połączenie barw podstawowych daje czystą biel. Zerowe składowe każdej z barw podstawowych dają czerń – brak barwy.
Wrażenie światła białego można też uzyskać przez zmieszanie tylko dwóch świateł. Barwy tych świateł są wówczas nazywane barwami dopełniającymi.
Zwykle przyjmuje się, że intensywności barw podstawowych R, G oraz B leżą w zakresie [0,1], a tym samym dostępne barwy opisywane są w sześcianie jednostkowym.
Stosuje się do opisu „źródeł” światła – monitory CRT, odbiorniki TV
Synteza addytywna zachodzić może przy niejednoczesnym mieszaniu barw (pod pewnymi warunkami. Jakimi?)
17
Subtraktywna synteza barw - 1
Cechy modelu
Barwami podstawowymi modelu są barwy dopełniające barw podstawowych R, G, B:
cyjan (niebiesko-zielona), purpura oraz barwa żółta
Model subtraktywny – barwy powstają poprzez selektywne usunięcie wybranego zakresu widma światła białego (filtracja, absorpcja)
Warunkiem koniecznym syntezy jest obecność światła białego oraz substancji o selektywnej absorpcji promieniowania świetlnego
Zastosowanie w poligrafii
Łatwość konwersji do barw modelu RGB
19
Barwa – potrzeba obiektywnego opisu
Istnieje potrzeba określania barwy w sposób
ścisły
obiektywny
precyzyjny
nadający się do przetwarzania komputerowego
bez konieczności korzystania z wzorników.
W praktyce powstało wiele sposób obiektywnego i numerycznego opisu barw
modele kolorymetryczne: CIE RGB, CIE XYZ, CIE UVW, CIE LUV
modele komputerowe i telewizyjne: RGB, HSV, YCbCR, YUV, YIQ.
20
Cechy barwy
Określenia fizyczne (fizykalne)
dominująca długość fali
zakres spektralny światła
natężenie
W zastosowaniach technicznych opis tego
typu jest nieefektywny. Dlaczego?
Określenia percepcyjne
odcień barwy (np. czerwony, niebieski,
zielony, żółty)
nasycenie (np. zielony, seledynowy,
oliwkowy, etc.) lub czystość pobudzenia
jasność
21
Jak opisywać barwy?
Istnieją dwie podstawowe metody określania barw:
wzorniki i atlasy barw publikowane w postaci tradycyjnej (wzorniki PANTONE, Villalobos,
Euroscala, atlasy barw Munsella oraz Ostwalda, etc.). Zawierają próbki numerowane i
usystematyzowane według określonych kryteriów. Istnieją rozwiązania elektronicznego pomiaru
koloru PANTONE (kolorymetry elektroniczne). Reprodukcja barw z katalogów PANTONE w druku w
oparciu o triadę CMYK nie zawsze jest możliwa. Sugeruje się stosowanie innych katalogów, np.
Euroscala.
Zalety: wygodne i naturalne w użyciu. Wady: nietrwałość wzorców, konieczność uwzględnienia
takich parametrów jak rodzaj podłoża.
metody kolorymetryczne oparte na trójchromatycznym mechanizmie widzenia człowieka:
dowolny bodziec świetlny opisuje się udziałami trzech bodźców podstawowych (prawa
Grassmanna).
patrz: www.pantone.pl
22
System barw Munsella - 1
Okrąg barw Newtona
[http://www.colorsystem.com]
Koncepcja Newtona okręgu barw pozwala interpretować odcień barwy (hue) jako wielkość przyjmującą wartości z przedziału 0-360 stopni i odłożoną na obwodzie koła. Nie istnieje więc pojęcie wartości minimalnych i maksymalnych odcienia.
23
System uporządkowania barw Munsella (1905) - 2
Przestrzeń trzech parametrów HVC systemu uporządkowania barw Munsella
System barw Munsella jest jednym z najstarszych i dotychczas powszechnie stosowanym sposobem opisu barw.
Parametry modelu: odcień, chroma (nasycenie), wartość (jasność).
Na osi wartości (oś z) położone są barwy achromatyczne (czerń, szarości, biel)
Wartość (value) leży w przedziale [0,10], nasycenie w przedziale [0,28] w zależności od konkretnej barwy
W 1942 ASO rekomendowała model Munsella jako standard oznaczania barwy powierzchni (np. gleby). Stosowany do zastosowań naukowych i przemysłowych, ale nie poligraficznych.
24
System uporządkowania barw Munsella (1905) - 3
Krąg barw Munsella
System Munsella:
5 barw głównych: Red, Yellow, Green,
Blue, Purple
5 barw rozszerzonych (pośrednich):YR
(pomarańczowy), GY (jasnozielony),
BG (cyjan), PB (fiolet), RP (róż)
Kręgi barw podzielone są na 10
segmentów, których środki
odpowiadają barwom głównym
Nazewnictwo barw zgodnie z
konwencją: H V/C. Przykład:
5RP2/12, 5RP5/26
Porównanie próbki barwy lub światła z
wzorcem jest procedurą subiektywną
Znacznie ograniczona przestrzeń barw
25
System uporządkowania barw Munsella (1905) - 4
Barwa 5PB w atlasie barw MunsellaReprezentacja przestrzenna modelu barw Munsella
http://www.daicolor.co.jp
26
Eksperyment kolorymetrii trójchromatycznej (idea)
Eksperyment zrównania (dopasowania, matching) barw. Zrównywanie bodźców odbywa się w odpowiednich warunkach, które mają zapewnić wyeliminowanie czynników psychologicznych i innych, takich jak struktura podłoża (widzenie makswelowskie).
Posługiwanie się wzornikami jest wygodne w praktyce, ale nieprecyzyjne (np. określenie barwy
zależy od rodzaju podłoża).
Kolorymetria dziedzina nauki, która ma na celu liczbowy opis wrażeń barwnych (obiektywny opis
chromatyczności bodźców barwowych). Metody kolorymetryczne opierają się na prawach
Grassmanna. Jak uzasadnić prawa Grassmanna?
Mieszanie bodźców podstawowych nie odtwarza fizycznie bodźca zadanego, ale jedynie
kolorymetrycznie, tzn. odtwarza wrażenie barwne, ale nie skład widmowy światła. Po
zrównaniu, próbka testowa oraz mieszanina barw podstawowych są metamerami.
27
Równanie barwy
Posługując się schematem eksperymentu kolorymetrycznego
uzyskuje się tzw. równanie barwy prezentujące fakt zrównania
bodźca świetlnego o zadanym rozkładzie spektralnym przez
mieszaninę trzech niezależnych bodźców podstawowych
Z drugiego prawa Grassmanna wynika, że zachodzi równanie
(pod warunkiem, że nastąpiło zrównanie jakości i ilości światła)
Równanie barwy ma postać równania wektorowego. Barwa jest punktem (elementem) rzeczywistej
trójwymiarowej przestrzeni wektorowej, której bazą są bodźce podstawowe.
Równanie barwy można uprościć do postaci:
Współczynniki a,b i c nazywane są składowymi trójchromatycznymi, natomiast unormowane a’, b’
i c’ z przedziału [0,1] – współrzędnymi trójchromatycznymi w układzie bodźców podstawowych.
Do określenia chromatyczności bodźca (barwy) wystarczy znajomość trzech składowych lub
dwóch współrzędnych trójchromatycznych.
Metoda matematycznego, numerycznego, obiektywnego opisu barwy.
28
Model CIE-RGB 1931
Przykład przedstawiony wcześniej jest czysto teoretyczny i nie specyfikuje barw podstawowych. Najbardziej znanym przykładem przestrzeni (systemu, modelu) barw jest model CIE RGB opracowany przez Commision Internationale de L’Eclairage (Międzynarodową Komisję Oświetleniową) w roku 1931.
Cechy modelu CIE RGB 1931
Barwy powstają jako mieszanina barw podstawowych: R=700nm, G=546,1nm oraz B=435,8nm (dwie ostatnie długości fal to linie widma rtęci).
Proporcje dopasowania podawane są w tzw. jednostkach trójchromatycznych, tzn. tak by wrażenie bieli ekwienergetycznej uzyskać przy jednakowej ilości bodźców podstawowych. Użycie jednostek trójchromatycznych wymaga jedynie odpowiedniego przeskalowania. Dzięki temu punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.
Dzięki stosowaniu jednostek trójchromatycznych punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.
W oparciu o kolorymetr wykorzystujący jako podstawowe barwy świateł monochromatycznych o długościach fal podanych wyżej wyznaczono równanie barwy dla wszystkich barw świateł monochromatycznych w widmie światła białego oraz obserwatora normalnego. Wynikiem tego są funkcje dopasowania barw (color matching function).
29
Funkcje dopasowania barw modelu CIE RGB 1931
Funkcje dopasowania barw modelu CIE-RGB. Składowa r przyjmuje ujemne wartości w zakresie światła o długości fal pomiędzy długościami fal bodźców B oraz G, natomiast składowa g wartość ujemną przyjmuje dla świateł o długości fali poniżej długości fali bodźca B.
Jakie jest znaczenie funkcji dopasowania?
Funkcje dopasowania określają proporcje w jakich należy dokonać addytywnej syntezy barw podstawowych modelu aby odtworzyć barwę światła o zadanej długości fali
Postać krzywych wyznaczonych na podstawie danych eksperymentalnych (Wright, 1928,1929 oraz Guild, 1931) wskazuje, że nie każdą barwę można dopasować kombinacją barw podstawowych. Przykładem są barwy świateł monochromatycznych o długościach fal poniżej 546,1nm.
Oznaczając barwy podstawowe jako R, G, B, każdą barwę widzialną reprezentować można jako wektor w przestrzeni wektorowej, której bazą są wektory R, G oraz B – jest to przestrzeń CIE RGB.
Posługując się kolorymetrem CIE RGB wyznaczyć można współrzędne trójchromatyczne dla światła o dowolnym rozkładzie spektralnym. Problem: jest to niepraktyczne! Istnieją tablice.
Funkcje dopasowania przedstawione na rysunku odpowiadają dopasowaniu barw za pomocą konkretnych użytych w modelu barw podstawowych. Użycie innych barw podstawowych prowadzi do innym krzywych dopasowania.
Równania określające współrzędne w przestrzeni CIE-RGB dla koloru określonego rozkładem widmowym P( ):
∫
∫∫
),()(=
),()(=),()(=
λbλPλdb
λgλPλdgλrλPλdr
30
Pole barw modelu CIE-RGB
Wykres chromatyczności (pole możliwych barw) w modelu CIE-RGB. Wykres powstał przez zrzutowanie płaszczyzny (trójkąta) o równaniu r+g+b=1 na płaszczyznę RG. Zwróć uwagę na fakt, że składowa r przyjmuje wartości ujemne.
df Pole wszystkich możliwych barw zawiera również tzw. linię purpur (podstawa podkowy pola barw)
Purpura nie jest składową światła białego, jednak jest możliwa do odtworzenia przez zmieszanie świateł o długości fali 380nm oraz 700nm.
Lokus widma jest krzywą łączącą punkty odpowiadające barwom świateł monochromatycznych 380nm-780nm (barwy o największym nasyceniu). Krańce lokusu połączone są tzw. odcinkiem purpur.
Punkt E odpowiada bieli ekwienergetycznej, (1/3,1/3, 1/3).
Wadą modelu CIE RGB jest konieczność posługiwania się ujemnymi wartościami składowych i współrzędnych trójchromatycznych.
31
Model CIE-XYZ
Model barw opracowany w 1931 roku przez Międzynarodową Komisję Oświetleniową (CIE) dla rozwiązania problemu ujemnych współrzędnych i składowych trójchromatycznych.
Układ XYZ powstaje przez transpozycję układu RGB.
Bodźcami podstawowymi stają się bodźce oznaczane jako XYZ leżące poza obszarem barw fizycznie realizowalnych. Bodźce XYZ są więc fikcyjnymi, abstrakcyjnymi bodźcami barwowymi. Tym samym nie jest możliwa konstrukcja kolorymetru wykorzystującego bodźce XYZ.
Bodźce XYZ prowadzą do funkcji dopasowania o wartościach dodatnich (patrz rysunek obok).
Transformacja składowych trójchromatycznych pomiędzy CIE RGB oraz CIE XYZ opisana jest równaniem
Funkcje dopasowania (funkcje współczynników rozkładu) barw modelu CIE XYZ 1931
i można je odnaleźć w odpowiednich tablicach.
Składowe trójchromatyczne dowolnego bodźca świetlnego o zadanym rozkładzie widmowym S( ) określające położenie dowolnej barwy w przestrzeni barw CIE XYZ określone są równaniami:
32
Przestrzeń barw modelu CIEXYZ
Przestrzeń barw modelu CIE XYZ 1931 jest bryłą o kształcie zbliżonym do stożka i o wierzchołku w początku układu współrzędnych.
Bryła składa się z punktów stanowiących współrzędne trójchromatyczne bodźców barwowych możliwych fizycznie do odtworzenia. Ponieważ w modelu CIE XYZ składowe trójchromatyczne przyjmują wartości dodatnie, to bryła barw znajduje się w pierwszym oktancie układu.
Posługiwanie się bryłą barw jest niewygodne, dlatego stosuje się wykres chromatyczności (pole barw).
Wykres chromatyczności uzyskuje się przez zrzutowanie płaszczyzny x+y+z=1 (równanie dla współrzędnych a nie składowych trójchromatycznych) na płaszczyznę XY.
Współrzędne x oraz y jednoznacznie określają położenie punktu barwy na polu chromatyczności w układzie XYZ. Znajomość współrzędnych trójchromatycznych identyfikuje bodziec barwny i pozwala nazwać wrażenie barwne jakie bodziec ten wywoła.
Przestrzeń barw modelu CIE XYZ 1931 (A) oraz wykres chromatyczności (B)
A
B
33
Model CIE-XYZ - cechy
Wykres chromatyczności modelu CIE-XYZ
Na brzegu obszaru w kształcie podkowy zlokalizowane są barwy nasycone (barwy spektralne, odcień barwy). Wnętrze obszaru wypełniają barwy nienasycone
Odcinek łączący barwę z lokusu z punktem bieli odpowiada barwom nienasyconym odcienia barwy z lokusu. Odcień danej barwy można określić przez przedłużenie odcinka przechodzącego przez punkt bieli i punkt danej barwy aż do punktu na lokusie
Nasycenie barwy określa stosunek długości odcinka łączącego punkt bieli z punktem barwy do odcinka łączącego punkt bieli z punktem lokusu i przechodzącego przez punkt barwy (barwy na lokusie są maksymalnie nasycone, czyste)
Odcinek łączący dwie dowolne barwy zawiera wszystkie barwy jakie można uzyskać przez odpowiednie zmieszanie barw na brzegach odcinka
Wykres chromatyczności nie zawiera informacji o jasności (luminancji). Pełną paletę barw tworzy nieskończenie wiele płaszczyzn przecinających bryłę barw. Wniosek: wykres nie zawiera pełnej palety barw.
Podstawę „podkowy” stanowią barwy niespektralne (linia purpury)
Reprezentacja gamutów – palety barw możliwych do reprezentacji na odpowiednim nośniku
35
Gamuty
Porównanie gamy barw reprodukowalnych w systemach PANTONE, CMYK oraz standardowego monitora CRT.
Żaden z systemów nie daje możliwości odwzorowania pełnego zestawu barw występujących w rzeczywistości (naturze)
36
Elipsy Stilesa w modelu CIE-XYZ
Obok podanych zalet model CIE XYZ posiada też wady. Podstawową wadą jest fakt percepcyjnej niejednorodności: jednakowym odległościom na wykresie chromatyczności nie odpowiadają jednakowe różnice barw postrzeganych przez normalnego obserwatora. Innymi słowy: odległość pomiędzy barwami nie niesie informacji o stopniu podobieństwa pomiędzy barwami.
Punkty odpowiadające bodźcom barwowym nierozróżnialnym przez człowieka tworzą elipsy o różnych wielkościach (barwy o współrzędnych wewnątrz elips są nierozróżnialne).
Problem ten ujawnia się w przypadkach, gdy konieczne jest określenie różnicy pomiędzy barwą uzyskaną w drodze reprodukcji a oryginałem. Zwykła odległość euklidesowa nie jest wówczas efektywną miarą zniekształcenia barwy.
Elipsy Stilesa w układzie XYZ (elipsy są powiększone ok. 10x)
37
Model RGB
Model RGB stanowi najpopularniejszą reprezentację barw.
Model oparty o trójchromatyczną teorię postrzegania barw, zgodnie z którą wrażenie barwy powstaje wskutek pobudzenia trzech rodzajów czopków o maksimach absorpcji spektralnej dla światła czerwonego, zielonego i niebieskiego.
Bryła barw modelu RGB jest sześcianem w wierzchołkach którego znajdują się barwy podstawowe: czerwona, zielona, niebieska, barwy do nich dopełniające: żółty, niebieskozielony (cyjan), purpura (magenta) oraz czerń (0,0,0) i biel (1,1,1).
Model addytywny – barwy uzyskuje się w drodze mieszania barw podstawowych R, G, B w różnych proporcjach. Brak barw odpowiada czerni.
Zalety: wszystkie barwy pośrednie można reprezentować liniową kombinacją barw podstawowych (wygoda i szybkość obliczeń), odpowiada sposobom generowania barw w urządzeniach typu monitor i telewizor…
Model RGB posiada wady, które powodują, że w wielu zastosowaniach konieczna jest transformacja obrazu RGB do innej przestrzeni barw posiadającej lepsze własności. Podstawowe wady modelu RGB to:
percepcyjna niejednorodność, tzn. słabe korelacje pomiędzy postrzeganą różnicą dwóch barw a ich euklidesową odległością w sześcianie RGB,
nieintuicyjność posługiwania się składowymi R, G i B w określaniu barwy – problem z wizualizacją barwy na podstawie znajomości składowch RGB,
korelacje pomiędzy poszczególnymi składowymi. Istnieją szacunki, że dla obrazów naturalnych korelacje pomiędzy składowymi R i B, R i G oraz G i B wynoszą odpowiednio: 0.78, 0.98 oraz 0.94. Obraz zapisany w formacie RGB jest podatny na kompresję.
wrażliwość wartości składowych na zmiany poziomu oświetlenia (iluminacji) sceny,
jednoczesne operacje wykonywane na wszystkich składowych mogą prowadzić do przekłamania kolorów (np. rozjaśnianie obrazu RGB wymaga ingerencji we wszystkie składowe obrazu).
Rys. (a) – sześcian barw modelu RGB; (b) – nieintuicyjność modelu RGB. Lewa kolumna odpowiada barwom (R,G,B)=(10,200,10..150), prawa kolumna barwom (R,G,B)=(100,200,10..150); (c) – dwa przykładowe kolory, dla których odległość euklidesowa w przestrzeni RGB jestidentyczna (d=90) z odległością pomiędzy kolorami w dowolnym wierszu na rysunku (b).
b
a
c
38
Model rgb (unormowany RGB)
Wartości składowych RGB są proporcjonalne do ilości światła padającego na obrazowany obiekt (fragment sceny). Wszystkie lokalne zaburzenia w ilości światła padającego na obiekt spowodowane, dla przykładu zacienieniem, powodują wyraźne zmiany wszystkich składowych obrazu. Jest to niepożądane zjawisko, które może prowadzić do błędów segmentacji prowadzonej na obrazie RGB (lub błędów innego rodzaju).
Prostą operacją uniezależniającą składowe barwy od ilości światła jest proces normalizacji składowych postaci:
w której rezultacie powstają barwy unormowane r, g oraz b spełniające warunek: r+g+b=1 (znajomość dwóch składowych pozwala wyznaczyć trzecią).
Problem osobliwości: R+G+B=0.
Składowe rgb w przeciwieństwie do RGB posiadają pożądaną cechę: ich wartości nie zmieniają się pod wpływem zmiany oświetlenia obiektu (sceny) bez zmiany składu spektralnego światła.
Czy znajomość składowych r, g oraz b wystarcza do jednoznacznego odtworzenia wartości składowych R, G oraz B?
39
Model rgb (unormowany RGB) - ilustracja
Rys. (a) - obraz oryginalny; (b), (c), (d) odpowiednio składowe R, G, B obrazu (a); (e), (f), (g) odpowiednio składowe unormowane r, g, b obrazu (a); (h) oraz (i) wartości pikseli w wierszu 100 dla składowej odpowiednio G oraz g obrazu oryginalnego. Widać stabilnośćskładowych rgb na zmiany poziomu oświetlenia, któremu nie towarzyszy zmiana składu spektralnego światła.
50 100 150 200 250 300 350
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
0 100 200 300 400
0
50
100
150
200
250
300
100 200 300 400
50
100
150
200
250
100 200 300 400
0.4
0.5
0.6
0.7
a
b c d
e f g
h i
40
Model HSV (1)
Model HSV (hue, saturation, value) jest modelem, który nawiązuje do naturalnego sposobu interpretacji i opisu barw za pomocą trzech atrybutów: odcienia (hue), nasycenia (saturation) oraz jasności (intensity, brightness, value). Dwa pierwsze atrybuty związane są z cechą jakościową światła (chromatyczność), trzeci parametr, jasność, jest związany z ilością światła.
Model HSV pozwala rozłożyć wrażenie barwne na trzy składowe, przy czym tylko dwie dotyczą chromatyczności.
Barwy w modelu HSV reprezentowane są jako punkty leżące na oraz w wewnątrz ostrosłupa foremnego o podstawie sześciokąta. Ostrosłup HSV można uzyskać przez transformację sześcianu RGB.
Oś V (value, intensity) przyjmuje wartości z przedziału [0,1] i stanowi oś ostrosłupa. Punkty osi V reprezentują barwy achromatyczne (poziomy szarości od czerni do bieli)
Nasycenie S (saturation) przyjmuje wartości z przedziału [0,1] i jest mierzona jako odległość punkty barwy od osi V. Barwy o maksymalnym nasyceniu odpowiadają barwom świateł monochromatycznych.
Odcień H (hue) przyjmuje wartości z przedziału [0,360] i mierzony jest jako kąt obrotu wokół osi V (przeciwnie do kierunku ruchu wskazówek zegara). Jak zmienia się odcień w przypadku S=0?
Analiza ostrosłupa HSV wskazuje, że maksymalne nasycenie barwy jakie można uzyskać zależy od wartości jasności (ilości światła). Podobny efekt jest wbudowany np. w system barw Munsela. Przecięcie sześcianu płaszczyzną prostopadłą do osi V dla ustalonej wartości V daje możliwe barwy dla danego poziomu jasności. Dla płaszczyzny V=0 jedynym wrażeniem jest czerń.
Rys. Przestrzeń barw modelu HSV.
41
Model HSV (2)
Równania opisujące konwersję pomiędzy modelami RGB oraz HSV w sposób przybliżony odpowiadają psychofizycznemu wrażeniu (odcień, nasycenie, jasność) wywołanemu przez kombinację barw RGB.
Przy założeniu, że R,G,B=[0,1] konwersja modelu RGB do modelu HSV opisana jest równaniami:
Zaproponowano wiele wersji powyższych równań o znacznie mniejszej złożoności obliczeniowej. Przykładem jest równanie na składową H, które nie zawiera funkcji trygonometrycznych:
Implementując powyższe równania należy zwrócić uwagę na osobliwości! (np. dla barw achromatycznych) oraz na fakt, że zmienna jest wartością kątową wyrażoną w stopniach (nie radianach).
42
Model HSV (3) - ilustracja
Rys. (a) – sześcian RGB; obrazy (b), (c) i (d) to obrazy odpowiednio H, S oraz V obrazu oryginalnego wyrażonego w modelu HSV.
Obraz (e) jest obrazem składowej H obrazu oryginalnego (a) silnie skompresowanego algorytmem JPEG.
a b
c d
50 100 150 200 250
50
100
150
200
250
0 50 100 150 200 250 300
0
50
100
150
200
250
0 50 100 150 200 250 300
0
50
100
150
200
250
0 50 100 150 200 250 300
0
50
100
150
200
250
0 50 100 150 200 250 300
0
50
100
150
200
250
e
43
Obraz w składowych RGB…
Rys. Obraz RGB. Na następnym slajdzie przedstawiona jest wersja HSV obrazu.
ba
c d
44
…Model HSV (4) - ilustracja
Rys. (a) – obraz oryginalny oraz odpowiednio jego składowe H, S, V w modelu HSV.
Obraz (e) stanowi pokolorowaną wersję obrazu składowej H (obrazu (b)).
Obrazy (b) oraz (e) wskazują na wyraźne rozseparowanie obszarów o różnym odcieniu co podkreśla istnienie obiektów na jednolitym tle.
ba
dc e
45
Model HSV (5) – przykład segmentacji
ba
dc
Rys. Przykład segmentacji przez kwantyzację składowej H obrazu w modelu HSV.
(a) – obraz oryginalny; (b)-(d) obrazy powstałe po kwantyzacji odcienia do odpowiednio 6, 4 oraz 3 poziomów.
46
Model HSV (6)
Zalety modelu HSV:
Naturalność i zgodność ze sposobem opisu barw przez człowieka.
Separacja wielkości opisujących wrażenia chromatyczne od achromatycznych (HS oraz V). Dla przykładu, wykonanie operacji rozjaśnienia obrazu RGB wymaga modyfikacji wszystkich trzech składowych. Ta sama operacja w obrazie po konwersji do przestrzeni HSV wymaga modyfikacji tylko składowej V. Podobnie w przypadku modyfikacji nasycenia i odcienia.
Możliwość opisu barwy poprzez tylko dwie składowe: H oraz S. Ta cecha pozwala wykorzystywać model HSV w zastosowaniach do rozpoznawania obiektów na podstawie koloru (barwy) niezależnie od zmian jasności (podobnie jak model rgb).
Pozwala zdefiniować efektywne miary w przestrzeni obrazu. Przykładem miar może być liczba unikalnych kolorów mierzonych jako liczba odcieni, nasycenie pikseli (pixel saturation) jako stosunek liczby pikseli o maksymalnym nasyceniu do liczby pikseli nienasyconych oraz często stosowana miara odległości na histogramach HSV.
Wady modelu HSV:
Istnienie osobliwości w równaniach konwersji RGB do HSV: osobliwość H dla wszystkich barw achromatycznych oraz osobliwość S dla czerni (R=G=B=0),
Percepcyjna niejednorodność pomimo zorientowania modelu na intuicyjność.
Przykłady wykorzystania modelu HSV w przemyśle i technice:
identyfikacja obiektów kodowanych barwą,
sortowanie i klasyfikacja owoców i warzyw…
rozpoznawanie znaków drogowych.
47
Modele barw YUV oraz YIQ
Jednakowe traktowanie składowych R, G i B prowadzi do nieefektywnego opisu barwy. Z jednej strony ludzkie oko jest najbardziej wrażliwe na zieleń, mniej na czerwień oraz barwę niebieską. Z drugiej strony, bardziej czułe na zmiany luminancji niż chrominancji. Obie te cechy zostają wykorzystane w konstrukcji modeli YUV oraz YIQ.
Modele YUV (Europa) oraz YIQ (USA, Kanada, Japonia) niezależnie opisują składowe luminancji oraz chrominancji barwy: reprezentacja barwy w formacie: chrominancja–luminancja.
Modele YUV oraz YIQ wykorzystuje się do kodowania barw w transmisji sygnału TV (analogowy kompozyt) w systemach kodowania PAL, SECAM oraz NTSC.
Składowa Y obu modeli jest identyczna i odpowiada luminancji (luma). Składowa Y stanowi czarno-białą treść obrazu barwnego. Pozostałe składowe, UV oraz IQ są tzw. sygnałami różnicowymi (patrz równania) i niosą informacje o barwie (chrominancja).
Równania konwersji pomiędzy modelem RGB oraz YUV i YIQ są potaci:
Składowe modelu YUV w systemie PAL Składowe modelu YIQ
Modele YUV i YIQ wykorzystują własności ludzkiego widzenia (np. wagi składowych R, G, B w równaniu na luminancję Y odpowiadają wrażliwości oka na barwy podstawowe)
Składowe U, V oraz I, Q mogą przyjmować wartości ujemne.
48
Modele barw YUV oraz YIQ
0 50 100 150 200 250
0
50
100
150
200
250
300
350
0 50 100 150 200 250
0
50
100
150
200
250
300
350
0 50 100 150 200 250
0
50
100
150
200
250
300
350
Rys. Przykładowy obraz oraz jego składowe Y, I oraz Q.
49
Model YCbCr
Model YCbCr stanowi przesuniętą (offset) oraz przeskalowaną wersję systemu YUV.
Barwa reprezentowana jest przez składową luminancyjną (Y) oraz dwie składowe chrominancji Cb oraz Cr.
Model Ohta I1I2I3. Model w którym stopień korelacji pomiędzy składowymi jest bliski wartości osiąganej przez transformację Karhunena-Loeve’go.
Model PhotoYCC opracowany przez firmę Kodak w 1992 jako format archiwizacji obrazów na płytach Photo CD.
Model CMY(K).
Modele CIELUV oraz CIELAB.
Rys. Formaty modelu YCbCR. Format 4:4:4, 4:2:2 oraz 4:2:0.
YCbCr dopuszcza kilka formatów kodowania barwy różniących się częstością próbkowania składowych. Stosowanie różnych formatów jest oparte o własność ludzkiego oka polegającą na mniejsze wrażliwości na zmiany barwy niż zmiany luminancji. Format 4:4:4 odpowiada jednakowej częstości próbkowania składowych Y oraz Cb i Cr. Dla formatu 4:2:2 składowe Cb oraz Cr są w poziomie próbkowane z częstością dwukrotnie mniejszą niż składowa Y. W przypadku formatu 4:2:0 częstość próbkowania jest zmniejszana dwukrotnie zarówno w pionie, jak i w poziomie.
top related