chương 6 nhận dạng ảnh - 3.0.100.178
TRANSCRIPT
Nhập môn Xử lý ảnh 2
Nội dung
1. Giới thiệu tổng quan
2. Nhận dạng dựa theo miền không gian
3. Nhận dạng dựa theo cấu trúc
4. Nhận dạng dựa theo phương pháp học (mạng Nơron)
5. Một số phương pháp tiên tiến
Nhập môn Xử lý ảnh 4
Nhận dạng ảnh
Bạn nhìn thấy gì?
Nhập môn Xử lý ảnh 12
Giới thiệu về nhận dạng:
TLTK: Patrec_tutorial1: Sorting fish
Nhập môn Xử lý ảnh 13
1. Giới thiệu
Khái niệm nhận dạng:
– Nhận dạng là quá trình phân loại các đối tượng và gán chúng một tên (gán
cho đối tượng một tên gọi, tức là một dạng) dựa theo những quy luật và
mẫu chuẩn. Các đối tượng được biểu diễn theo một mô hình nào đó.
– Quá trình nhận dạng dựa vào những mẫu biết trước gọi là nhận dạng (học)
có giám sát (supervised) hay học có thầy, trong những trường hợp ngược
lại gọi là học không có giám sát (unsupervised).
– Nhận dạng ảnh: hiểu ảnh (image understanding), những nội dung, đối
tượng chứa trong ảnh – phân loại các đối tượng chứa trong ảnh dựa trên
dữ liệu ảnh.
Nhập môn Xử lý ảnh 14
Giới thiệu
3 cách tiếp cận:
– Nhận dạng dựa vào phân hoạch không gian.
– Nhận dạng dựa vào cấu trúc.
– Nhận dạng dựa vào kỹ thuật học (ví dụ: mạng nơron).
Các giai đoạn:
– Tiền xử lý (tăng cường chất lượng ảnh, làm nổi các chi tiết…)
– Trích chọn và biểu diễn các đặc trưng
– Nhận dạng.
Nhập môn Xử lý ảnh 15
Giới thiệu
Các không gian biểu diễn
Không gian biểu diễn đối tượng
– Đối tượng ảnh X (ảnh, chữ viết, dấu vân tay,…) được biểu diễn bởi n thành
phần (n đặc trưng): X={x1,x2…xn}; Không gian biểu diễn X (không gian đối
tượng) thường được định nghĩa:
X = { X1, X2,…Xm}
mỗi Xi biểu diễn một đối tượng, mỗi xi biểu diễn một đặc tính.
Không gian diễn dịch:
– là tập các tên gọi của đối tượng: Ω={w1, w2,… wk}, vd: khuôn mặt người, Bill
Gate, xe máy, ngôi nhà…
– Quá trình nhận dạng đối tượng f là một ánh xạ f: X → Ω với f là tập các quy
luật để xác định một phần tử X trong X ứng với một phần tử trong Ω.
Nhập môn Xử lý ảnh 16
Giới thiệu
Mô hình và bản chất của quá trình nhận dạng
Mô hình: Hai loại
– Mô hình tham số: sử dụng một vectơ để đặc tả đối tượng. Mỗi phần tử của
vectơ mô tả một đặc tính của đối tượng.
– Mô hình cấu trúc: sử dụng một số dạng nguyên thủy như đoạn thẳng,
cung…
Nhập môn Xử lý ảnh 17
Giới thiệu
Bản chất: Quá trình nhận dạng gồm 3 giai đoạn chính:
– Chọn mô hình biểu diễn đối tượng.
– Chọn luật ra quyết định (phương pháp nhận dạng, mô hình học) và suy
diễn.
– Học nhận dạng.
Biểu diễn: đối tượng ~ vector (số thực)
Học: cung cấp tri thức (về đối tượng - object) cho hệ thống, nhằm cải
thiện, điều chỉnh việc phân loại tập đối tượng thành các lớp (class).
Nhận dạng: là tìm ra quy luật, thuật toán để có thể gắn đối tượng vào
một lớp (gán tên - labeling cho đối tượng: car, face…)
Nhập môn Xử lý ảnh 18
Giới thiệu
Học trong nhận dạng:
Học có giám sát (supervised learning): kỹ thuật phân loại nhờ kiến thức
biết trước.
– Cần có một thư viện các mẫu chuẩn. Mẫu cần nhận dạng sẽ được đem so
sánh với mẫu chuẩn để xem nó thuộc loại nào.
– Vấn đề: Thiết kế một hệ thống có tri trức về đối tượng để có thể đối sánh
đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một
lớp.
– Công cụ: hàm phân lớp (hàm ra quyết định).
Học không có giám sát (unsupervised learning): tự xác định ra các lớp
và các tham số đặc trưng cho từng lớp.
– Số lớp không biết trước, những đặc trưng của lớp cũng không được biết
trước.
– Tiến hành mọi cách gộp nhóm, qua nhiều thủ tục xử lý khác nhau có thể và
dần chọn lựa cách tốt nhất.
Nhập môn Xử lý ảnh 19
Hệ thống nhận dạng ảnh
Vd: Kết quả nhận dạng khi tri thức về
đối tượng còn “yếu”
Nhập môn Xử lý ảnh 20
2. NHẬN DẠNG DỰA THEO MIỀN KHÔNG GIAN
Trong nhận dạng dựa theo miền không gian, các đối tượng nhận dạng
là định lượng. Mỗi đối tượng được biểu diễn bởi một vectơ nhiều chiều.
1- Phân hoạch không gian
Nhập môn Xử lý ảnh 21
2- Hàm phân lớp (hay hàm ra quyết định)
– Phân lớp dựa theo khoảng cách (Distance): các đối tượng “gần nhau” về
một đặc trưng nào đó hay không? - gộp chúng lại, hoặc tách ra
– Phân lớp dựa theo xác suất có điều kiện (Conditional Probability): dựa vào
xác suất có điều kiện để phân lớp cho đối tượng; Lý thuyết Bayes.
Nhập môn Xử lý ảnh 25
Mạng nơ ron sinh học
~ 100 billion neurons
Mỗi neuron có hàng
ngàn kết nối:
– Thu nhận tín hiệu
– Lan truyền thông
tin
Nhập môn Xử lý ảnh 31
5- MỘT SỐ PHƯƠNG PHÁP TIÊN TIẾN
Szeliski book: www.szeliski.org/Book Chapter Recognition