curs1 inteligenta artificiala
Embed Size (px)
DESCRIPTION
Curs Inteligenta Artificiala (Matlab)TRANSCRIPT

Inteligență Ar-ficială
Bogdan Alexe [email protected]
Secția Tehnologia Informației, anul III, 2015-‐2016
Cursul 1

Cuprinsul cursului de azi
1. Aspecte organizatorice legate de cursul de IA 2. Prezentarea cursului de IA

Cuprinsul cursului de azi
1. Aspecte organizatorice legate de cursul de IA 2. Prezentarea cursului de IA

Aspecte organizatorice legate de cursul de IA
• Structura primului semestru • Orar • Materiale • Examen • Regulament de integritate • Impresiile studenților de anul trecut • Notele de anul trecut • Lucrare de licență

Structura primului semestru • hPp://unibuc.ro/n/studii/calendar_academic.php
• 14 cursuri de IA (11 cursuri în 2015 + 3 cursuri în 2016) • 13/14 laboratoare de IA (10/11 în 2015 + 3 în 2016) • cursul și laboratoarele de pe 16 decembrie SE FAC!!! • săptămâna 5-‐9 octombrie 2015 este pară

Orar

Orar

• moodle.fmi.unibuc.ro
Materiale

• Scris – individual, minim nota 5 – model de lucrare scrisă – ul-mul curs 20.01.2016
• Laborator – individual, minim nota 5 – lucrare de laborator 20-‐22.1.2016 (ul-ma săptămână) – minim 7 prezențe; alcel lucrare de laborator #2 la examen
• Proiect – grupe de 2-‐3 studenți, minim nota 5 – proiect 1 – termen de predare 22.11.2015 (săpt. 8) – proiect 2 – termen de predare 17.01.2016 (penul-ma săptămână)
Examen -‐ evaluare și notare
Nota =1
3Scris+
1
3Laborator +
1
3Proiect

• Scris – individual, minim nota 5
• Laborator – individual, minim nota 5 – lucrare de laborator la restanță
Nota =2
3Scris+
1
3Laborator
Examen -‐ restanță
• Fără proiect

Examen – desfășurare
• Anul trecut: – toate materialele la dispoziția studentului
– studenții au avut voie să vină la examen cu laptopurile conectate la internet
• Anul acesta: – putem urma aceeași paradigmă
– puteți propune voi o altă modalitate de desfășurare a examenului care să
îndeplinească următoarele condiții:
• lucrare individuală
• evaluarea cunoș-ințelor prin rezolvarea de probleme (nu se evaluează
capacitatea de memorare a cunoș-ințelor)

• regulament privind ac-vitatea studenților la UB: hPp://fmi.unibuc.ro/ro/pdf/2015/consiliu/UB_Regulament_studen-_2015.pdf
• regulament de e-că și profesionalism la FMI:hPp://fmi.unibuc.ro/ro/pdf/2015/consiliu/Regulament_e-ca_FMI.pdf
• 3 incidente minore = un incident major = exmatriculare
Regulament de integritate

• NU COPIAȚI codul sursă (MATLAB) pentru realizarea
proiectelor de la colegi (incident minor)
• proiectele le vom face împreună, vom rezolva mai mult de
jumătate din ele la laborator
• NU COPIAȚI la examenul scris (trebuie să-‐mi explicați ce ați
scris) (incident major)
Regulament de integritate

Impresiile studenților de anul trecut
• “îmi pare rău că nu am ajuns la mai multe cursuri, păreau
foarte interesante” (studentul prefera World Of Warcram)
• “mi-‐a plăcut, erau foarte multe poze și video-‐uri. Dar n-‐am
înțeles exact materia că era prea puțin scris pe slide-‐uri”
• “la curs era frumos dar la laborator am pierdut firul de la
început că nu mi-‐a plăcut programarea”
• “ne-‐a plăcut că ne-‐ați ajutat la proiecte”
• “trebuia să avem posibilitatea să luam nota 12, să ne mai
dați un proiect”

Notele de anul trecut # STUDE
NȚI
NOTA 4 5 6 7 8 9 10
11
20
25
5
12
4
8

• dacă vă place materia, luați notă mare la examen (minim 9)
și vreți să vă faceți lucrarea de licență sub îndrumare mea
putem discuta
• subiectul lucrării de licență poate fi propus de voi sau de
mine
• trebuie să fie pe specializarea mea (vedere ar-ficială)
• număr limită : 7 studenți
Lucrare de licență?

Prezentarea cursului de IA
1. Aspecte organizatorice legate de cursul de IA 2. Prezentarea cursului de IA

Prezentarea cursului de IA
• IA – definiție • Aplicații de succes în IA • IA – istorie • Ce vom studia la acest curs de IA? • Structura cursului • Proiecte posibile • Vedere Ar-ficială • Aplicații în Vederea Ar-ficială

Inteligență Ar-ficială – definiție
• Inteligență • Inteligență ar-ficială
-‐ abilitatea de a rezolva probleme
-‐ construirea de computere / scrierea de programe somware inteligente pentru rezolvarea de probleme

Inteligență Ar-ficială – definiție
1. … simulează gândirea umană
2. … se comportă ca un om
3. … simulează gândirea rațională
4. … se comportă rațional
gândire
om
comportament
rațiune

Definiția 1: simulează gândirea umană
• studiază creierul uman din perspec-va felului în care este procesată informația pentru rezolvarea de probleme
• ș-ințe cogni-ve = psihologie + IA + lingvis-că + filozofie + ș-ințe neuronale
• două paradigme: simbolică vs. conecționistă

Paradigma simbolică
• sistemul cogni-v reprezintă cunoș-ințele și stările de lucruri corespunzătoare prin simboluri
• gândire = manipulare de simboluri
• când scriem un program într-‐un limbaj de nivel înalt (C, C++) nu ne punem problema să descriem reprezentarea exact la nivel de bit a datelor, ci folosim -puri de date prefabricate (simboluri)

Paradigma conecționistă
• sistemul cogni-v reprezintă cunoș-ințele și stările de lucruri corespunzătoare prin ac-varea unor unități simple (neuroni) pe baza unor paPern-‐uri și valori de ac-vare
• model matema-c pentru neuron
• rețea neuronală

• Testul Turing
-‐ un om nu poate dis-nge în -mpul unei conversații scrise dacă interlocutorul este calculator sau om • Ce abilități ar trebui un calculator să aibă pentru a trece de
testul Turing? 1. procesarea limbajului natural (comunicare) 2. reprezentarea cunoș-ințelor (stocare informații) 3. deducție automată (a faptelor pe baza cunoș-ințelor) 4. învățare automată (detectare de paPern-‐uri)
Definiția 2: se comportă ca un om
A. Turing, Compu-ng machinery and intelligence, Mind 59, pp. 433-‐460, 1950
Interogator OM
OM
SISTEM IA

• Turing a prezis că până în anul 2000, un sistem informa-c IA va putea să păcălească 30% din interogatori pentru 5 minute
• Premiul Loebner – 2008: 12 interogatori – 5 minute pentru a conversa simultan cu 2 en-tăți diferite (om sau sistem AI) Câșțigătorul, Elbot , a reușit să păcăleacă 3 din 12 interogatori.
Testul Turing
hPps://en.wikipedia.org/wiki/Loebner_Prize

• Include semnal video – interogatorul uman poate testa capacitățile perceptuale ale interlocutorului
• Abilități necesare: 1. procesarea limbajului natural (comunicare) 2. reprezentarea cunoș-ințelor (stocare informații) 3. deducție automată (a faptelor pe baza cunoș-ințelor) 4. învățare automată (detectare de paPern-‐uri) 5. vedere ar-ficială (perceperea obiectelor, a scenei) 6. robo-că (manipularea obiectelor, mișcare)
Testul “total” al lui Turing
Subdomenii ale Inteligenței Ar-ficiale

Definiția 3: simulează gândirea rațională
• gândirea ca proces care urmează anumite legi -‐> Logica • pornind de la premise corecte și urmând aceste legi se
ajunge la concluzii corecte = raționamente -‐ “Socrate este un om; toții oameni sunt muritori; prin urmare Socrate este muritor.”
• descrie problema în notație formală de logică și apoi aplică regulile de deducție pentru rezolvare
• dezavantaje: -‐ complexitate computațională crescută -‐ descrierea incer-tudinii

Definiția 4: se comportă rațional
• agent rațional care acționează pentru a-ngerea op-mă a scopurilor luând decizii (inferențe) -‐ scopuri exprimate în termeni de u-litate -‐ a fi rațional = a maximiza u-litatea -‐ în situații de incer-tudine, alege decizia cu cea mai mare u-litate es-mată (expected u-lity)
• comportamentul omului nu rezultă întotdeauna din
rațiune + inferențe: -‐ gesturi reflexe (când punem mâna pe ceva încins avem reflexul de a ne retrage imediat mâna)

Aplicații de succes în Inteligență Ar-ficială

Şah: Deep Blue vs Kasparov
• 1996: Kasparov câşHgă
• 1997: Deep Blue câşHgă
• Deep Blue (proiectat de IBM) îl învinge în 1997 pe Kasparov după ce în prealabil pierduse în 1996
“I could feel – I could smell – a new kind of intelligence across the table.”
“Deep Blue hasn't proven anything.”

Recunoaştere vocală • Dragon dicta-on (Nuance) , Siri (Apple) , Voice search (Google)
Dragon dictaHon Siri Voice Search

Recunoaştere vocală • Google translate

Traducere automată

Traducere automată

Traducere automată
hPp://googleblog.blogspot.com/2015/01/hallo-‐hola-‐ola-‐more-‐powerful-‐translate.html

Maşini fără şofer
• Nissan: în 2020 maşini fără şofer disponibile la un preț rezonabil • Google: 2017

Recunoaşterea op-că a caracterelor (OCR)
Recunoaşterea cifrelor http://yann.lecun.com/exdb/lenet/index.html
• Tehnologie care converteşte documente scanate în text.
Recunoaşterea plăcuțelor de înmatriculare http://en.wikipedia.org/wiki/Automatic_number_plate_recognition

Roboți inteligenți pentru curățenie

Roboți pentru împăturirea de prosoape
http://www.youtube.com/watch?v=gy5g33S0Gzo&NR=1

Inteligența ar-ficială -‐ istorie 1940 Primul model al unui neuron (W. S. McCulloch și W. PiPs) Învățare Hebbiană 1950 Testul Turing
Perceptron (F. RosenblaP), rețele neuronale Program care joacă șah și dame (C. Shannon, A. Samuel) Traducere automată (Georgetown -‐ IBM) Programe care demonstrează teoreme (Newell și Simon)
1960 Eșecul traducerii automate
Eșecul rețelelor neuronale (M. Minsky și S. Papert, 1969) 1970 Cercetarea în IA cunoaște primul recul
hPps://en.wikipedia.org/wiki/History_of_ar-ficial_intelligence

Inteligența ar-ficială -‐ istorie 1980 Sisteme expert în plină ascensiune (pe semestrul doi) Revigorarea cercetării în rețelele neuronale, algoritmul de back-‐
propagare Inferențe probabiliste
1990 Sisteme expert în declin
Cercetarea în IA cunoaște al doilea recul 1995 Învățare automată
“Big data” 2012 Învățare de -p deep (deep learning) pentru rețele neuronale
hPps://en.wikipedia.org/wiki/History_of_ar-ficial_intelligence

Ce vom studia la acest curs de IA? Subdomenii ale Inteligenței Ar-ficiale:
1. procesarea limbajului natural (comunicare) 2. reprezentarea cunoș-ințelor (stocare informații) 3. deducție automată (a faptelor pe baza cunoș-ințelor) 4. învățare automată (detectare de paPern-‐uri) 5. vedere ar-ficială (perceperea obiectelor, a scenei) 6. robo-că (manipularea obiectelor, mișcare)
Vom studia: • vedere ar-ficială (7 octombrie – 16 Decembrie) • reprezentarea cunoș-ințelor + deducție automată (7 ianuarie – 21 ianuarie) – punct de plecare pentru cursul de Sisteme Expert (semestrul 2)

Structura cursului

Structura cursului
1. Filtre & caracteris-ci ale imaginilor
– filtre – gradienți – muchii – textură

2. Segmentare via clustering
– grupare – clustering – segmentare
Structura cursului

3. Recunoaşterea claselor de obiecte
– reprezentare – învățare – detectare facială
Structura cursului

4. Reprezentare cunoș-ințe & deducție automată
– noțiuni de ProLog
– căutare informată
– căutare neinformată
Structura cursului

Proiecte posibile (vom implementa 2 din cele 4 propuse )

P1. Redimensionarea imaginilor cu păstrarea conținutului
[Shai & Avidan, SIGGRAPH 2007] Slide adaptat după K. Grauman

Redimensionare cu păstrarea conținutului
Redimensionare uzuală
[Shai & Avidan, SIGGRAPH 2007]
P1. Redimensionarea imaginilor cu păstrarea conținutului
Slide adaptat după K. Grauman

Redimensionare cu păstrarea conținutului
Redimensionare uzuală (imresize)
Slide adaptat după K. Grauman
P1. Redimensionarea imaginilor cu păstrarea conținutului

Care imagine conține o mașină (vedere din spate)?
DA DA
DA DA
NU NU
NU NU
P2. Clasificarea imaginilor

P2. Date de antrenare și testare
• Antrenare – 50 de imagini pozi-ve (conțin mașini – vedere din spate) – 50 de imagini nega-ve (NU conțin mașini)
• Testare
– 50 de imagini pozi-ve (conțin mașini – vedere din spate) – 50 de imagini nega-ve (NU conțin mașini)

P3. Realizarea de panorame

P4. Detectare facială

Vedere Ar-ficială (Computer Vision)

Ce este vederea ar-ficială?
Gata?

Ce este vederea ar-ficială?
• Înzestrarea computerelor cu un sistem vizual asemănător cu sistemul vizual uman
• Scrierea de programe pentru calculator care pot interpreta imagini/video-‐uri

Scopul vederii ar-ficiale
• Extragerea informației din pixeli
Slide adaptat după S. Lazebnik

Scopul vederii ar-ficiale
• Extragerea informației din pixeli
Vederea umană Vederea calculatoarelor
Slide adaptat după S. Lazebnik

Ce informații extragem?
Informații geometrice (3D) Informații seman-ce
clădire
persoană maşină maşină
şosea
copac cer
fereastră
coş
Scenă outdoor Oraş
copac clădire fereastră
Slide adaptat după S. Lazebnik

L. G. Roberts, Machine Percep,on of Three Dimensional Solids, Teza de doctorat, MIT, 1963.
Date vizuale în 1963

Date vizuale în 2015
Albume foto
Supraveghere video şi securitate
Filme, şHri, sporturi
Imagini medicale si şHinHfice Slide adaptat după S. Lazebnik

Date vizuale în 2015

Exemplu de vedere ar-ficială
Terminator 2

Exemplu de vedere ar-ficială

O imagine face cât 1000 de cuvinte
• Scopul vederii ar-ficale este de a scrie programe de calculator care interpretează imaginile

Pot computerele vedea mai bine ca oamenii?
• Da şi nu( de cele mai multe ori nu!) – oamenii excelează la lucruri “grele” – computerele pot fi mai bune la lucruri mai “uşoare”

Deficiențe ale percepției umane

Sinha and Poggio, Nature, 1996

Sinha and Poggio, Nature, 1996

Sinha and Poggio, Nature, 1996
… the processing performed by the visual system is bePer characterized as “head recogni-on” rather than “face recogni-on”

Copyright A.Kitaoka 2003

Edward Adelson
http://web.mit.edu/persci/people/adelson/illusions_demos.html

Edward Adelson
• A şi B au aceeaşi culoare

Numiți culoarea fiecărui cuvânt
Interacțiuni la nivel înalt afectează percepția şi procesarea.
Verde Cyan Albastru Magenta Negru Roz Maro Galben Portocaliu Roşu Albastru Verde Galben

Aplicații în Vederea Ar-ficială

Recunoaşterea op-că a caracterelor (OCR)
Recunoaşterea cifrelor http://yann.lecun.com/exdb/lenet/index.html
• Tehnologie care converteşte documente scanate în text.
Recunoaşterea plăcuțelor de înmatriculare http://en.wikipedia.org/wiki/Automatic_number_plate_recognition

Detectarea facială
• Multe din camerele digitale existente au incorporat detector facial – Canon, Sony, Fuji, …

Smile detec-on?
Sony Cyber-‐shot® T70 Digital S-ll Camera

Detectarea facială pentru protejarea iden-tății


Detectarea facială: Apple Iphoto
hPp://www.apple.com/ilife/iphoto/

Biometrie – recunoaşterea irisului
“Afghan Girl” - fotografie din 1984; refugiată în Pakistan

“How the Afghan Girl was Identified by Her Iris Patterns” Afghan_Girl
Biometrie – recunoaşterea irisului
1984 2002

Login fără parolă …
Recunoaşterea amprentei implementată
pe multe device-uri: laptop-uri, telefoane
Sisteme de securitate bazate pe recunoaşterea facială sunt din ce in
ce mai folosite. http://www.sensiblevision.com/

Recunoaşterea de obiecte pe telefoane mobile
• Aplicații: – Microsom Research – Point & Find, Nokia – Kooaba -‐> Qualcomm

Nokia Point & Find Demo

Tenis: sistemul Hawk-‐eye

Tenis: sistemul Hawk-‐eye

Fotbal: sistemul Goal Line

Fotbal: sistemul Goal Line Cupa Mondială 2010: Germania -‐ Anglia

Fotbal: sistemul Goal Line Cupa Mondială 2014: Franța -‐ Honduras