explorer des corpus d’images, l’ia au service du patrimoine · 2018-04-16 · 32@10x10 feature...

31
Explorer des corpus d’images, l’IA au service du patrimoine Le Deep Learning pour l’histoire de l’art Nicolas Gonthier Universit´ e Paris Saclay - T´ el´ ecom ParisTech - LTCI 28 mars 2018

Upload: others

Post on 11-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Explorer des corpus d’images, l’IA au service dupatrimoine

Le Deep Learning pour l’histoire de l’art

Nicolas Gonthier

Universite Paris Saclay - Telecom ParisTech - LTCI

28 mars 2018

Page 2: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Motivation

Motivation

1 Motivation

2 Le Deep Learning

3 La classification et la detection d’objets dans les peintures

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 2 / 31

Page 3: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Motivation

Presentation :

Mon projet de these

Transfert d’apprentissage pour l’analyse iconographique d’œuvres d’artgraphiques

Directions

− Yann Gousseau et Saıd Ladjal (Telecom ParisTech)

− Olivier Bonfait (Universite de Bourgogne)

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 3 / 31

Page 4: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Motivation

Motivation

Objectif : Indexation iconographique automatique

La Mort de Cleopatre, Bohn Germann-August von (1812-1899),Nantes, musee d’Arts

Mots-cle :

Cleopatre VII,

femme,

nudite,

suicide,

vipere,

lit,

table,

panier,

palmier,

colonne,

montagne,

crepuscule,

etc

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 4 / 31

Page 5: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Le Deep Learning

Le Deep Learning

1 Motivation

2 Le Deep Learning

3 La classification et la detection d’objets dans les peintures

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 5 / 31

Page 6: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Le Deep Learning

Le Deep Learning, une sous branche de l’IA

Algorithme basesur l’exemple

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 6 / 31

Page 7: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Le Deep Learning

Les reseaux de neurones profonds - Deep Learning

Inputs3@32x32

Featuremaps32@18x18

Featuremaps32@10x10

Featuremaps48@6x6

Featuremaps48@4x4

Convolution5x5 kernel

Max-pooling2x2 kernel

Convolution5x5 kernel

Max-pooling2x2 kernel

Hiddenunits2048

Hiddenunits2048

Outputs1000

Flatten Fullyconnected

Fullyconnected

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 7 / 31

Page 8: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

Le Deep Learning

Renouveau du Deep Learning en 2012

Resultats d’AlexNet sur ILSVRG-2010, [KSH12]

1.2 million d’images d’entrainement1000 classes60 million de parametres150000 images de test : ”top-5 test error rate of 15.3%”Remarque en 2016 : 3.08% [SIVA16]

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 8 / 31

Page 9: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

La classification et la detection d’objets dans les peintures

1 Motivation

2 Le Deep Learning

3 La classification et la detection d’objets dans les peintures

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 9 / 31

Page 10: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Principe du transfert d’apprentissage

Idee : utiliser les descripteurs haut niveau d’un reseau entraine pour uneautre tache et uniquement entraıne un classifieur 1 pour la nouvelle classe :

Inputs3@32x32

Featuremaps32@18x18

Featuremaps32@10x10

Featuremaps48@6x6

Featuremaps48@4x4

Convolution5x5 kernel

Max-pooling2x2 kernel

Convolution5x5 kernel

Max-pooling2x2 kernel

Hiddenunits2048

Hiddenunits2048

Flatten Fullyconnected

Classifier

Principe du transfert d’apprentissage

On utilise un reseau entraıne pour realiser de la classification de photospour calculer des descripteurs pour realiser la classification des peintures.

1. un SVM lineaire par exempleNicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 10 / 31

Page 11: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Recherche dans une base d’images d’art

Classification de peintures issues de Your paintings Art UK [CZ14, CZ16]

Split Aero Bird Boat Chair Cow Din Dog Horse Sheep Train TotalTrain 74 319 862 493 255 485 483 656 270 130 3463Val 13 72 222 140 52 130 113 127 76 35 865Test 113 414 1059 569 318 586 549 710 405 164 4301

Repartition des classes

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 11 / 31

Page 12: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Reproduction et extension des resultats de [CZ16]

Il s’agit ici d’une recherche par mot-cle et non par requete visuelle :

Net Augmentation mAP mAP [CZ16]

VGG16, 4096D,relu7 none 69.8 68.7[SZ14] Stretch 72.0 70.8

VGG19, 4096D, relu7 none 69.6 �

[SZ14] Stretch 72.4 �

ResNet-152 none 73.3 72.52048D [HZRS15] Stretch 76.0 75.0

InceptionResNet v2 none 74.9 �

1536D [SIVA16] Stretch 77.6 �

Images d’entree des reseaux 224 × 224 ou 299 × 299Conclusion : Il est possible de classifier des peintures a l’aide dedescripteurs appris sur des photos, avec deux cents exemples.

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 12 / 31

Page 13: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Oxford Painting Search

Demonstration en ligne sur les peintures de ArtUk :http://zeus.robots.ox.ac.uk/artsearch/

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 13 / 31

Source: [CZ14]

Page 14: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Creation d’une base d’apprentissage nouvelle

5 classes differentes avec des images issues de WikiCommonsClasse Angel Mary nudity ruins Jesus Child None Total

# 1269 2336 890 459 1605 1392 5473% 23% 43% 16% 8% 19% 25% �

Separer en 40% pour l’entrainement et 60% pour les tests.

Histogramme des dates de creation des œuvres ou bien une date de l’artiste

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 14 / 31

Page 15: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Exemples d’apprentissage pour Ange

angel Mary nudity angel Mary Jesus Child

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 15 / 31

Page 16: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Exemples d’apprentissage pour Ange

angel Mary angel

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 16 / 31

Page 17: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Resultats de classification :

Net angel Mary nudity ruins Jesus Child mAPVGG19 relu7 0.55 0.82 0.77 0.91 0.75 0.76

Strech 0.584 0.846 0.793 0.920 0.785 0.786ResNet152 2048D 0.58 0.85 0.81 0.90 0.8 0.79

Strech 0.595 0.877 0.835 0.916 0.830 0.811InceptionResNetv2 1536D 0.51 0.84 0.79 0.91 0.77 0.76

Strech 0.546 0.862 0.817 0.917 0.800 0.789

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 17 / 31

Page 18: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Algorithme de detection

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 18 / 31

Page 19: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Algorithme de detection : Faster RCNN [RHGS15]

Le reseau produit un ensemblede detection avec estimationde la localisation des objets(apres une suppression des ele-ments non maximales a l’aided’un seuillage).Les images considerees sont del’ordre de 600 × 600 pixels.

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 19 / 31

Page 20: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Faster RCNN [RHGS15] exemple de sortie

Question : Comment faire du transfert d’apprentissage avec un telreseau ?

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 20 / 31

Page 21: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Exemple de 30 zones par image

Quelle proposition contient l’objet qui nous interesse ?Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 21 / 31

Page 22: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Probleme d’apprentissage multi-instances

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 22 / 31

Page 23: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Phase de selection : resultats

On ne garde que la zone la plus positive pour les exemples positifs :

Choix correct Choix partielCadres rouges = object avec le plus haut score, cadre vert = choisi lors de notre phase deselection.

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 23 / 31

Page 24: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Resultats : Detection d’anges

Les cadres verts sontles detections avec laphase de selection etceux en rouge sanscette phase :Amelioration

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 24 / 31

Page 25: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Resultats : Detection d’anges

Les cadres verts sont les detections avec la phase de selection et ceux enrouge sans cette phase :

Detection partielleNicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 25 / 31

Page 26: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Resultats : Detection d’anges

Les cadres verts sontles detections avec laphase de selection etceux en rouge sanscette phase :Erreur

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 26 / 31

Page 27: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Detection d’autres elements : amelioration possible

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 27 / 31

Page 28: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Conclusion

Limites :

Attention aux biais dans la base d’apprentissage

Encore besoin de beaucoup d’exemples

Possibilite :

Annoter automatiquement des images avec des detections multiples

Realiser de la recherche pleine image en quelque sorte

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 28 / 31

Page 29: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

La classification et la detection d’objets dans les peintures

Pistes futures

Augmentation de la base

Amelioration de la brique de selection par apprentissage multi-instance

Travailler sur l’invariance au style

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 29 / 31

Page 30: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

References

References I

▸ [CZ14] Elliot J. Crowley and Andrew Zisserman.In search of art.In Workshop at the European Conference on Computer Vision, pages 54–70.Springer, 2014.

▸ [CZ16] Elliot J. Crowley and Andrew Zisserman.The Art of Detection.In European Conference on Computer Vision, pages 721–737. Springer, 2016.

▸ [HZRS15] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun.Deep Residual Learning for Image Recognition.arXiv :1512.03385 [cs], December 2015.

▸ [KSH12] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton.Imagenet classification with deep convolutional neural networks.In Advances in Neural Information Processing Systems, pages 1097–1105, 2012.

▸ [RHGS15] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun.Faster R-CNN : Towards Real-Time Object Detection with Region ProposalNetworks.arXiv :1506.01497 [cs], June 2015.

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 30 / 31

Page 31: Explorer des corpus d’images, l’IA au service du patrimoine · 2018-04-16 · 32@10x10 Feature maps 48@6x6 Feature maps 48@4x4 Convolution 5x5 kernel Max-pooling 2x2 kernel Convolution

References

References II

▸ [SIVA16] Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, and Alex Alemi.Inception-v4, Inception-ResNet and the Impact of Residual Connections onLearning.arXiv :1602.07261 [cs], February 2016.

▸ [SZ14] Karen Simonyan and Andrew Zisserman.Very Deep Convolutional Networks for Large-Scale Image Recognition.arXiv :1409.1556 [cs], September 2014.

Nicolas Gonthier Deep Learning pour l’histoire de l’art 28 mars 2018 31 / 31