cvpr 2011 imagenet challenge 文献紹介

CVPR/ICCV 2011 輪講2012/5/14なりひら

紹介内容

●ImageNet challengeの2010,2011 Winnerの報告● 2010 NEC-UIUC (CVPR2011) 紹介● 2011 XRCE(CVPR2011) 概要紹介

●ImageNet Challenge 2012● Fine-Grained classificationが追加● 多分有力：Yao Bangpeng, Fei-Fei Liら

ImageNet Challenge● 大規模データセットImageNetを使った画像認識コンペ

とんでもないクラス数

とんでもないサンプル数

評価方法

● Ground Truth– N classes labels / image

● アルゴリズム

– Top 5 classes labels / image● 評価

– [ sum [5 classesとも当たっていなければペナ１ for n=1:N] for i=1:numImage ]

ImageNet Challenge 2010 Winner

(Published in CVPR 2011)

The Contribution of this paper

新しいアルゴリズムは目的じゃない

中規模データセット（PASCAL VOCなど）の時と同等の性能で

効率的大規模データセット問題を解くこと

1. Hadoopによる特徴抽出並列化2. 大規模データでのSVMの効率的な学習

中規模データセットでのState-of-the-art

HoG (Shape), LBP (Texture)Multi-scale 16, 24, 32

LCC: Sparse codingより改善Super-vector: 高次特徴量

Poolingになんとなく位置情報

Feature mapping次第で線形でいける

大規模に適用しようとすると（1.2M画像、1000クラス）

〜208日（一枚〜15秒）

250日 Liblinear, svnlight etc.

No more than 500px at either side

ScSPM: Sparse coding + Spatial pyramid pooling

spatial max pooling CVPR2009 average pooling

Histogram max pooling multiscale max pooling

LCC JinJun Wang et al, CVPR2010

Sparse codingよりも速く性能も高いcoding方法

解析的に係数が求まるので速い

Super-vector coding

特徴量の規模

ぐぬぅ…

Feature extractionをHadoopで配列化

● 特徴量計算はサンプルで独立だから並列化しやすい

● 流行のHadoop使ってやったぜ

208日 → 2日（120 workers）

詳しくはWEBで　ぽち　

SVM学習

1000 クラス 1-vs-all binary classifiersを学習

前述のとおり特徴量はとんでもないサイズ

SVN^light LibSVMなどはBatch最適化だから無理

Stochastic Gradient DescentでやるAveragingバージョンは更に良い

1000クラスでmemory sharingするとI/O効率的

SVMのコスト関数

正則化＋ヒンジロス

コスト関数の偏微分

Stochastic Gradient Descent (SGD)

サンプルごとの勾配でwを更新

Averaging Stochastic Gradient Descent (ASGD)

超シンプル大規模データでないと上手くいかないらしい

２次のSGDと同様な収束性能Hesseの計算の必要なし

ちょっとした計算テクニックも紹介

ASGD SVMの並列化

● File I/Oがボトルネック（Readだけで19 hours）

● Bin classifier x 1000 を並列化

● データセットをメモリ共有

250日 → 4日（6x12 workers）

Results

セット5の結果

ASGD v.s. SGD● ASGD converged

very fast!

性能

● Classification accuracy: 52.9%

● Top 5 hit rate: 71.8%

ImageNet Challenge 2011 Winner (Published in CVPR 2011)

ポイント

高次元特徴量（＋線形識別器）を使うと性能良いのは知られている

しかし、高次元（Fisher Vector）を扱うのは大変

良い特徴量圧縮方法Product quantizationを使うHash Kernelよりも性能が落ちない

力尽き…

cvpr 2011 imagenet challenge 文献紹介

Technology

cvpr slides

cvim saisentan-cvpr-deep face

imagenet classification with deep convolutional neural ......

impact of imagenet model selection on domain adaptation of...

cvpr 2009, miami, florida

imagenet i-base user manual - topcon-medical.it · imagenet...

imagenet large scale visual recognition challenge

imagenet : a large-scale hierarchical image database

cvpr 2019 tracking and detection challenge cvpr 2019 ·...

rsc final cvpr submit

2012 cvpr gtw

imagenet classification with deep deep convolutional...

imagenet classification with deep convolutional neural...

imagenet i-base user manual - topcon-medical.co.uk · on...

imagenet classification with deep convolutional neural...

giacomo boracchi - cvpr usi 2020

imagenet : a large-scale hierarchical image database

tiny imagenet visual recognition...

cvpr talk v2

do imagenet classiﬁers generalize to...