building text features for object image classification

19
Building text features for object image classification 福福福福

Upload: zeph-singleton

Post on 02-Jan-2016

54 views

Category:

Documents


3 download

DESCRIPTION

Building text features for object image classification. 福田考晃. はじめに. Wang, Hoiem らによって提案 [CVPR,2009] なにをするものか? 未知画像の既知カテゴリへの分類 どのように? 画像から得られる特徴 テキストの特徴 ( flickr tag ). 組み合わせて利用. 手法の流れ. 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ. ビジュアル特徴. 5 つの特徴量を利用 SIFT Gist カラーヒストグラム - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Building text features for object image classification

Building text features for object image classification

福田考晃

Page 2: Building text features for object image classification

はじめに

• Wang, Hoiem らによって提案 [CVPR,2009]

• なにをするものか?– 未知画像の既知カテゴリへの分類

• どのように?– 画像から得られる特徴– テキストの特徴 ( flickr tag ) 組み合わせて利用

Page 3: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 4: Building text features for object image classification

ビジュアル特徴

• 5 つの特徴量を利用– SIFT– Gist– カラーヒストグラム– 勾配特徴– Unified 特徴 ( 上記4つをまとめたもの )

Page 5: Building text features for object image classification

Gist

• 画像全体から得られる特徴量1. 画像を小領域に分割2. 任意周波数,方向の Gabor フィルタの応答算出

小領域に分割

Gabor filter

周波数,方向強

Page 6: Building text features for object image classification

Unified 特徴の最適化

• 2枚を1組の画像対を利用• Unified 特徴

• 重みを変更し,以下の式を最小化

Si :画像対の関係を表すSi = 1 : 同じカテゴリの画像Si = 0 : 異なるカテゴリの画像

: i 番目の画像対のカイ2乗距離

Page 7: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 8: Building text features for object image classification

インターネットから取得したデータセット

• 画像テキスト間の関係• 1,000,000 枚のデータセット

– 700,000 枚• 58 カテゴリで flickr を検索

– PASCAL + Caltech 256 カテゴリ– 300,000 枚

• 以下からダウンロード

Page 9: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 10: Building text features for object image classification

テキスト特徴

• Flickr データセットから6000 個のタグとグループ名を抽出

• 手順1. 画像入力2. K – Nearest Neighbor で k

個の画像を Flickr データセットから取得

3. 取得した画像のタグとグループ名から特徴量算出

Page 11: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 12: Building text features for object image classification

識別器の構築

• ビジュアル識別器• テキスト識別器• SVM の利用

– カイ二乗カーネル• 特徴量をカイ2乗距離へ射影

• 識別器の統合– ロジスティック回帰

• 検証用データセットを利用

K(x,y)= exp{-² (x,y)}

² (x,y) = i { (||xi-yi||) ² / ||xi+yi|| }

Page 13: Building text features for object image classification

実験

• 以下を確認1. 異なるビジュアル特徴量におけるテキスト特徴の影響2. テキスト特徴とビジュアル特徴の統合の影響3. 学習画像の影響4. 補助データセットの画像枚数の影響5. カテゴリ名の影響

Page 14: Building text features for object image classification

実験1

• 異なるビジュアル特徴におけるテキスト特徴の構築– KNN 精度に依存

• ビジュアル特徴に依存– 各特徴量の精度比較

• カラーヒストグラムが低• Unified が高

Page 15: Building text features for object image classification

実験2

• テキスト特徴とビジュアル特徴の統合の影響– 互いが相互に作用

Page 16: Building text features for object image classification

実験3

• 学習画像枚数の影響– 画像数少

• テキスト特徴の影響大– 画像数多

• テキスト特徴の影響小– 最も高い利得

• テキストとビジュアルが一致したとき

Page 17: Building text features for object image classification

実験4

• 補助データセットの画像枚数– 200,000 〜 600,000

• 精度上昇大– 600,000 〜 1,000,000

• 精度上昇小

• 精度上昇 ≠ 枚数

Page 18: Building text features for object image classification

実験5

• カテゴリ名の影響• 実験対象

– カテゴリ名に類似したタグが存在する  (W)– カテゴリ名に類似したタグが存在しない (WO)

• 類似カテゴリの存在に依存しない

Page 19: Building text features for object image classification

おわりに

• テキストの特徴– Flickr のタグ,グループ名を利用

• Unified 特徴量は有効に作用• テキスト識別器 + ビジュアル識別器 = 相互に作用• 学習画像数が少ない時テキスト特徴の影響大• 精度向上≠ 補助データセット枚数• カテゴリ名の影響はない