information discovery based on social bookmarks

21

Upload: momota

Post on 06-Aug-2015

954 views

Category:

Documents


0 download

TRANSCRIPT

2

Bookmark (しおり)

› ブラウザの機能

› Webサイト(URL) の記録

何度も訪れるサイト

あとで訪れる可能性のあるサイト

Social Bookmark › みんなでBookmark

› タグの付与

分類

検索の補助:Tag Cloud

› コンテンツフィルタリング

3 3

Nintendo

Wii

tags

URL

Bookmark user

•タグ付け問題

•検索精度 関連研究

•タグによる検索

•人気のブックマーク 既存のサービス

4

Social Bookmarkを活かした情報発見支援

DEMOでも

5

http://tinyurl.com/29ze3g

類似利用者手法

› 似ている利用者を探す

› 似ている利用者の持っている情報を見る

α ブックマーカー手法

› トピックを求める

› トピックに関するα ブックマーカーを探す

› α ブックマーカーの持っている情報を見る

6

似た人を探せ!

7

8

○○たん かわゆす

萌え~ (*´Д`) ハァ

ハァ

興味が近い

持ってるCD 持ってるCD

利用者間の類似度

コサイン尺度で計算

類似度 = =

ji UU ,cos

USERx

USERy

o

|||| ji

ji

UU

UU

θ

9

}0|1{

),,( 21

i

n

URL

URLURLURLU

10

類似利用者

類似利用者が持つ ブックマーク情報

αブックマーカーを探せ!

11

12

topic

αブックマーカー

αブックマーカー手法

1. トピックの算出 › 利用者の興味のあるものを指定したい

› タグはtopic

› タグの揺らぎを解消したい

同義語

意味の階層

2. αブックマーカーの算出 › トピックに関する情報をいち早くキャッチ

3. αブックマーカーのトピックに関する情報を提示

タグの階層化 › Intersection Rate

任意のタグ t の下位タグ集合をトピックと

みなす

14

link (t)

link (s)

aslink

slinktlink

slinktlink

|)(|

|)()(|

)()(

トピック(タグ集合)に関するURL集合を求める

› タグ t ∈ TOPIC でタグ付けられているURL

それらのURL集合でαブックマーカーを探す

› 一つのURLに対する利用者集合のうち早期にブックマークした上位α%の利用者に重みづけ

› 重みw (u) = 被ブックマーク数 – rank(u)

› α度 =

α度の大きい上位N人がαブックマーカー

15

USERSu

uw )(

16

αブックマーカー

αブックマーカーが 持つブックマーク情報

TOPIC

17

2005/2/10 2007/1/1 2007/7/17

• 2006年12月31日までのデータで実装 • 無作為に1000人の利用者 • 2007年1月1日以降のデータで1つでも利用者によって ブックマークされていれば成功 • 情報提示数を10, 20, …, 100と変化

訓練データ テストデータ time

Random

› 利用者にブックマークデータのURL中からランダムに情報提示

類似利用者手法

αブックマーカー手法

› 入力タグはTF値上位20個

タグの階層化のみ

› TOPICを求め, TOPICに関するURL集合を共起で重みづけて情報提示

18

19

Social Bookmarkに注目

情報発見を支援するために2つの手法を提案

› 類似利用者法

› αブックマーカー法

› 評価実験

今後の課題

› 手法の改良

› 評価の見直し

Precision - Recall

20

close 2 u (類似利用者手法)

http://tinyurl.com/29ze3g

Tag Hierarchy (タグの階層化)

http://tinyurl.com/3x7cn6

Alpha Bookmarker (αブックマーカー手法)

http://tinyurl.com/2jb9g2