information discovery based on social bookmarks
TRANSCRIPT
Bookmark (しおり)
› ブラウザの機能
› Webサイト(URL) の記録
何度も訪れるサイト
あとで訪れる可能性のあるサイト
Social Bookmark › みんなでBookmark
› タグの付与
分類
検索の補助:Tag Cloud
› コンテンツフィルタリング
3 3
Nintendo
Wii
tags
URL
Bookmark user
類似利用者手法
› 似ている利用者を探す
› 似ている利用者の持っている情報を見る
α ブックマーカー手法
› トピックを求める
› トピックに関するα ブックマーカーを探す
› α ブックマーカーの持っている情報を見る
6
利用者間の類似度
コサイン尺度で計算
類似度 = =
ji UU ,cos
USERx
USERy
o
|||| ji
ji
UU
UU
θ
9
}0|1{
),,( 21
i
n
URL
URLURLURLU
αブックマーカー手法
1. トピックの算出 › 利用者の興味のあるものを指定したい
› タグはtopic
› タグの揺らぎを解消したい
同義語
意味の階層
2. αブックマーカーの算出 › トピックに関する情報をいち早くキャッチ
3. αブックマーカーのトピックに関する情報を提示
タグの階層化 › Intersection Rate
任意のタグ t の下位タグ集合をトピックと
みなす
14
link (t)
link (s)
aslink
slinktlink
slinktlink
|)(|
|)()(|
)()(
トピック(タグ集合)に関するURL集合を求める
› タグ t ∈ TOPIC でタグ付けられているURL
それらのURL集合でαブックマーカーを探す
› 一つのURLに対する利用者集合のうち早期にブックマークした上位α%の利用者に重みづけ
› 重みw (u) = 被ブックマーク数 – rank(u)
› α度 =
α度の大きい上位N人がαブックマーカー
15
USERSu
uw )(
17
2005/2/10 2007/1/1 2007/7/17
• 2006年12月31日までのデータで実装 • 無作為に1000人の利用者 • 2007年1月1日以降のデータで1つでも利用者によって ブックマークされていれば成功 • 情報提示数を10, 20, …, 100と変化
訓練データ テストデータ time
Random
› 利用者にブックマークデータのURL中からランダムに情報提示
類似利用者手法
αブックマーカー手法
› 入力タグはTF値上位20個
タグの階層化のみ
› TOPICを求め, TOPICに関するURL集合を共起で重みづけて情報提示
18
Social Bookmarkに注目
情報発見を支援するために2つの手法を提案
› 類似利用者法
› αブックマーカー法
› 評価実験
今後の課題
› 手法の改良
› 評価の見直し
Precision - Recall
20
close 2 u (類似利用者手法)
http://tinyurl.com/29ze3g
Tag Hierarchy (タグの階層化)
http://tinyurl.com/3x7cn6
Alpha Bookmarker (αブックマーカー手法)
http://tinyurl.com/2jb9g2