Download - Let's Go Developer 2011 - Clustering
いちばん簡単なクラスタリング~レッツゴーデベロッパー2011~
真幡康徳 - @mahata
アジェンダ●自己紹介●クラスタリングとは●にばんめに簡単なクラスタリング
●いちばん簡単なクラスタリング
自己紹介
今までの仕事●ブログサービス●レコメンドエンジン●ウェブ検索●ウェブ広告配信●etc...
クラスタリングとは
クラスタリング=グルーピング
http://www.flickr.com/photos/tonyjcase/2411318874/
にばんめに簡単なクラスタリング
5分間クラスタリング
...正直5分でする話じゃない
データセット例リバウンド力 シュート力
桜木 花道 (x1) 5 1
魚住 純 (x2) 4 2
神 宗一郎 (x3) 1 5
河田 雅史 (x4) 5 4
仙道 彰 (x5) 5 5
※ 実在の漫画・キャラクタとは一切関係ありません
リバウンド力 シュート力x1 5 1
x2 4 2
x3 1 5
x4 5 4
x5 5 5
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
(x1[0] – x2[0])2
+(x1[1] - x2[1])2
x1とx2の非類似度(ユークリッド距離)
リバウンド力 シュート力x1 5 1
x2 4 2
x3 1 5
x4 5 4
x5 5 5
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
(x1[0] – x2[0])2
+(x1[1] - x2[1])2
x1とx2の非類似度(ユークリッド距離)
リバウンド力 シュート力x1 5 1
x2 4 2
x3 1 5
x4 5 4
x5 5 5
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
(x1[0] – x2[0])2
+(x1[1] - x2[1])2
x1とx2の非類似度(ユークリッド距離)
対称行列
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
最小
=> x4とx5を併合する(G6)
x1 x2 x3 x4 x5x1 0 2 32 9 16x2 2 0 18 5 10x3 32 18 0 16 16x4 9 5 16 0 1x5 16 10 16 1 0
非類似度行列
x1 x2 x3 G6x1 0 2 32 9x2 2 0 18 5x3 32 18 0 16G6 12 7 16 0
G6の要素はx4とx5の平均を採用(群間平均法)
x1 x2 x3 G6x1 0 2 32 9x2 2 0 18 5x3 32 18 0 16G6 12 7 16 0
非類似度行列
最小
=> x1とx2を併合する(G7)
繰り返す(略)
樹状図x1
x2
x3
x4
x5 G6
G7
G8
G9
クラスタリングの進行
にばんめに簡単なクラスタリング
いちばん簡単なクラスタリング
いちばん簡単なクラスタリング
まとめ
●クラスタリングは怖くない
●クラスタリングは怖くない●ナイーブな実装は簡単
●クラスタリングは怖くない●ナイーブな実装は簡単●ツールを使えばもっと簡単
参考図書●[1]データマイニングの基礎ISBN-10: 4274203484
●[2]スラムダンク 19巻ISBN-10: 4088716299
●[3]魁! 男塾 17巻ISBN-10: 4088524977
おしまい