商品レビューコメント文からの 商品評価レーダーチャート 自動 … ·...
TRANSCRIPT
1
商品レビューコメント文からの商品評価レーダーチャート自動生成システム
電気通信大学大学院 情報理工学研究科
情報・ネットワーク工学専攻
教授 沼尾 雅之
2
従来技術とその問題点
ネットショッピングサイトの商品レビュー
• ユーザの自由なコメント• 商品購入を決定する際の助けとなるしかし,
• 大量のレビューを全て読むのは困難• ユーザーごとの主観評価• 複数商品で比較できない
3
従来技術とその問題点:AMAZON.COMの例
• 商品ごとのユーザーコメント• ユーザーの主観評価• 総合評価のみ
4
従来技術とその問題点:価格.COMの例
• 商品ごとのユーザーコメント
• ユーザーの主観評価
• 評価軸はサイトが設定
• 商品間の比較
5
既存のレビュー分析手法の課題
評価表現辞書:肯定語と否定語を登録した語彙集
レビューの肯定・否定しか評価することができない.
実際には商品には複数の評価指標が存在する.
安いか?
音は静か?
吸引力は十分か?
例(掃除機)
肯定・否定の情報だけでは不十分
6
新技術の特徴
1. コメント文からのテキストマイニング技術2. ジャンル毎の評価語と評価軸の自動生成3. 商品ごとのレーダーチャート自動生成
7
• コメント文を構文解析– 文章の主節の極性から評価を推定
• 最終的な評価を下している可能性が高いため.
7
新技術の特徴1:コメント文からのテキストマイニング技術
文章全体は肯定的であると推定できる.
音は
うるさいけど
吸引力は
強いし
満足です
主節
8
• 評価軸ごとの評価– 特徴語と評価表現の係り受け関係から推定
• 特徴語が属する評価軸ごとに計算する.
8
新技術の特徴1:コメント文からのテキストマイニング技術
音は
うるさいけど
吸引力は
強いし
満足です
音:否定吸引力:肯定
これらを集計し,レーダーチャートの評価値を算出
9
• 評価表現辞書– 肯定・否定の情報を連続値の評価極性値で表現する
• [-1, 1] で,正ならば肯定,負ならば否定
新技術の特徴2:ジャンル毎の評価語と評価軸の自動生成
9連続値により表現力が上がり,精度向上を期待連続値により表現力が上がり,精度向上を期待!
10
新技術の特徴2:ジャンル毎の評価語と評価軸の自動生成
• 評価軸:商品の複数の評価指標を表したもの– 特徴語の集合として表現– 例:掃除機のジャンル
評価軸1
価格
・・・
値段
吸引力
・・・
パワー
音
・・・
動作音
評価軸2 評価軸3
商品ジャンル毎に評価軸と評価表現辞書を学習
11
新技術の特徴3:商品ごとのレーダーチャート自動生成
• 2種類の評価を分析可能– 総合評価
• ユーザが商品を肯定的に評価しているかどうか
– 評価軸ごとの評価• 商品ジャンルに対応したレーダーチャート
11
12
システム構成
商品レビューから商品ジャンルに特化した語彙情報を学習する
1. 語彙情報の学習
2. 評判分析
学習した情報を用いた評判分析・可視化
• システムの全体像
13
システム構成1-1:評価表現辞書の構築
• 構築結果(一部抜粋)– 商品ジャンルに応じた評価表現が幾つか確認できた
• 掃除機
• スーツ
• 和菓子
13
肯定表現 強い,静か,コンパクト,高性能,・・・
否定表現 うるさい,大きい,重たい,しんどい,・・・
肯定表現 お洒落,かっこいい,丈夫,快適,・・・
否定表現 派手,地味,薄い,重い,雑,・・・
肯定表現 美味しい,程よい,大きい,ヘルシー,・・・
否定表現 物足りない,しつこい,小さい,割高,・・・
14
• 掃除機の構築結果 (各4個まで特徴語を表示)– 「音」,「吸引力」,「価格」 等に関する軸が構築された
• 下線部はk-medoids法の代表点
14
軸 特徴語群
1 モーター音,音,おと,排気音
2 使い勝手,評判,調子
3 吸引力,吸塵力,吸収力,威力
4 形,色,見た目,ピンク
5 価格,値段,お値段,金額
6 ヘッド,ヘッド部分,サイズ,本体
7 ごみ捨て,お手入れ,ごみ処理,取り出し
8 使い心地,滑り,性能,コードレス
レーダーチャートのラベルも自動生成
システム構成1-2:評価軸の構築
15
システム構成1-2:評価軸の構築
• スーツの構築結果– 「生地」,「着心地」,「丈」 等
• 掃除機と同様,扱いやすい商品ジャンルだと考えられる
15
軸 特徴語群
1 生地,布地,記事,生地自体
2 質感,肌触り,着心地
3 お値段,価格,値段,金額
4 サイズ展開,品数,バリエーション,種類
5 シルエット,ライン,形,状態
6 質,品質,見た目,物
7 丈,袖,手,袖丈
16
システム構成1-2:評価軸の構築
• 和菓子の構築結果– 「餡」,「甘さ」,「生地」,「見た目」 等
• 商品の多様性のため,他ジャンルに比べ困難
16
軸 特徴語群
1 餡,あんこ,あん,大福
2 縁起,使い勝手,腹持ち,ウケ
3 甘さ,甘み,甘さ加減,塩加減
4 見た目,包装紙,形,箱
5 お値段,値段,価格,金額
6 いちご,イチゴ,苺,栗
7 生地,餅,お餅,おもち
17
システム構成2:レーダーチャートの生成
• 掃除機– 2つの製品の比較
17
product1(青)
・ 「使い心地」や「ヘッド」等の使用感で高い評価
・総合評価で優位
product2(赤)
・ 「価格」に対する評価が極めて高い
価値観に合ったものを選択できる
18
システム構成2:レーダーチャートの生成
• スーツ
18
•和菓子
19
企業への期待
• コメント文のみからレーダーチャート生成システムを開発済み.実用的なシステムとして稼働させたい.
• 様々なユーザーコメントなどの実データを持っている企業でのシステム化を希望.
20
本技術に関する知的財産権
• 発明の名称 :情報処理装置,情報処理システム,情報処理方法およびプログラム
• 出願番号 :特願0000-0000• 出願人 :電気通信大学
• 発明者 :金兵裕太,沼尾雅之
21
産学連携の経歴
• 2009年-2010年 東洋ガラス社と共同研究実施
• 2011年-2012年 ユビキタス社と共同研究実施
• 2012年-2013年 JST ASTEP事業に採択• 2015年-2017年 ニフティ社と共同研究実施