言い換えを用いたテキスト要約の自動評価
TRANSCRIPT
言い換えを用いた テキストの自動評価
• 抜粋形式の要約を正解要約との文字列の一致度により評価する従来の方法を、言い換え技術を用いることによる改善を試みる。
• 提案手法(ParaEval手法)を用いて実験を行った。
• 提案手法は抜粋要約と生成要約のいずれの評価においても従来の手法を改善できることが確認された。
2
関連研究✤テキスト自動評価・従来、参照要約とシステム要約との間の類似度を 計算するもので、類似度が高いほど良い要約
✤同義語および言い換えの自動抽出・統計的機械翻訳技術を用いたもの →言い換え知識抽出の方法で利用・分布類似度を用いたもの →大規模コーパスを用いた分布類似度を 言い換え知識の獲得に用いる
3
テキスト評価における 言い換えの必要性の調査
• 調査には自動要約ワークショップTSC2で用いられたデータベースの社説10記事を用いた
• 要約率20%、原文にない表現を自由に用いて良いという条件で10人が作成した100要約に調査
• 比較した結果318個の言い換えが存在
5
テキスト評価にどのような言い換えの必要性があるか
テキスト評価に 出現する言い換え
A. 表記の揺れレベルの言い換え表現(64件)20.1%
B. 語レベルの言い換え表現(78件)24.5%
C. 句レベル言い換え表現(28件)11.9%
D. 節・付属語レベル言い換え表現(39件)12.3%
E. その他言い換え(99件)31.2%
✤A~Dについて言い換え知識を用いて自動評価をする6
提案手法 ParaEval手順と逆ParaEval手順ParaEval手順(逆ParaEval手順は3を先に行うのみ)
1.テキストを走査し、句と句の言い換えの一致を検索(CとD)
2.不一致語に対し、単一語レベルの言い換え(B)や表記の揺れによる言い換え(A)の一致を検索
3.不一致語に対し、語彙マッチングを行う
4. 1,2,3で参照要約に一致した語のうち名詞・形容詞・動詞を内用語として数え、参照要約に対する再現率をスコアとする
7
言い換えの知識同義語辞書と日本語テキスト評価に利用可能な以下を用いる
★ SMT(自動収集):統計的機械翻訳技術を用いて 獲得した言い換え知識
★ DS(自動収集):分布類似度に基づいて得た言い換え知識
★WN(手動収集):WordNet(日本語)を用いた言い換え知識
★NTT(手動収集):NTT日本語彙大系を用いた言い換え知識
• 提案手法では、これらを組み合わせた15種類を用いる8
各手法の評価方法• 実験結果の値と人手に基づいた順位の相関を、 スピアマンの順位相関係数を用いて計算し評価
• ただし、3名の評価が矛盾している場合は除外 順位が全て同一場合でも除外
13スピアマンの順位相関係数:www.weblio.jp/content/スピアマンの順位相関係数