[acl2016] achieving open vocabulary neural machine translation with hybrid word-character models

13

Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models Minh-Thang Luong and Christopher D. Manning ACL2016 B4 山山山山 1

Upload: hayahide-yamagishi

Post on 12-Apr-2017

99 views

Category:

Data & Analytics

2 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Minh-Thang Luong and Christopher D. ManningACL2016

B4 　山岸駿秀

1

Page 2: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Introduction• NMT には語彙制限の問題がある• “distinct” は高頻度語でも、” distinctiveness” は低頻度語扱い

• ソースからのコピー [Luong+ 2015b] にも問題がある• “Christopher” (English) → “Krystof” (Czech) ( 翻字 )

• 単語単位の翻訳 + 未知語処理用の文字単位翻訳• end-to-end な学習ができる• ただの文字ベースより速く、かつ文脈情報が使える

˘

2

Page 3: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Attention を使った NMT• 生成確率の対数尤度の最大化• 隠れ層の softmax をとる• クロスエントロピーを最小化

• Attention では、 ht を以下で代用3

Page 4: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Hybrid NMT• 単語レベルの encoder 側で未知語になったら、文字レベルの encoder を動かす• 文字レベルの encoder の出力を単語レベルの分散表現として利用• クロスエントロピーを以下の式に変える• Jw は、単語単位の NMT のロス• Jc は、文字単位の decoder のロス• α は、今回は 1.0

• ミニバッチごとに文字レベルの出力を計算4

Page 5: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

separate-path文字レベル decoder の隠れ層初期化を 2 パターン用意• same-path• 隠れ層の初期化に　　を用いる

• separate-path• 　の代わりに以下を使う

5

Page 6: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Experiments• WMT’15 の English-Czech 翻訳タスク• チェコ語は、英語に比べて語彙数が多い• train set: 1580 万文• dev set: newstest2013 (3000 文 )• test set: newstest2015 (2656 文 )

• 単語ベース、文字ベース、 Hybrid の3 つを比較• BLEU と chrF3 で評価

6

Page 7: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Settings• Deep LSTM (4 層、 1024 次元 )• [-0.1, 0.1] で初期化• SGD 、 6 epoch ( 学習率は 4 epoch までは 1.0 、それ以降は

0.5)• ミニバッチ : 128 (shuffled)• 確率 0.2 でドロップアウト• 単語単位のみ : 50 単語以上の文は削除、 |V| はいくつか実験• 文字単位のみ : 150 文字以上の文は削除• 学習に単語単位は 21 日、文字単位は 3 か月、 Hybrid は 25 日

7

Page 8: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Result

8

Page 9: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Analysis (1/2)• 語彙数が少ないときに BLEU の大きな向上 (+11.4)• 文字レベル encoder が出力した表現間の単語類似度も、最高精度のものと戦える水準にある

9

Page 10: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Examples 1

10

Page 11: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Examples 2

11

Page 12: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Analysis (2/2)以下のことが改善• ソースからのコピーではできなかった例 ( 単語ベース )• “11-year-old” → “11-year-old” ( 本来は“ jedenáctiletá” になるはず )

• 固有名詞を訳してしまった例 ( 文字ベース )• “Martin Luther King” → “Martin Luther král”

• 複合語の出力課題• 高頻度語の情報を文字 decoder の学習に取り込めていない

12

Page 13: [ACL2016] Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models

Conclusion• 単語ベースのモデルへ、未知語処理用に文字ベースのモデルを追加• English-Czech 翻訳で最高性能 (20.7 BLEU)• 語彙数の少ない条件下では、最大で +11.4 BLEU• 英語側の分散表現も、よいものが得られている

13

WV1 Newsletter 12-13-18-SP · Achieving Academic Success and Developing Good Character Noticias*de*la*Secundaria* DEPORTES* $ $!! * $ $ ♫♬♩♫ $ $ $ $ $

The Character of "Character"

Achieving Successcharlottenc.gov/.../AchievingSuccess_092217.pdf · Achieving Success - Each One of Us Must “Be the Difference ... (Respect Engage Accountability Character Honesty

Understanding Short Texts - Part II: Explicit Representationwangzhongyuan.com/tutorial/ACL2016/Understanding-Short-Texts/Sli… · from the Web [Banko et al. 2007, Etzioni et al

School Calendar WV1 Campus January517,2019 · 2019. 1. 18. · Achieving)Academic)Success)and)DevelopingGood)Character) APAParent5Club55 Family5Yoga5Night5 Come&enjoy&afunnight&of&yogaandbringyour&whole&family!==

Part 4 Synthesis Tasks - ARG-techarg.tech/~chris/acl2016/part4.pdfNLP Approaches to Computational Argumentation –ACL 2016 Tutorial 9 4.1 Argumentation-oriented NLG 4.2 Argumentation-oriented

Character Education Character Trait Trustworthiness

WV1 Newsletter 9-13-18-SP · 2018-11-06 · Achieving)Academic)Success)and)Developing)Good)Character) $ $ $ $ $ $ $ $$$$$ $ $ $)$ $ *

MEN DESTINED FOR LEADERSHIP - Brown University · THE INSTITUTE prepares high-achieving African American men to be leaders of great character who make significant contributions to

WV1 Newsletter 11-8-18-SP · 2018. 11. 8. · Achieving)Academic)Success)and)Developing)Good)Character) $ * * $ * $ $ $ $ $

Test Review. Character vs. Machine Character vs. Nature Character vs. Society Character vs. Man

Saal/Hall Maritim A, B, C Saal/Hall Maritim IImirror.aclweb.org/acl2016/files/monday_poster_session_guide.pdf · Giovanni Leon, Mads Schaarup Andersen, Sebastian Zimmeck, Kanthashree

WV1 Newsletter 11-1-18-SP · Achieving)Academic)Success)and)Developing)Good)Character) $ * $ $ $ $ $ $ $$ *$ $ * $

WV1 Newsletter 11-15-18-SP...2018/11/15 · Achieving)Academic)Success)and)Developing)Good)Character) $ ** $ * * * $ $ $ * $

New Problems, Old Theories, New Thinking: Achieving the ......G Hearn 20170516 ITEC17 1 New Problems, Old Theories, New Thinking: Achieving the Intellectual Edge in the new character

Outline - Centre for Argument Technologyarg.tech/~chris/acl2016/part2c.pdf · 2.2 Segmenting Texts into Argumentative Units 2.3 Classifying Types of Units 2.4 Identifying Relations

6 Basic Character Conflicts 1.Character vs. Self 2.Character vs. Character 3.Character vs. Nature 4.Character vs. Fate/Luck 5.Character vs. Society 6.Character

Character. Developing Character Character isn’t something you are born with

· Sweatshirts Illustrator Character designer . Hoodies Illustrator Character designer . Skirts Illustrator Character designer . Leggings Illustrator Character designer . scaraes

CHARACTER AnALYSIS€¦ · Internal External _____ _____ _____ _____ _____ _____ _____ CHARACTER AnALYSIS

Optical Character Recognition - Heidelberg University...Optical Character Recognition c Learning: X – set of character images K – set of character names Input: labeled character

WV1 Newsletter 11-29-18-SP · 2018. 11. 29. · Achieving Academic Success and Developing Good Character * * $ * $ $ $ * $ * $ $ $

WV1 Newsletter 2-8-18.1 - West Valley 1 Campus...2018/02/08 · Achieving Academic Success and Developing Good Character SchoolCalendar&–&WV1&Campus& &&&&&February&8,2018& Check

Part 5 Demos and Applications - Centre for Argument Technologyarg.tech/~chris/acl2016/part5.pdf · + Top Claim and Evidence predictions 11. Title: NLP Approaches to Computational

Learning Sentence Embeddings through Tensor Methodstensorlab.cms.caltech.edu/users/anima/slides/acl2016.pdf · Various Frameworks for Sentence Embeddings Compositional Models (M

Character Analysis- Finding the Mystery Character

LEVEL & CLASS PLAYER NAME CHARACTER NAME · D&D 5e; Character Sheet; Character Creator; Character Builder; Character Generator; Keywords

Achieving Increased Mobility Achieving Increase

CHARACTER LEVELS AND CHARACTER BOUNDS

CalendariodeEscuela* WV1 Campus 23 de agosto 2018 · 2018-11-06 · Achieving Academic Success and Developing Good Character CARPOOL*101—LOSBÁSICOS* Guías para los principiantes,

Chapter 3 Lessons 1,2,3 Achieving Mental & Emotional Health -Self Esteem -Character & Personal Identity -Emotions -Anger Management “A prerequisite to

WV1 Newsletter 9-20-18-SP...2018/09/20 · Achieving)Academic)Success)and)Developing)Good)Character) $ * $ $ * * $ $ $ $ $ $ $ $

Cross-Lingual Word Representations via Spectral Graph Embeddings …oshikiri.org/publications/acl2016/slides.pdf · 2020-03-07 · Word vectors generated by CL-Eigenwords (1/2) 5

Developing College Students’ · – Crucial to human thriving • 24 character strengths – The psychological components of the virtues –ways of achieving the 6 virtues – Contribute

Improving Efficiency, Achieving Sustainability fileImproving Efficiency, Achieving Sustainability