classic japanese poetrycuckoo.js.ila.titech.ac.jp/~yamagen/yamamoto-hodoscek...relationships between...

1
Relationships between Flowers in a Word Embedding Space of Classic Japanese Poetry Bor Hodošček, Osaka University [email protected] Hilofumi Yamamoto, Tokyo Institute of Technology [email protected] 交ふ 下⽔ 重なる ⽴⽥ 挿頭す み吉野 著し 花桜 花橘 ます ⼭辺 折る ⽂無し ⽐ふ 勝つ 初む ⾹る 散らす ⻑閑けし 千種なり 霞む 其れ 憧る ⼀年 遣す 誤つ 惜しむ 誘ふ 井⼿ ⼥郎花 ⽩雲 ⾊⾊ ⼭⾥ 軒端 常夏 標む ⽩菊 標す 匂ふ 咎む ⽩妙 御雪 ⻘葉 別きて 急ぐ 古⾥ 浅緑 盛る べらなり 返す返す ⾒す 九重 秋萩 紛ふ 春⾬ 移ろふ 移り⾹ 増す 異異に 春霞 後ろめたし 卯の花 藤袴 随に 移す 隠す 打ち付けなり 常磐 先づ 棚引く 藤浪 吉野⼭ 撫⼦ 卯花 ⼋重桜 残す 盛りなり 若⽊ 家苞 ⼭吹 ⽊⽊ 始む 訪ふ ⽊末 映る 押し並べて 徒⼈ 三輪 頼る 撓なり 桜花 奥⼭ ⽩河 尋ぬ 四⽅ 垣根 狩る ⼋重 ⾊⾹ 散る 驚く 何れ 疾し 宿 春風 掘る 続く 植う 咲く ⾄る 交じる 触る 尋む 千種 ⼭桜 -1 0 1 2 3 4 0 1 2 3 PCA 1 (29.73%) PCA 2 (12.81%) Figure 1: PCA of word embedding space (4157 words × 50 dimensions) ltered to include only top 100 similar words for each of ume and sakura (150 total). Similarity is represented by the dierence in similarity scores between ume and sakura, scaled to [-1, 1]. -1.0 -0.5 0.0 0.5 1.0 Similarity ‘ume’ (plum blossom) ‘sakura’ (cherry blossom) @JADH2017 September 11 And more... Examine the possibility of word embedding spaces (Word2Vec) to explain the semantic relationships between classical Japanese poetic terms within the Hachidaishū poem anthology. (ca. 9051205) cosine similarity

Upload: dinhxuyen

Post on 17-May-2018

225 views

Category:

Documents


5 download

TRANSCRIPT

Relationships between Flowers in a Word Embedding Space of Classic Japanese Poetry

Bor Hodošček, Osaka [email protected]

Hilofumi Yamamoto, Tokyo Institute of [email protected]

交ふ

下⽔

重なる

⽴⽥

挿頭す

麓霞

み吉野

著し

花桜

花橘

ます

⼭辺

折る

⽂無し

⽐ふ

勝つ

初む

⾹る散らす

⻑閑けし

千種なり遠

霞む

其れ

憧る

⼀年

遣す

菊緑

誤つ

惜しむ

誘ふ

井⼿

⼥郎花

⽩雲

⾊⾊

⼭⾥

軒端

常夏

標む⽩菊

標す

匂ふ

咎む

⽩妙

御雪⻘葉

別きて

急ぐ

古⾥

浅緑

盛る

べらなり

返す返す

⾒す

九重

秋萩

紛ふ

春⾬移ろふ

移り⾹

増す

異異に

春霞

後ろめたし

卯の花

藤袴随に

移す隠す打ち付けなり

常磐

先づ

棚引く

藤浪

吉野⼭

撫⼦

卯花

⼋重桜

残す

盛りなり

若⽊

家苞

⼭吹⽊⽊

始む

訪ふ⽊末

映る

押し並べて

徒⼈三輪頼る

撓なり

桜花

奥⼭

⽩河

尋ぬ

四⽅

垣根

狩る⼋重

⾊⾹

散る

驚く

何れ

疾し

宿桜

春風

掘る

続く

植う

咲く

⾄る

交じる

触る

尋む

千種

⼭桜

-1

0

1

2

3

4

0 1 2 3

PCA 1 (29.73%)

PC

A 2

(12

.81%

)

Figure 1: PCA of word embedding space (4157 words × 50 dimensions) filtered to include only top 100 similar words for each of ume and sakura (150 total). Similarity is represented by the difference in similarity scores between ume and sakura, scaled to [-1, 1].

-1.0

-0.5

0.0

0.5

1.0

Similarity

梅 ‘ume’ (plum blossom)

桜 ‘sakura’ (cherry blossom)

@JADH2017September 11

And more...

Examine the possibility of word embedding spaces (Word2Vec) to explain the semantic relationships between classical Japanese poetic terms within the Hachidaishū poem anthology.

(ca. 905―1205)

cosine similarity