正則言語

17
正正正正 2011/6/27

Upload: halona

Post on 05-Jan-2016

17 views

Category:

Documents


0 download

DESCRIPTION

正則言語. 2011/6/27. 形式言語. Noam Chomsky() 近代言語学者・哲学者・政治思想家 言語 を形式的に解析しようとする試み 形式文法 から言語を構築していく 情報理論との関連性 (オートマトン、構文解析、チューリングマシン等). 形式文法. ある定められた規則(文法)から導出される文字列 G=(N, ∑ ,P,S) N  非終端記号の有限集合       ∑ 非終端記号の有限集合   P 生成規則(有限)       S 開始記号           . 形式文法の例(文脈自由文法). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 正則言語

正則言語

2011/6/27

Page 2: 正則言語

形式言語• Noam Chomsky()• 近代言語学者・哲学者・政治思想家

• 言語を形式的に解析しようとする試み• 形式文法から言語を構築していく

• 情報理論との関連性(オートマトン、構文解析、チューリングマシン等)

Page 3: 正則言語

形式文法

ある定められた規則(文法)から導出される文字列

          G=(N,∑,P,S)• N  非終端記号の有限集合      • ∑  非終端記号の有限集合  • P 生成規則(有限)      • S 開始記号           

Page 4: 正則言語

形式文法の例(文脈自由文法)

      G 1=( N,∑,P,S)

N= { A,B }∑= { 0,1}P={S→0A, A→1A, A→AB,B→0,A→1 }

S→0A→01A→01AB→0110S→0A→01

Page 5: 正則言語

Chomsky 階層1956形式文法のクラス

• 正則文法  Regular Grammar• 文脈自由文法  Context Free Grammar• 文脈依存言語  Context-Sensitive Grammar• 句構造文法  Phrase Structure Grammar

RG CFG CSG PSG⊂ ⊂ ⊂

Page 6: 正則言語

正則言語生成規則が次の形のもの• A → aB• C→b例外として• S→ε (空文字列)

特長有限性オートマトンと等価

Page 7: 正則言語

正則言語の例生成規則が次の形のもの• N={A,B,S}   ∑={ 0,1} • P={ A → 1B,B→0,S→ 1 A}

等価なオートマトンS →   A → B →   F  1 1 0

この言語は 110 を生成する

Page 8: 正則言語

文脈自由文法• 構成規則が以下のような形のものA→a (A N,a (N ∑)∈ ∈ ∪ *)

例N={A,B,S} ∑ ={ 0,1,2 }のときP={S→A 、 A→1 、 B→02,A→0B1 }

• プッシュダウンオートマトンとの関連

Page 9: 正則言語

文脈依存文法

• 生成規則が以下のような形のものβAγ  →  βaγ P={a 、 β 、 γ (N ∑)∈ ∪ * ,A N,a≠ε}∈

β と γ の位置によって A→a が成立する

• 線形高速オートマトン

Page 10: 正則言語

句構造文法• 構成規則が以下のような形のものα→β P={α (N ∑)∈ ∪ * N(N ∑)∪ * ) ,β (N ∑)∈ ∪ * }

• 左辺に少なくとも一つの非終端記号があるだけ

• チューリングマシンとの関連

Page 11: 正則言語

正則文法と有限オートマトン• 正則便法と等価な有限オートマトンを構

成できる

• N={A,B}   ∑={ 0,1} • P={ A → 1B,B→0,S→ 1 A}

S  →  A →   B → F 1 1     0  

Page 12: 正則言語

正則文法における反復補題直観的な理解

• 正則文法 G 1は有限オートマトンに変換できる

• 有限オートマトンには有限の状態しかない

• 長い文字列は必ず同じ状態に到達する• ループを何回回るような文も G1 は受理す

Page 13: 正則言語

正則文法における反復補題• L が正則言語なら、ある定数 n が存在し、

L に属する長さが n またはそれ以上のすべての語 W に対し次のような語 X,Y,Z が存在する

W=XYZ|XY| n≦|Y| 1≧K=1,2,3,…  に対し  XY*Z

Page 14: 正則言語

正則文法における反復補題               S             0 A X   1 B 0 C Y 1 B 1 D N の個数< |Z| Z 0{S,A,B,C,D} 010110  必然的に重複する状態が出る

Page 15: 正則言語

証明• ある生成文字列長 |N| に対し、同じ状態(生成規則)

F が複数( F 1、 F2 )存在する• 1~ F 1で生成される文字列を X 、   F1 +1~ F2 を Y 、   F2~N を Z とする• 定義より | Y| 1≧• |XY| n≦• F1 +1~ F2 はループを構成し何回も文字列を生成で

きる• XY*Z

Page 16: 正則言語

正則言語における反復補題の意味

• 正則言語は反復定理の特長をもっている• ある言語をもってきて、それが反復定理を

みたさなければ、正則言語ではない

• 文脈自由言語についても反復定理が適用できる

• ある条件を満たさなければ文脈自由言語ではない

Page 17: 正則言語

参考文献• Wikipedia• オートマトン・言語理論 富田悦次 横森 貴 森北出版株式会社基礎情報工学シリーズ