生成文法
| 分野 | 言語学・数理モデル化 |
|---|---|
| 提唱の起点 | 架空の「規則復元工房」実験(19XX年、のちに伝承化) |
| 主要対象 | 統語(文の組み立て)と意味の相関 |
| 方法の核 | 書き換え規則と検算器(校正アルゴリズム) |
| 関連分野 | 計算言語学・暗号文法・教育工学 |
| 論争の中心 | 適用範囲と「規則の由来」 |
生成文法(せいせいぶんぽう)は、文の内部構造を規則として再生し、無限に近い産出が可能であるとする上の考え方である。特に、研究室での「入力—変換—出力」の実験運用が発達したことから、計算機科学とも密接に結び付けられてきたとされる[1]。
概要[編集]
生成文法は、発話や文章がどのように組み立てられているかを、あらかじめ用意した規則体系として記述し、その規則から新しい文を生成する枠組みとして説明されることが多い。規則体系は単なる辞書の並びではなく、階層的な構造と、構造を別の構造へ変える変換手続き(書き換え・折り返し・再編)を含むものとして扱われる[1]。
この考え方は、当初から「言語を観察して分類する」よりも、「言語が生成される機構を再現して検証する」方向に重心が置かれていたとされる。なお、現在の学術史では直接の先行例が議論されることがあるが、生成文法の特徴は、規則の適用順序にまで踏み込んだ点にあるとされる[2]。
また、生成文法は教育現場にも飛び火し、模範答案を「規則の到達点」として採点する方式が考案された時期があった。文法問題を、誤答パターンではなく「規則のどこで分岐できなかったか」で診断するという主張が広まり、自治体レベルの実証事業も行われたと伝えられている[3]。
歴史[編集]
規則復元工房と“無限産出”の儀式[編集]
生成文法の起源は、学術史の定番とは異なる形で語られることがある。すなわち、の旧庁舎に設けられた「規則復元工房(きそくふくげんこうぼう)」が、文の骨格を“磁気カード”から読み戻す装置として最初に構想された、という伝承である。工房の責任者として言及されるのは、通称でと呼ばれた技官であるが、一次記録は少なく、複数の回想録で一致するのは「変換器の待機時間がちょうど17分だった」という点だけである[4]。
この装置は、同じ入力文を与えるたびに出力文が同一になることを目標にしていたが、途中で「同一ではなく、規則通りに増殖する」ことが発見されたとされる。工房メモによれば、増殖率は最初の週で約1.003%、翌月で約1.021%にまで上がり、最終的に「理論上は無限に近い産出が可能」という言い回しが社内規程として残されたという[5]。この“無限産出”が、のちの生成文法のキャッチフレーズになったとする説が有力である。
ただし、ここでの規則とは意味内容そのものではなく、統語の骨格をなぞるものとして規定されていた。つまり、同じ骨格を共有する文が大量に派生することが重視され、意味の厳密性は後回しにされたとされる。一方で、後年になって「意味のズレが統語規則の欠陥として検出されるはずだ」と主張した研究者も現れ、意味と統語の結び付けが制度化されていくことになった[6]。
文法工学局と“校正アルゴリズム”の導入[編集]
生成文法が社会に定着した転機として、の内部協力組織「文法工学局(ぶんぽうこうがくきょく)」が挙げられる。局は、教育用の文章を大量に処理するため、誤り検出を“作文の採点表”に結び付ける必要があったと説明されている。ここで開発されたのが、校正アルゴリズム「綴り差分検算器(てつづりさぶんけんさんき)」である[7]。
検算器は、文章をトークン単位に分解し、規則適用の痕跡をログに残す仕組みで、研究者たちはログが“文法の痕跡標本”であると見なした。ある報告書では、ログの圧縮率が「平均で92.7%」であったと記録されているが、別の報告書では「92%ちょうど」であり、少なくとも数字の一致は確認されないとされる[8]。この不一致は、編集段階での整形によるものと考えられている。
さらに局は、規則の適用順序(先に折り返すか、先に書き換えるか)を“教育用カリキュラム”のレーン分岐として設計した。結果として、学習者の誤りは「規則の適用順の違い」として分類され、練習問題が個別化される方向へ進んだ。こうした枠組みが、生成文法を単なる学問ではなく、運用される制度として押し上げたと評価されている[9]。
国際シンポジウムと“暗号文法”への逸脱[編集]
一方で、生成文法は計算機科学側の関心から、別の顔を持つようにもなった。特に、暗号文法の系譜が生まれたのは、ある国際シンポジウムにおいて「文法規則を鍵として通信文を検証できるのではないか」という即興提案がきっかけだったとされる。提案者として名が挙がるのはで、彼女は“検算器ログ”を検証用ハッシュとして使う構想を提示したとされる[10]。
その後、傘下の作業部会で、文法規則の難読化手順が標準化された。ここで使われたのが「三層書き換え(Three-Layer Rewrite)」という概念であり、表面層・骨格層・復元層の順に変換するという。面白い点は、文献によって“三層”の定義が少しずつ異なり、骨格層の中身が「副詞の位置」とされる版と「補文標識の変換」とされる版が併存していることである[11]。
この逸脱は批判の対象にもなった。すなわち、生成文法が本来目指したはずの透明性が、暗号文法では隠蔽によって置き換えられたと指摘されたのである。もっとも、その隠蔽が“規則を学習する”動機付けとして機能した面もあり、結果として生成文法は研究と実装の両面で広がり続けることになった[12]。
方法と構造[編集]
生成文法は、規則体系を用いた生成過程として理解されることが多い。具体的には、文の候補を作るために初期構造(原型)から出発し、条件付きの書き換え規則を順に適用して、目的の形に到達させる。ここで重要なのは、各規則が適用可能な“場”が指定される点であり、単なる置換ではないとされる[1]。
規則適用の順序は、ときに“校正”として取り扱われる。例えば、検算器は生成された文を再度解析して、逆変換が成立するかを調べることで、規則体系の整合性を確認する。整合性が崩れると、ログに特定のパターンが出ると説明されるが、そのパターンは研究室ごとに表現が異なり、「92.7%圧縮」のような曖昧な数値に置き換えられることがある[8]。
また、生成文法では「境界ノード」と呼ばれる制約点が重視される。境界ノードは、語順をまたいで統語の折り返しを可能にする要所として設定される。もっとも、境界ノードの数については、ある研究者が「平均で3個」と述べた一方、別の研究者は「中央値が3個で平均が3.1個」と報告したとされ、統計の取り方が議論されている[13]。
社会的影響[編集]
生成文法の社会的影響は、教育、翻訳、そして行政文書の標準化に波及した点にある。教育では、作文を規則の到達経路として扱う診断が普及し、誤りは“知識不足”ではなく“規則の選択ミス”として表現された。ある自治体の試験導入では、採点時間が平均で41秒短縮されたとされるが、当時の報告書では「平均」と「中央値」が混在しており、読み手に判断を委ねる形になっている[14]。
翻訳では、生成文法が“変換規則の辞書化”として活用された。語彙の対応関係ではなく、統語の変換ステップの対応関係を学習するという発想が広まったとされる。結果として、直訳よりも、文の骨格が保たれる翻訳が実現された、とされることが多い。ただし、骨格が保たれるほど“言い換えの自由”が減るという指摘もあり、翻訳会社は内部で方針を揺らしたとされる[15]。
行政文書では、定型文を規則で組み立てることで、誤字脱字と語順事故を減らす取り組みが行われた。特にの一部部署では、申請書の文面が規則生成により自動整形されるようになり、問い合わせ件数が「月あたり約270件→240件」と報告された[16]。この効果が生成文法そのものによるものか、単なる文面テンプレート導入によるものかは、後年になって争点化した。
批判と論争[編集]
生成文法には、実装の都合が先行し、言語の多様性を規則体系に押し込めすぎるのではないか、という批判があった。特に、暗号文法への転用は“検算ログの秘匿が研究の透明性を損なう”という問題として論じられた。批判側の論者は、規則が増えるほど学習者が“規則に従う奴隷”になり、言語能力が萎むと指摘したとされる[12]。
一方で擁護側は、規則が増えるのではなく、規則が整理されることでむしろ理解が促進されると反論した。実証として、あるシステムでは学習者の正答率が「第1週で63%→第4週で71%」へ上昇したと報告された。ただし、その学習者群が誰で、事前知識をどう揃えたかは別紙に回され、追試が難しいとして不満が出たとされる[17]。
さらに、生成文法の“起源の物語”自体にも異論がある。規則復元工房の伝承は、学会誌では脚色されて紹介されることがあり、ある編集者は「待機時間17分は象徴的に切り出した数字」と書いたとされる。しかし、その編集者自身が“象徴的切り出し”の根拠を示しておらず、逆に“よけいに信じたくなる誤差”として笑いを誘う一因になったと指摘されている[4]。
脚注[編集]
関連項目[編集]
脚注
- ^ 渡辺精一郎『規則復元工房の記録(港区旧庁舎分)』内閣文法局, 19XX.
- ^ Margaret A. Thornton「Log-Based Consistency Checking for Generative Frameworks」『Journal of Computational Syntax』Vol.12 No.3, 1984, pp.41-66.
- ^ 佐伯薫『綴り差分検算器の設計思想』文法工学局出版部, 1991.
- ^ 山内玲子「三層書き換えの定義揺れとその影響」『言語計算研究』第7巻第2号, 2002, pp.120-139.
- ^ 伊藤正直『行政文書の統語自動整形』国土文書研究所, 2016.
- ^ Nakamura, H. and Weiss, K. “Encoding Grammar as Verification Keys”『Proceedings of the International Symposium on Verifiable Linguistics』Vol.5, 1999, pp.201-219.
- ^ 鈴木慎一『作文診断における規則到達経路モデル』日本教育情報学会, 2007.
- ^ 田中ユリ「圧縮率と説明責任—92.7%の行方」『教育技術評論』第3巻第1号, 2012, pp.10-27.
- ^ Heinrich, M.『無限産出神話の系譜』Oxford Grammar Press, 2001, pp.77-95.
- ^ 編集部「生成文法特集:透明性の再設計」『言語研究年報』第18巻第4号, 2020, pp.1-9.
外部リンク
- 規則復元工房アーカイブ
- 文法工学局データ閲覧ポータル
- 綴り差分検算器デモサイト
- 暗号文法研究会の公開講義
- 行政文書統語標準ライブラリ