サームプテラ語
| 英語名称 | Saumptelaology |
|---|---|
| 対象領域 | サームプテラ語の文法、表記体系、音韻対応、暗号化との関係 |
| 上位学問 | 文字情報科学 |
| 主な下位分野 | 基礎サームプテラ語学、応用サームプテラ語学、ダイヤクリティカル統計学 |
| 創始者 | マルコ・ヴァレリオ・レーヴィ(Marco Valerio Lévy) |
| 成立時期 | ごろ |
| 関連学問 | 記号論、音響言語学、計算言語学、古文書学 |
サームプテラ語学(よみ、英: Saumptelaology)とは、級の特殊文字体系を含む言語構造を研究する学問であり、の一分野である[1]。
語源[編集]
「サームプテラ語」は、もともと交易帳簿の端書に現れた地名「Sarumptela」を、後世の研究者が音写したものとされる。語源はなお明確でないが、作業仮説として「サーム」(密閉)と「プテラ」(板状記号)の合成であると定義された[2]。
当該語学が注目される契機は、ラテンアルファベットにダイヤクリティカルマーク(上付き・下付きの符号)を用い、結果として「50文字が使用されている」と記述された古写本が見つかった点にある。写本の奥付には、付で「50文字規格」を承認した機関としてが挙げられているが、同局が実在したかどうかは資料の整合性に乏しく、検証は揺れている[3]。
なお「語」は一般に言語を指すが、本項では学問体系を指すため、「サームプテラ語学」として扱うのが慣例である。これにより、言語そのものの議論と、表記・計測としての議論が区別されてきたとされる[4]。
定義[編集]
サームプテラ語学は、サームプテラ語の表記体系を中心に、音韻・形態・統語の対応関係を「符号圧縮モデル」として再構成することを対象とする学問である[5]。
広義には、ダイヤクリティカルマークを含むラテン文字列を「文字の位相」として扱い、位相遷移の統計法則を研究する立場を含む。狭義には、「50文字規格」を満たす表記体系に限定し、その文法規則を記号列の制約充足として定式化したものを指す[6]。
本学問では、対象データを「棚卸し最小単位(Inventory Minimal Unit; IMU)」と呼び、IMUの平均長が0.93文字であることが実務上の目安とされた。さらに、IMUの並び換えを禁止する規則が“合図板規則”として整理され、体系化したのがサームプテラ語学の父と呼ばれるである[7]。
また、サームプテラ語が暗号文として流通していた可能性があるため、言語学としての定義と、情報理論としての定義がしばしば混同された。そこで本学問では「言語」と「符号」を区別し、言語は意味の担体、符号は意味の搬送路であると定義した[8]。
歴史[編集]
古代[編集]
サームプテラ語学の前史として、の港湾都市で、粘土板に位相記号を刻む習慣があったとする説がある。もっとも、この段階の資料は「板状記号の偏倚率」がしか示されていないため、言語学的復元には飛躍があるとされる[9]。
一方で、地方の商館日誌に「上下一対の点を置くと、同音異義語が消える」と記されていたとの証言も残る。これが、後のダイヤクリティカル運用の原型として解釈された[10]。
近代[編集]
近代に入ると、前後で、の文書整備が「50文字規格」へと収束したと説明される。とりわけ、の第3回“文字位相会議”において、サームプテラ語学が独立分野として承認されたとされる[11]。
ここで決められたのが、ラテンアルファベットに対してダイヤクリティカルマークを付与し、総文字数が50となるよう調整する手順である。学会報告では「半角の空白は位相として扱い、空白を含む列長の平均を7.12に固定する」といった、過剰に具体的な記述が現れており、後の批判の種にもなった[12]。
現代[編集]
現代では、サームプテラ語学は計算機実装へと拡張され、音韻—符号—意味の三層モデルが主流となっている。とりわけに公表された「IMU連結制約パッケージ」により、文法を有限オートマトンで近似できるとする結果が報告された[13]。
ただし、位相記号の機械読み取りでは、OCR誤読に由来する“ダイヤ欠損”問題が頻発したとされる。ある研究グループは、誤読率が「最初の100万文字符号で0.0043に収束した」と述べたが、同時に別のデータでは0.0061とされており、再現性は揺らいでいる[14]。
分野[編集]
サームプテラ語学は基礎サームプテラ語学と応用サームプテラ語学に大別される[15]。
基礎サームプテラ語学では、狭義の「50文字規格」から導かれる文法制約、ダイヤクリティカルマークの機能分類、音韻対応表の復元が扱われる。特に、同一の基本文字に対し異なる符号を付与したときの識別率(識別率は“誤差の余白”として定義される)が主指標となる[16]。
応用サームプテラ語学では、古文書の解読、偽造防止用の位相署名、教育用の“位相なぞり教材”などが研究対象となる。とくにの小規模図書館が導入した教材は、学習者の書き癖を位相遷移として採点する方式で知られ、導入後3か月で平均採点が12.6%上昇したと報告された[17]。
なお、この上位分類に加え、ダイヤクリティカル統計学は事実上の橋渡し分野として発達し、基礎と応用の両方に影響を与えているとされる[18]。
方法論[編集]
サームプテラ語学の方法論は、文字列を「位相付き記号列」として扱い、意味と対応するのは位相遷移のグラフであるとする点に特色がある[19]。
具体的には、まず文書をIMU単位へ分割し、次にダイヤクリティカルマークの有無を“位相ラベル”として付与する。つづいて、位相ラベルの並び換えを制限する“合図板規則”に照らし、許容集合を生成する。許容集合のサイズが「平均18.4」である場合は有効な復元と判定される、という運用則がある[20]。
さらに、サームプテラ語学では音韻情報が直接記されない場合でも、符号列の反復から韻律の癖を推定する「逆位相推定」が用いられる。ただしこの推定は恣意性が強く、結果に対して“経験的補正係数”を掛ける運用が行われている[21]。
なお、研究者間では、補正係数の選び方をめぐって手続きの透明性が要求される傾向にある。ある論文では係数を1.000ではなく1.017に固定したと記され、読者を困惑させたと同時に、実務ではその方が安定したという逸話も伝わっている[22]。
学際[編集]
サームプテラ語学は、言語学、暗号研究、教育工学、図書館情報学といった領域と結びついて発展してきたとされる[23]。
言語学との関係では、サームプテラ語が持つとされる“位相による同音異義語の解消”が、音韻論の補助指標として扱われることがある。特にの派生研究では、位相ラベルを韻律素性の代理変数として扱い、音響データが乏しい資料にも適用できる可能性が示された[24]。
暗号研究との関係では、位相署名が鍵となる。位相署名は、同じ平仮名・漢字に見えてもダイヤクリティカル運用が異なる場合にだけ復号できるとされ、偽造対策に採用された例が報告されている。ただし、報告書では「解読キーの平均長は44ビット」と記される一方、別の添付資料では63ビットとされており、整合性が問われた[25]。
教育工学との関係では、学習者が書いた文字を位相遷移のログとして保存し、成長曲線(改善率の傾き)が教材改訂に反映される。こうした学際的手法により、サームプテラ語学は実証志向へ傾いたと評されることが多い[26]。
批判と論争[編集]
サームプテラ語学は、文字体系の解釈が研究者の推定に依存しすぎるという批判に晒されてきた。とくに「50文字規格」の根拠資料が限定的であることから、学会では再検証の必要性が繰り返し指摘されている[27]。
一方で“支持派”は、規格の整合性が統計的に十分であると主張する。ある支持派の代表は、位相遷移のグラフにおける最短経路が平均で3.17本に収束すると述べたが、対する反対派は「その3.17が恣意的に選ばれた経路集合の平均である」と反論した[28]。
さらに、の教材導入に関連して、教育効果が教材の質ではなく採点基準の学習に依存しているのではないかという論争が生じた。採点ログの統計処理をめぐって、中央値ではなく平均を採用したことが不透明だったとする指摘がある[29]。
最後に、学問名の由来が古写本の記載に依拠している点が“語源神話”と揶揄されることもある。ただし、語源神話であることを認めない派も存在し、論争は現在も継続しているとされる[30]。
脚注[編集]
関連項目[編集]
脚注
- ^ マルコ・ヴァレリオ・レーヴィ『合図板規則とIMU分割の理論』ローマ公共測字局出版局, 1890.
- ^ Claudia R. Fontenay『50文字規格の機械復元に関する実験報告』Journal of Phase-Letter Studies, Vol.3 No.2, 1897.
- ^ 中原操「位相遷移グラフによるサームプテラ語文法の近似」『言語記号学研究』第12巻第1号, 1964.
- ^ Hiroshi Takamura『IMU連結制約パッケージの設計理念』Proceedings of the International Workshop on Orthographic Compression, Vol.7, pp.41-66, 1998.
- ^ Ethan W. Larkspur『ダイヤ欠損がもたらす復元誤差:ログ解析アプローチ』Computational Orthography Letters, Vol.22 No.4, pp.201-228, 2003.
- ^ サラ・ケンブリッジ『位相署名と偽造耐性:教育資料への応用』暗号と教育の学際誌, 第5巻第3号, 2011.
- ^ Giuseppe M. Bellini『Sarumptela地名伝承の再評価』Archivio Mediterraneo di Filologia, Vol.18, pp.77-103, 1932.
- ^ 楊思源「合図板規則の統計的妥当性について」『日本記号統計論文集』第9巻第2号, 1988.
- ^ “東京港湾文書群における位相記号の観測”『図書館情報学年報』第33巻第1号, 2007(タイトルが一部不正確とされる).
- ^ María de la Cruz『OCR誤読率0.0043の再現性検証』International Journal of Misread Typography, Vol.10 No.1, pp.12-35, 2016.
外部リンク
- Saumptelaology資料館
- 位相遷移グラフ・アーカイブ
- ダイヤクリティカル統計学ポータル
- IMU分割チュートリアル
- 合図板規則リポジトリ