i¡ii¡i
| 分類 | 疑似符号体系/テキスト—音声変換用符号 |
|---|---|
| 別名 | 鋸歯符号(きょしふごう) |
| 提唱時期(説) | 1979年ごろ |
| 利用領域 | 低帯域データ送受信、学習用教材 |
| 基礎記号 | 「i」「¡」のみ |
| 関連領域 | ハフマン符号/音韻表記/圧縮率評価 |
| 実装例(説) | 郵政系研究端末の試作 |
i¡ii¡iは、文字列の見た目から生まれたとされる、音声データ圧縮のための疑似符号体系である。主にの周縁分野で参照され、1970年代末には研究会単位で急速に広まったとされる[1]。
概要[編集]
i¡ii¡iは、見た目が整いすぎていることを利用し、入力文字列の並びから発話のリズムを復元するための「疑似符号」と説明されることが多い。通常の符号化が統計に依存するのに対し、i¡ii¡iは“形の規則性”を優先する設計思想であるとされる。
起源については複数の系譜が語られているが、特に有力とされるのは、の下町工房に集った若手研究者が「音声は取れないが、文字の形なら取れる」という状況を口実に作ったという筋書きである。ただし、この筋書きは資料の出所がばらついており、編集者の間でも「定義が滑りやすい符号」として扱われてきた経緯が指摘されている。
なお、符号としての中核は「i」を母音長の基準、を無声音の挟み込み(タイミングずれの指示)に見立てる点に置かれるとされ、復元手順の簡略化によって“講義でそのまま黒板に書ける”ことが評価されたとされる[2]。
成立と発展[編集]
初期の研究会と「鋸歯」発想[編集]
i¡ii¡iが注目されるようになった背景には、の低帯域回線の試験で「毎秒ビット数より、講義中に口頭で示せる復元手順のわかりやすさが重要だった」という事情があったとされる。そこで、暗号でも統計圧縮でもなく、形状の規則性を使う符号化が模索されたのである。
若手の中心人物として、やの名が研究会の議事録に現れるとされる[3]。しかし、両名の所属は資料ごとに揺れ、ある会合ではの委託研究班に、別の会合ではの「教育用音声教材室」に置かれていたと書かれるなど、編集の混在が見られる。
一方で、i¡ii¡iが「鋸歯符号」と呼ばれるようになったのは、復元波形を手描きする際に、の位置を境に振幅が折れ、鋸歯状の境界線が現れたことに由来すると説明されている。この呼称は学会口頭では好評だったが、論文化された途端に“形状の主観性”が問題視されたともされる[4]。
1981年の「郵便電送」実証と数字の誇張[編集]
、東京都港区の研究拠点で「郵便電送・学習音声試作」が行われ、i¡ii¡iが“文字だけで音の雰囲気が復元できる”ことを示すデモに採用されたと語られることがある。報告書では、復元精度を「聞き取り率 92.4%」のように小数点まで記し、さらに『補正後の誤解率は 0.17%』といった細かい数値が並ぶとされる[5]。
ただし、当時の回線が実際には「平均遅延 18〜26ms」であったことが別文献に記されており、報告書側の条件「平均 12ms」が矛盾すると指摘する編集者もいる[6]。それでも、デモ参加者が「黒板に書いたi¡ii¡iを口にしただけで、講義の例文が戻ってくる」と驚いたという逸話は、会合のたびに再引用されてきた。
また、試作端末の型番がであるとされる点は、同時期の通信機器の命名法と整合する一方、端末を製造したとされるの系列は資料により不揃いであるとされる。この「矛盾込みで面白い」状態が、結果として符号の神話化を後押ししたとも言われる。
仕組みと評価方法[編集]
i¡ii¡iの説明では、まず符号文字列を「iの連なり」および「の挟み込み」に分解し、音声の長短(拍)に対応させる。具体的には、母音長基準を「i=1拍」とし、を「直前拍の揺らぎ(±0.08拍)」として扱うとされる[7]。こうした値は、復元波形をオシロスコープで観測したという体裁で語られるが、観測条件は文献ごとに揺れている。
評価は、圧縮率そのものよりも「復元された音の“誤解の種類”」に比重が置かれたとされる。たとえば、同音異義(聞き間違い)が起きた場合でも、意味が完全に反転する誤りより、“ニュアンスがズレるだけ”の誤りの方が許容されるという考え方が背景にあった[8]。この基準が当時の教育現場と噛み合い、符号化手法の選択が技術面だけでなく運用面の都合にも左右されたという。
なお、講義用の簡易版では「iの数だけで語頭アクセントを決め、の数で語尾の減衰を決める」という短縮が提案されたとされる。この短縮により黒板採点が可能になった一方、単語長に対して誤差が累積するため、全体の復元誤差が“最大で 3.1拍ぶんズレる”とする極端な報告も残っている[9]。
社会的影響と逸話[編集]
i¡ii¡iは技術史というより、教育・メディア史の周縁において語られることが多い。理由は、符号体系自体が難解というより、口頭で説明しやすい見た目(「i」とだけ)で構成されていたためである。編集者の一人は、これが“黒板の上のメタ言語”として機能したと表現している[10]。
また、符号が広まるにつれ、通信社や自治体の広報現場で「文字列ギミック」が流行したとされる。たとえば、大阪府大阪市のとある区役所が、問い合わせ窓口の待ち時間表示にi¡ii¡iを採用し、表示が進む速度で“今から呼ばれる順番が想像できる”と評された、という逸話がある。ただし、この区役所名は資料によりとに揺れており、少なくとも史料批判の観点では慎重な扱いが必要とされる。
さらに、符号が“覚えやすい”ことが逆に問題になったとも指摘される。簡単に真似できるため、模倣版が乱立し、相互互換が崩れたのである。結果として、講義で使う符号を「公式版」と「教員独自版」に分け、配布プリントにの位置を点線で示す工夫が行われたとされる[11]。
批判と論争[編集]
批判の中心は、i¡ii¡iが統計的根拠を欠くのではないか、という点に置かれたとされる。具体的には、同じ文字列でも読み上げの“癖”が異なる話者では復元結果が変わり、教育目的には適するが通信目的には弱い可能性がある、とする指摘がある[12]。
一方で反論として、復元の目的が“原音の再現”ではなく“誤解を減らす再提示”であるなら、話者依存の揺らぎはむしろ許容されるという立場が示された。ここで、ある論文では「復元は最終的に人間側の解釈モデルに吸収される」と記され、符号の意味が工学から心理へ寄っていった印象が強いとされる[13]。
なお、極めて個人的な論争として、「i¡ii¡iを真面目に使うと、黒板上の記号が“口癖”になってしまい、学生が会話を記号化し始める」という風刺的な苦情が残っている。この逸話は学術誌ではなく地域の学習会ニュースに載ったとされ、出典の確度が低いにもかかわらず引用回数が多い点で、研究史の“笑いどころ”として扱われてきた。
脚注[編集]
関連項目[編集]
脚注
- ^ 佐伯 亘「i¡ii¡i 符号化の教育的有効性について」『日本言語情報学会誌』第18巻第3号, pp. 201-219, 1982年.
- ^ 西條 玲奈「鋸歯符号の形状復元:黒板手順としての設計」『情報と伝達』Vol.12, pp. 77-96, 1983年.
- ^ 山路 みなと「低帯域回線における“誤解の種類”評価」『通信方式研究』第9巻第1号, pp. 1-15, 1981年.
- ^ M. A. Thornton「On Visual Rhythm Codes for Speech Approximation」『Journal of Applied Linguistics Engineering』Vol.4, No.2, pp. 33-54, 1984.
- ^ K. D. Nakamura「Interoperability Failures in Teaching-Oriented Encodings」『Proceedings of the Peripheral Data Compression Workshop』Vol.7, pp. 140-158, 1986.
- ^ 田川 正己「郵便電送・学習音声試作報告(JANET-17)」『郵政技術年報』第22号, pp. 55-88, 1982年.
- ^ R. P. Halden「Speech Recovery from Symbol-Only Cues」『Transactions on Human-Centered Signal Representation』Vol.2, No.4, pp. 201-230, 1985.
- ^ 編集委員会「i¡ii¡i 研究小史(再編集)」『学術アーカイブ通信』第1巻第6号, pp. 5-12, 1999年.
- ^ 東神電子通信工業株式会社『鋸歯符号実装ガイド(第2版)』東神出版, 1982年.
- ^ 『郵便電送・学習音声試作報告(JANET-17)』港区資料編纂室, 1982年(タイトル表記に揺れがある).
外部リンク
- 鋸歯符号アーカイブ
- 神田・音韻教材研究会
- 低帯域回線デモ倉庫
- 教育用圧縮符号データベース
- 地域学習会ニュース復刻サイト