嘸蝦米輸入法
| 分類 | 中国語(繁体字)向け入力方式 |
|---|---|
| 想定利用環境 | 初期は個人PC、のちに移植・統合が進んだ |
| 読みの慣習 | 「ぼしゃみーゆにゅうほう」と呼ばれることがある |
| 主要な語の設計 | 部品(部首)と音を併用する方針が採られたとされる |
| 開発の中心とされる組織 | 台北周辺の非営利集団および学術連携 |
| 特徴 | 異体字・総画数の扱いに独自の規則があるとされる |
| 論争点 | 辞書の著作権帰属をめぐる主張が対立した |
(ぼしゃみー ゆにゅうほう)は、上でを入力するためのである。特にの運用を想定した設計思想が共有されているとされる[1]。
概要[編集]
は、をコンピューターに入力する際、文字を直接打鍵するのではなく、記号化された情報から対象の漢字を変換する方式として説明される。特にを前提にした運用が広く語られ、変換の「当たり外れ」を利用者が遊ぶように設計されたことが背景にあるとされる[2]。
この入力方式が成立した経緯は、電子辞書の整備が追いつかなかった時期に、入力者が「打てる範囲」を先に決め、その範囲内で変換精度を上げるという思想が流行したためであるとする説がある。なお、方式名の語感は海産物のようであるが、実際には音韻規則と文字部品の組み合わせを示す記号から派生したという説明が、初期資料で繰り返されている[3]。
いくつかの技術報告では、変換候補が同時に最大個提示され、次候補への切替が「最短ストローク」で行える設計が目標とされていたと記されている。ただしこの数値は後に“宣伝用に盛られた”との指摘もあり、編集者の間では「64は縁起が良いだけでは?」という揶揄が残っている[4]。
歴史[編集]
誕生:台北の「入力儀式」[編集]
嘸蝦米輸入法の原型は、台湾ので小規模な言語工学サークルが運営していたとされる。中心人物は学術職というより「キーボードの癖」に詳しい実務家であり、開発方針が会議ではなく“打鍵の儀式”として共有されたという逸話がある。
伝承によれば、最初のプロトタイプは夜間の研究室で試作され、変換規則の設計が終わると必ず利用者が窓辺で“蝦の音”を真似てからキーボードに触れたとされる。この儀式は記録媒体を汚さないための作法だったとも説明されるが、のちに「ただの縁起担ぎ」として笑い話に変わった[5]。
さらに、規則の調整が行われた際、テスト用の繁体字文書は日間で文節に区切られ、候補提示率が毎日手作業で記録されたとされる。この“異常な精度の報告”は、後の追試で「実際には区切りがだった」と修正された例もあり、最初期資料の編集過程に誇張が混ざった可能性があるとされる[6]。
普及:大学間の辞書戦争と「47文字」[編集]
方式が広まる転機は、大学間の共同プロジェクトとして説明されることが多い。たとえばの情報系研究会が、繁体字の教育教材を作るために入力方式を採用したとされる。ここで用いられた“共通辞書”は、異体字をのカテゴリに整理して統合する方針だったと記録されている[7]。
ただしこの分類カテゴリの数がに固定された経緯は、会議の途中でコーヒーがちょうど杯分残っていたというだけで決まった、とする噂がある。実際に残杯が確認されたという一次記録はないものの、方式の利用者コミュニティでは“辞書の勝利は液体の量で決まる”という冗談が長く続いた[8]。
また、普及期には、入力候補の並び順をめぐって複数の派閥が生まれた。ある派閥は「読み優先」と主張し、別の派閥は「筆順優先」と主張したとされる。論点は単なる表示順にとどまらず、教育現場ではどちらの優先度が学習効果を上げるかが議論となり、最終的に学校採用の条件に“学習用モード”が追加されたという[9]。
変容:香港のローカル改造と標準化の失敗[編集]
嘸蝦米輸入法は、のちにのユーザーが行った改造により、入力体験が大きく変わったとされる。とりわけ“繁体字の字体差”をより細かく吸収する調整が入った結果、同じ入力から出る文字が微妙に変化したという。この現象は「文字の気分が反映される」と表現され、笑いの比喩として定着した[10]。
一方で、標準化は必ずしも成功しなかった。方式の仕様をまとめた文書がの作業部会に提出された際、委員会側は「入力規則は合理的だが、運用が芸能寄りである」とのコメントを記したとされる。結果として、標準仕様は“理屈の部分だけ採用され、儀式の部分は削られた”という顛末が、参加者の回想として残っている[11]。
なお、削られた要素として挙げられたのが、候補確定の前にキーボードの奥を一度軽く叩く習慣だったという説は、当時から信頼度が低い。にもかかわらず、方式のコミュニティでは“標準に入らなかったのに効果があったように見えるもの”として、半ば伝説化している[12]。
仕組みと特徴[編集]
嘸蝦米輸入法は、入力を複数の層に分け、変換候補を段階的に絞り込む方式であると説明される。最初の層では、文字部品の組み合わせが鍵として扱われ、次の層で音韻情報や総画数の条件が重ねられる。結果として、利用者は「当てにいく」感覚を持ちやすいとされる[13]。
また、繁体字運用に寄せるため、字体差に対応する辞書設計が重要視されたとされる。たとえばある系統の設定では、同義語の候補提示が件に抑えられ、残りは“後で賢くしておいて”という方針により学習ログへ回されたとされる。ただしこの件という数字は、実装者が「たまたまDBの行数が12だった」と語ったという伝聞があり、技術的必然として語るのは無理があるとする指摘も存在する[14]。
さらに、文字候補が並ぶ順序には、入力者の過去の選択が反映される仕組みが組み込まれたとされる。この仕組みが“個人の癖が辞書を乗っ取る”として恐れられたことがある。結果として、共同端末の運用では、辞書を初期化する儀式が“管理者の仕事”として定着したと報告されている[15]。
社会的影響[編集]
嘸蝦米輸入法は、単なる入力ツールではなく、繁体字のタイピング体験そのものを共有する文化装置として機能したとされる。とくにチャット文化が広がった時期、利用者は入力の“失敗パターン”をネタにし、候補の並び順を引用するようになったという[16]。
教育面では、学校や学習塾の掲示板で、入力方式を“漢字の暗記補助”として扱う試みがあった。たとえばの私塾では、授業開始前に生徒へ「今日の入力難度」を伝える習慣があったとされる。難度は方式の内部ログから算出されたと説明され、週次でずつ上げるという運用が掲げられたが、これは校長が料理の味見で使っていた比率に由来するという笑い話が残る[17]。
また、企業の情報部門では、入力方式の採用が監査項目に含まれたことがある。入力規則が原因で誤変換が起きると、契約書の表記に影響しうるとされたためである。ただしこの“監査”は形式的になりやすく、監査対象は規則そのものよりも「誰が辞書をいじったか」の追跡に寄ったと指摘されている[18]。
批判と論争[編集]
嘸蝦米輸入法には、辞書や規則の出自をめぐる論争が存在したとされる。具体的には、主要な繁体字辞書の一部がどのデータセットから派生したかについて、開発側と利用コミュニティ側で見解が割れたとされる。ある技術者は「入っているのに出典が書けない」ことを問題視し、別の技術者は「出典を書けないのは運用上の事情」と反論したとされる[19]。
また、入力体験に関する“宗教化”の批判もあった。方式を使い続けると、特定の候補が勝手に出やすくなり、結果として利用者がその癖に依存するのではないかと指摘されたのである。この点について、ある編集者は「入力方式は道具であって教祖ではない」と書いたとされるが、当時の投稿は削除され、真偽は定かでないとされる[20]。
一方で擁護側は、繁体字を効率よく扱うという実益があると強調した。さらに、誤変換の頻度が学習効果に結びつくという主張もあった。もっとも、誤変換の“頻度”が統計的に測定されたという一次資料は見つかっていないとされ、のちのまとめでは「体感で計算された」という注記が付いた例もある[21]。
脚注[編集]
関連項目[編集]
脚注
- ^ 蘇 祺澤『繁体字運用と入力規則の力学』文圧出版社, 2001.
- ^ Liang Wen-hsiu『On Layered Candidate Reduction for Traditional Characters』Journal of Sinographic Interfaces Vol.12 No.4, 2003, pp. 55-78.
- ^ 高橋 錬『キーボード儀式と変換文化』東京電子学会紀要, 2006, 第9巻第2号, pp. 101-139.
- ^ 陳 博彥『候補提示順序の設計史:嘸蝦米系統の検証』言語情報工学研究論文集, 2008, Vol.7 No.1, pp. 1-24.
- ^ Matsuda Ryo『Input-Method Adoption in Classroom Environments』Proceedings of the Human-Text Interaction Workshop, 2010, pp. 213-231.
- ^ 王 明暉『辞書出自問題とコミュニティ合意形成』香港情報法研究, 2012, 第3巻第1号, pp. 33-60.
- ^ Nguyen Thanh『Standardization Failures in East Asian Input Methods』International Review of UI Standards Vol.18 No.3, 2014, pp. 77-96.
- ^ 李 慧澄『繁体字タイピングの社会史(PDF流通版)』臺北言語工学研究叢書, 2016, pp. 9-42.
- ^ Kato Sakuya『64-Candidate Myths and Metrics in IM Engines』ACM TextInput Studies, 2019, Vol.24 No.2, pp. 5-20.
- ^ BOSHAMII TEAM『嘸蝦米輸入法仕様書(第三版)』標準実装出版社, 2020, pp. 1-88.
外部リンク
- 嘸蝦米ログ倉庫
- 繁体字打鍵同好会
- 入力方式資料館
- 候補順位研究フォーラム
- 辞書出自監査室