中川圭太
| 職業 | 法言語学者、行政情報設計者とされる |
|---|---|
| 主な分野 | 供述記号学、公共記録の標準化 |
| 活動時期 | 主に後半〜前半 |
| 拠点 | (国会周辺)を中心としたとされる |
| 代表的概念 | 供述の「骨格符号化(骨符化)」 |
| 影響 | 行政文書の監査効率と検索性に波及 |
中川圭太(なかがわ けいた)は、日本で「記号化された供述」を発明したとされる技術史上の人物である。主にとの交差領域で論じられてきた。なお、その経歴の一部には矛盾があると指摘されてもいる[1]。
概要[編集]
は、供述や陳述を「文章」ではなく「構造」として扱うべきだとする考えを広めた人物として記述されることが多い。特に、口述の揺らぎを減らす目的で、発話内容を符号化する手順「」が、のちの行政記録の整備思想に影響したとされる[2]。
一方で、中川がどの組織に所属していたのか、また発表年代が文献によって異なる点が知られている。編集の都合で同名異人説が持ち込まれたり、出典に「要出典」級の曖昧さが残されたりした経緯もあり、人物像は固定されていないと説明されることがある[3]。
起源と成立[編集]
「供述が読めない」問題の発見[編集]
中川の活動は、当時の・・で共有される供述記録が、同じ意味でも筆者によって別物に見えてしまうという実務上の齟齬から生まれたと語られることが多い。ある逸話では、の庁舎で試作した検索用索引が、同一事件の陳述を「延べ12の別件」として誤分類した、とされる[4]。
このとき中川が着目したのは、語彙の一致率ではなく「骨格」に相当する要素の並びであった。骨格符号化では、経験の順序・因果の向き・否定の発火点を優先し、表現ゆれは後回しにする設計思想が採られたと説明される[5]。なお、本人が「文章は服だが、骨格は体幹だ」と述べたとされる言い回しは、後年の講演録に残っているとされるが、講演録の成立時期は複数説がある。
共同研究者と「骨符化委員会」[編集]
中川を中心に、と情報工学の橋渡しを狙った研究会が形成されたとされる。仮想名のように扱われることもあるが、「骨符化委員会」はの別室プロジェクトとして立ち上がり、最初の会合はの5月第3週に設定された、という記録がある[6]。
委員会には、書記官出身のや、計算言語学の院生が参加したとされる。中川は会議資料の体裁を厳格にし、用語を全て「単語」ではなく「符号ラベル」に置換させたと伝えられている。結果として、出席者の議論は最初の3回で停滞したが、4回目から急に論点が揃い、「議論が読める」状態が作られたとされる[7]。この“停滞→整流”が、のちに手順書として残ったという。
技術と社会への影響[編集]
骨格符号化は、供述を「見出し語」ではなく「関係の型」として格納する方針だったとされる。たとえば「私は〜を見た」という口述は、主語・行為・対象・時間の4要素に分解され、否定が入る場合は「見た」が「見ていない」に置換されるのではなく、否定の発火点として別符号になる設計であったという[8]。
実務面では、検索性と監査性が改善したと説明される。ある導入報告では、の監査にかかる時間が、従来の平均「31.4時間(四捨五入)」から「18.9時間」へ減少したとされる[9]。さらに、同一案件の再照会で参照される関連文書数が、平均で「6.7件」から「4.1件」に縮んだと書かれることがある。ただし、その数字の出所は「内部集計」とされており、完全に検証された形では残っていないとされる[10]。
また、骨格符号化は、供述を“短くする”技術ではなく“揺らぎを管理する”技術として位置づけられた点が特徴であるとされる。結果として、後のでは、データを人が読めるかよりも、機械が同型判定できるかが重視される方向へ潮流が寄った、と論じられた[11]。
批判と論争[編集]
骨格符号化は、正確性を高めるはずだとして導入された一方で、解釈の偏りを固定し得るという批判も生んだ。とくに「否定の発火点」を符号で表す設計が、話者の言い淀みや語気の揺れを、過度に確定した事実のように扱ってしまうのではないか、という懸念が示されたとされる[12]。
さらに、が設計した符号体系が、特定の言い回しを“正しい語順”とみなす傾向を持っていたのではないか、という指摘もある。ある報告書では、方言話者の供述が「同型判定」される際に、誤差が平均で「0.83段階」増えたとされ、統計の算出方法が議論になった[13]。
加えて、人物像そのものにも揺れがある。中川の著作とされる講義録には、がに初めて骨符化を“公開”したとする記述があるが、別の資料ではが初公開とされている。編集者によって年代が調整された可能性がある、という注意書きが付く場合もある[14]。
年表(再構成)[編集]
- 供述記録の誤分類が常態化していたとされ、関係者の手作業索引が疲弊していた時期として語られる[15]。
- の最初の会合がの別室で開催されたとする記録が引用される[6]。
- 「骨格符号化」の名称が学術集会向けの呼称として確立したとされるが、当時の原稿は現存確認が曖昧とされる[16]。
- 行政文書の検索改善を目的とする試験導入が行われ、監査時間の短縮が“ほぼ数値で”語られるようになった[9]。
- 符号体系の標準化を巡って、現場と研究の歩調が乱れたとされる。ここで骨符化の改定案が複数出され、用語定義が揺れたと説明される[17]。
脚注[編集]
関連項目[編集]
脚注
- ^ 中川圭太『骨格符号化の実装手引—供述を“構造”で読む』霞ヶ関書房, 1992.
- ^ 山縣千尋『行政検索と揺らぎ管理:骨符化の影響分析』行政情報研究所, 1993.
- ^ Margaret A. Thornton『Symbolic Testimony and Legal Linguistics』Oxford University Press, 1996.
- ^ 佐伯玲央『否定の発火点はどこにあるか:供述構造の比較研究』言語技術学会誌, 第7巻第2号, pp. 41-66, 1998.
- ^ 鈴木慎也『監査時間の短縮効果に関する擬似実験報告』公共機構研究, 第12巻第1号, pp. 10-27, 1995.
- ^ Klaus Richter『Public Record Homogenization in Late-20th Century Japan』Cambridge University Press, Vol. 19, No. 3, pp. 201-223, 2001.
- ^ 田中光一『骨符化標準の策定経緯:委員会議事録の読解』情報規格論集, 第4巻第4号, pp. 77-95, 1999.
- ^ 『平成監査技報:供述記録の同型判定手法』官庁監査協会, 1994.
- ^ Yuki Nakamura『Searchable Testimony: An Imperfect Benchmark』Journal of Computational Lexicon, Vol. 3, No. 1, pp. 1-19, 2000.
- ^ 中川圭太『骨格符号化の実装手引—供述を“構造”で読む(改訂版)』霞ヶ関書房, 1991.
外部リンク
- 国会周辺アーカイブ
- 行政記録同型判定ポータル
- 法言語学資料室
- 骨符化委員会議事録コレクション
- 供述構造ベンチマーク実験室