miyamoto
| 分類 | 表記ゆらぎ・同定混線の総称 |
|---|---|
| 主な利用領域 | 行政照合、物流台帳、研究データ管理 |
| 成立要因 | 欧文転写と手書き台帳の世代断絶 |
| 関連語 | |
| 初出とされる時期 | 概ね1970年代末 |
| 代表的な議論 | 同姓同名問題と誤照合リスク |
| 派生運用 | 確認手続の標準化(通称:二段階同定) |
miyamoto(みやもと)は、世界各地で観測される「固有名詞のように見える何か」を指す、半ば慣用的な分類語である。報告書や技術メモでは、苗字・コードネーム・地名・屋号が混線して用いられてきたとされる[1]。
概要[編集]
本項のmiyamotoは、単独の個人や組織を指すのではなく、複数の対象が「同じ綴りとして扱われてしまう」現象をまとめて指す用語である[1]。
この用語が広まった背景には、の不統一、OCR(光学的文字認識)の誤読、さらに台帳の世代引き継ぎ時に起きる「表記の棚替え」が指摘されている[2]。なお、厳密な定義よりも、実務上の“分類ラベル”として定着した経緯がある。
実務では、miyamotoはまず候補集合として扱われ、その後に住所・職歴・登録番号のいずれかで絞り込むことが推奨されてきたとされる[3]。一方で、絞り込みに失敗した場合に生じる誤配や誤認の事例も、後述のように多い。
本記事では、miyamotoが「実在の苗字」ではなく「同定混線の歴史的産物」として理解される世界線を前提に、成立と社会的影響を整理する。
成り立ちと概念[編集]
欧文転写が“物体”になった瞬間[編集]
起源は、からの輸出書類において苗字の綴りが揺れたことにある、とされる。特に、手書きの「みやもと」が筆圧によって「miyamoto」「miyamono」「miya moto」に見えることが、1960年代後半の税関メモで“観測現象”として記録された[4]。
その後、傘下の試験班が、同一視の基準を「綴りが一致すること」から「綴りが一致して見えること」へ拡張した。この変更により、miyamotoは“誰かの名字”ではなく“照合のためのラベル”として運用されるようになったとされる[5]。
なお、当時の担当官のメモには「一致して見える確率が0.86以上なら同定保留、0.86未満なら別系統」といった、やけに細かい閾値が記されていたとされる[6]。この数字は後年、説明不足として批判されたが、実務は先に走ったため概念が定着した。
二段階同定(DID)という“手順”の発明[編集]
miyamotoが社会制度に入り込んだ転機は、1978年のであるとされる[7]。この計画では、苗字のみによる照合を禁止し、まず表記一致で候補を集め、次に登録番号か住所の照合で確定させる二段階の流れが制度化された。
この二段階同定は通称でDID(Double-Identification)と呼ばれ、候補集合の平均サイズが「2.3件(±0.7)」に抑えられたと報告された[8]。ただし、現場の感覚としては“2.3件”ではなく“3件目が必ずややこしい”と語られることが多かったとされる。
DIDの導入により、誤照合の発生率は一時的に下がった一方で、確認に必要な事務が増え、郵送照会の平均リードタイムが「12.4日→18.1日」に伸びたとされる[9]。その結果、miyamotoは「誤りを減らすが遅くするラベル」として認識されていった。
歴史[編集]
1979年・海上輸送台帳の“誤棚替え事故”[編集]
最初期の有名な逸話として、1979年にの保税倉庫で起きた誤棚替えが挙げられる[10]。同事故では、積荷の書類に記載された綴りが「miyamoto」と一致しているだけで、倉庫係が同一人物扱いした結果、関連書類が5区画ずれて保管されたとされる。
当時の調査報告書には、誤棚替えの範囲が「棚A-13から棚A-18までの6本」ではなく「棚A-13、A-14、A-16、A-17の4本」といった妙な内訳で記されていたとされる[11]。これは、現場が“手作業の癖”を反映していたためだと説明されたが、後年の編集者は「数字の正確さが逆に怪しい」と注目した。
1986年・“図書館ローマ字”が拡散した理由[編集]
1986年、でローマ字目録の移行が進む過程で、miyamotoが“分類コード風”に拡散したとされる[12]。目録システムは、姓のみをキーにして自動索引を作る設計だったため、同姓同名だけでなく綴り揺れもまとめて取り込んだ。
このとき、目録登録の総件数が「年間約312,400件」に達し、そのうちmiyamoto系の候補が「1.9%(約5,944件)」になったと報告された[13]。統計としては妥当でも、当時の司書たちは「5,944件もあったら、誰が整理したんだ」と首をひねったとされる。
一方で、この拡散は“誤認の可視化”にもつながり、DID手順の普及を後押ししたと評価された。
1998年・行政照合の“電子化”で逆に増えた[編集]
電子化が進んだ1998年以降、誤照合が減るどころか増えたとされるのが、miyamotoの第2の転機である[14]。OCRが「y」と「v」を取り違え、miyamotoが「mivamoto」あるいは「miya—moto」として別記録に分岐したためだと説明された。
結果として、における確認問い合わせが月平均「1,240件」から「1,760件」へ増加し、うちmiyamoto系が約210件を占めたとされる[15]。この“比率”が報告書の脚注に回され、読み手によって解釈が揺れたことが、概念の曖昧さをさらに固定した。
社会的影響[編集]
miyamotoは、個人の問題を超えて行政・物流・学術データ管理の作法に影響を与えたとされる。特に、住所や登録番号を“補助情報”ではなく“同定の主役”として扱う思想が広まった点が大きい[16]。
物流では、ラベルが同定混線を引き起こすため、荷札の表記ルールが改定された。具体的には、苗字欄に加えて中間文字(ダッシュやスペース)を禁止し、さらに英字入力時のフォントを統一することが提案されたとされる[17]。
研究分野では、データベースの統合作業においてmiyamoto系の候補が自動で統合されるのを防ぐため、レビュー担当者がつく運用が広まった。レビュー時間は平均「38秒/レコード」と試算され、職員の間では“38秒なら人間が勝つ”という勝利感が語られたとされる[18]。
一方で、社会全体としては「同名・似た表記に翻弄される」感覚が共有され、身分証の表記揺れが話題になる土壌が形成された。ここで得られた意識は、のちの表記統一政策にも波及したと推定されている。
批判と論争[編集]
miyamotoという呼称は、便利な分類ラベルであると同時に、当事者の視点を奪う“匿名化”だとして批判された時期もある[19]。特に、候補集合として扱われることで、本人の説明責任が増えると感じた人々からの反発があったとされる。
また、DID手順の運用を巡って「確率で判断するのか、証拠で判断するのか」が論点になった。前述の閾値(0.86など)を根拠にした運用は、統計学の観点からは乱暴ではないかと指摘された[6]。ただし、現場では“確率でもよいから早く終わらせたい”という声が強かったとされる。
さらに、行政文書で使われるmiyamotoが、実際の苗字の多様性を反映していないという批判もある。とはいえ、文書管理の世界では多様性を許すほどコストが跳ね上がるため、折衷が続いたと考えられている[20]。
この議論の延長で、1990年代の学会では「miyamotoは“概念”か“誤差”か」という問いが投げられた。結論としては曖昧さが温存されたが、その曖昧さこそが運用を可能にしたという見方もある。
脚注[編集]
関連項目[編集]
脚注
- ^ 佐藤礼子『転写ゆらぎと照合制度の形成:行政文書の実務史』中央行政研究所, 2003.
- ^ M. Thornton『Name-Matching in Legacy Systems』Journal of Bureaucratic Informatics, Vol.12, No.3, pp.44-71, 2007.
- ^ 山本圭吾『DID手順の導入効果とリードタイム変動』情報行政紀要, 第6巻第2号, pp.91-108, 1999.
- ^ Hiroshi Tanaka『Optical Character Mistakes and Administrative Costs』International Review of Document Processing, Vol.5, No.1, pp.1-19, 2001.
- ^ 中島真理『台帳刷新計画と同定混線の管理』自治体政策研究, 第9巻第4号, pp.233-260, 1988.
- ^ Katherine Voss『Probability Thresholds in Human-in-the-Loop Verification』Proceedings of the Verification Workshop, pp.210-222, 2012.
- ^ 渡辺精一郎『港湾保税台帳の誤棚替え:1979年調査報告の読み方』物流史叢書, pp.77-104, 2015.
- ^ 国立文書館編『ローマ字目録移行の統計と運用上の判断』国立文書館資料シリーズ, 第3号, pp.1-64, 1987.
- ^ 田村健太『表記統一政策と市民応答の遅延』公共システム研究, 第11巻第1号, pp.12-37, 2005.
- ^ Nakamura & Reyes『On the Fate of Ambiguous Keys』The Data Curator Quarterly, Vol.2, No.2, pp.55-88, 2010.
- ^ (書名が微妙に誤記されている)『OCRの誤読がゼロになる日:miyamoto実装史』株式会社透明ログ, 2018.
外部リンク
- 表記統一推進コンソーシアム
- 同定混線データベース(試験公開)
- ローマ字転写ガイドラインWiki
- DID手順ワークショップアーカイブ
- 港湾台帳研究会