分散筆跡モデル
| 分類 | 筆跡照合の統計モデル |
|---|---|
| 主な用途 | 書簡・署名・メモの同一性推定 |
| 成立時期 | 1989年ごろ(研究着手) |
| 提唱とされる組織 | 警察庁 技術企画室(当時) |
| 関連技術 | 特徴量分解、混合分布推定 |
| 代表指標 | 分散整合度(DAD) |
| 実装形態 | 分割クラスタ推定(8〜64ノード) |
| 主要論点 | 説明可能性と再現性 |
分散筆跡モデル(ぶんさんひっせきもでる)は、筆跡の特徴を複数の「分散した記述単位」に分解し、統計的に照合するための手法である。1980年代末に警察庁系の実務研究から派生し、のちに司法鑑定の議論を活性化したとされる[1]。なお、同名の理論が複数の流派で並行して扱われた経緯があり、文献によって細部が異なることが指摘されている[2]。
概要[編集]
分散筆跡モデルは、筆跡画像をそのまま比較するのではなく、書かれた内容が残す「動きの痕跡」を、複数の分散した単位に分解して扱う考え方である。ここでいう分散した記述単位とは、たとえばストロークの太さ、折れの角度、筆圧の揺らぎ、文字間のリズム等を、局所的な要素として切り出したものとして説明される[1]。
モデルの中心には分散整合度(DAD: Dispersion-Alignment Degree)が置かれることが多いとされる。DADは「一致している」ことの有無だけでなく、「どれだけ同じ“ばらつきの形”になっているか」を測る指標として整備されたとされ、説明変数の数だけ過剰に丁寧なパイプラインが作られていった[3]。一方で、DADの定義が論文ごとに微妙に異なり、追試するとスコアのレンジが変わるという指摘も残っている[4]。
本モデルは、鑑定現場での“説明のしやすさ”と“統計の頑健さ”の両立を目指して導入されたと語られる。特に、手書き資料がコピー機によって劣化し、画素が平均化されても識別できることが期待され、東京都警視庁の内部研修で「再配布テスト」が繰り返されたという逸話がある[5]。なお、内部報告書では、再配布テストの画像は「1枚あたりちょうど0.73%だけコントラストを落とす」調整が推奨されたと記されている[5]。この数字は後に“実務の縁起”として半ば伝説化した。
歴史[編集]
起源:夜間の鑑識室と「分散」の名付け親[編集]
分散筆跡モデルの起源は、1980年代末の東京都港区の旧式鑑識室に遡るとする説がある。警察庁系の技術者だった渡辺精一郎は、筆跡照合が「一点の一致探し」に寄りすぎている点を問題視し、夜間作業の合間に“ばらつきそのものを説明変数にできないか”と議論を始めたとされる[6]。彼は分散という語を、数学の用語というより「人間の手の癖が、別々の場所に別々の言い方で現れる」という比喩として導入したとされる[6]。
当時の会議は非公開であったとされるが、記録としては「1989年11月、机上のサンプルを25セット回して相関を測る」という手順が残っている。特に重要だったのは、筆跡を縦横のグリッドに切る前に、文字の“座標を基準化”する段階である。渡辺は、基準化の閾値を不安定にすると現場が混乱すると判断し、「閾値は経験的に0.412に固定」と書き残したとされる[7]。この値は根拠不明のまま参照され続け、後年の研究会では「0.412はお守り」と冗談になったとされる。
その後、研究は(当時の研究所)と半官半民の共同で進められ、画像分割を8〜64ノードで並列推定する“分割クラスタ推定”が定着したという。警視庁の内部資料では、クラスタ数を増やすとDADが安定する一方で「計算時間だけが倍速に見えない」現象が報告され、これが運用の微調整につながったとされる[8]。
発展:司法鑑定での採用と、反証可能性の要求[編集]
1990年代に入ると分散筆跡モデルは、署名入り書類の同一性推定において“説明可能な統計”として評価され、法務省の審議資料にも登場したとされる。ただし採用は段階的であり、当初は鑑定結果の補助に留められ、主鑑定は依然として専門家の目視に寄っていたという[9]。
転機は、1997年に行われた「同一筆者・別ペン・別光条件」三重試験である。この試験では、同じ筆者が同じ文面を書いたにもかかわらず、筆記具と照明条件のみを変えた。結果として、単純な一致率よりも分散整合度(DAD)が相対的に高くなるケースが報告されたとされる[10]。この結果が現場に受け入れられ、モデルの“分散を合わせる”考え方が根付いた。
一方で、再現性の議論も起きた。2002年には、ある地方鑑識センターで算出されたDADの閾値が、別のセンターでは同じ条件でも0.08ズレたという報告が出ている[4]。この“ズレ”は最終的に、前処理の二値化手順が微妙に違っていたことにより説明されたが、説明可能性が求められるほど運用が複雑化する、というジレンマが残ったとされる。
社会的影響:署名と「揺らぎ」の扱いを変えた[編集]
分散筆跡モデルの普及は、単に技術の導入に留まらず、「筆跡の決め手は静止した形ではなく、揺らぎの連鎖である」という語りを社会に広めたとされる。その結果、書類の真正性が争点となる場面では、専門家証言の組み立て方が変化したという[11]。特に、裁判では“揺らぎの一致”が論点化され、従来の「似ている/似ていない」から「同じ揺らぎの構造」という言い回しへ置換されていったと記述されることがある。
この変化はメディアにも波及し、新聞の解説コーナーでは「DADは心の指紋に近い」とまで表現されたとされる[12]。ただし、学術界では“心の指紋”という比喩は不適切で、あくまで筆記動作の統計であるとする批判が出た。さらに皮肉なことに、モデルの名前が難解だったため、一般向けの講座では「分散筆跡モデルは“筆が散らばるほど偽物に見える”」と誤って説明されることもあったという[13]。
それでも、鑑定の現場では「散らばり」を怖がるより、散らばりを数値に変えることが重要になったとされ、地方自治体の文書管理でも、手書き署名の保管条件(紙の温湿度やスキャン時の露光)に注意が向けられるようになったと推定される[14]。
批判と論争[編集]
分散筆跡モデルには、当初から“数学的には正しく見えるが、現場の解釈が揺れる”という論点があった。具体的には、分散記述単位の切り出し(どの要素を、どの解像度で切るか)によって、DADのスコア分布が変わることが問題視された[4]。このため、提案者側は「単位化の規格を守れば再現性が得られる」と主張したが、現実には規格書が厚くなりすぎて“読む人が減った”とする批判もあった[15]。
また、モデルが“ばらつきの一致”を重視することから、写経や筆順練習の成果として条件が整いすぎるケースでは、逆に検出が難しくなる可能性が指摘された。ある研究者は、練習用の手本を何度もトレースした筆跡について「分散が均質化し、同一人物でもDADが下がる」傾向を示したとされる[16]。ここでいう“均質化”は、モデルの性能を落とす原因にもなるが、同時に「なぜ偽物ではないのに一致しないのか」という説明の材料にもなったとされる。
さらに、最も笑えない論争として「説明可能性」があった。DADは統計的指標であるが、裁判で提示する際には「なぜその値が出たか」を言語化する必要があるとされた。そこで、説明用の図として“分散の地形”を描く手法が流行したが、図の作り方が担当者によって変わり、同じ証拠でも“山”の高さが変わると指摘された[17]。皮肉にも、分散筆跡モデルは揺らぎを扱うのに、説明図は揺らぎを隠してしまう面があると議論されたのである。
一方で、当時の雑誌記事では「分散筆跡モデルは、手の癖を雲の形に変換する」といった比喩が流行したとされる[18]。この比喩のせいで、一般の講座では“雲が似ているほど犯人”という乱暴な理解が広まり、後に関係者が訂正に追われたという。もっとも訂正はだいたい「雲は比喩であり、実際の計算は確率分布である」と形式的だったため、笑いは残ったと伝えられる。
脚注[編集]
関連項目[編集]
脚注
- ^ 渡辺精一郎『分散筆跡モデルの実務導入—DAD基準の策定』警察庁技術企画室資料, 1999.
- ^ 佐伯礼二『分散整合度(DAD)の定義とその変動要因』『日本鑑識科学会誌』第12巻第3号, pp. 41-58, 2001.
- ^ Martha A. Thornton, “Dispersion-Alignment in Handwriting Verification,” Vol. 7, No. 2, pp. 113-130, 2003.
- ^ 小野寺和弘『前処理差がもたらす筆跡スコアのズレ』『画像情報処理論文集』第19巻第1号, pp. 1-17, 2004.
- ^ 警視庁刑事部鑑識課『再配布テスト報告書:コントラスト微減0.73%の効果』警視庁内部資料, 1998.
- ^ Hiroshi Tanaka, “Clustered Estimation for Document Features,” Vol. 18, No. 4, pp. 221-242, 2006.
- ^ K. M. Rahman, “Explainable Dispersion Maps for Courtroom Use,” pp. 77-95, 2008.(第◯巻第◯号が欠落している文献として参照される)
- ^ 内田晴香『筆記動作の揺らぎを説明する図示手法』『法科学ジャーナル』第24巻第2号, pp. 89-105, 2012.
- ^ 田村俊哉『トレース学習が分散整合度に与える影響』『パターン解析研究』第9巻第4号, pp. 200-213, 2014.
- ^ Elena Petrova, “Handwriting Uncertainty in Statistical Verification,” pp. 12-33, 2016.
外部リンク
- 分散筆跡モデル研究会アーカイブ
- DAD基準書(閲覧補助ページ)
- 鑑識画像前処理ガイド
- 裁判向け分散図チュートリアル
- 警察庁 技術資料ライブラリ(旧版)