ドコムス
| 分類 | 位置情報×行動ログの統合分析フレームワーク |
|---|---|
| 分野 | 公共政策、都市計画、行動科学(疑似領域) |
| 提唱時期 | 1990年代後半(とされる) |
| 主要な利用者 | 地方自治体の企画部局、研究コンソーシアム |
| 前提データ | 基地局ログ、決済履歴、移動経路推定 |
| 標準的な指標 | 『滞留意図推定スコア』など |
| 関連概念 | ドコムス指数、ドコムス監査、ドコムス監視係数 |
ドコムス(どこむす)は、通信網と身体的な行動記録を接続して「どこで・どうして」が後から追跡できるとした分析枠組みである。主に日本の行政実務と学術機関の実証で用いられてきたとされる[1]。
概要[編集]
ドコムスは、通信網が生み出す微細な「位置のゆらぎ」と、本人の生活行動が反映されるログを結びつけ、事後的に行為の意図を推定するための枠組みである。とくに「場所」と「行為」を同一粒度で扱う点が特徴とされ、行政文書では“後追いの根拠生成”として説明されることが多い[1]。
一方で、同枠組みは医療・福祉領域では直接の診断ではなく、行動変容を促す施策設計に限定して用いられるべきだと繰り返し述べられてきた。もっとも、実際には交通、買い物、夜間の滞留など幅広い場面へ拡張され、結果として「生活の読み取り装置」と揶揄される局面もあった[2]。
ドコムスの運用では、まず回線側の推定位置(基地局単位)を整形し、次に決済タイムスタンプと重ねて「移動の連続性」を作るとされる。この連続性に対して“意図らしさ”を点数化したものが滞留意図推定スコアである[3]。
なお、自治体向けガイドでは、スコアの算出に用いる入力を「最低3種類、理想は5種類」とする。実務では、決済、交通系IC、天候データ(観測点は2地点)、そして住民票の異動情報(更新頻度は年1回)が最低ラインに組み込まれたと記録されている[4]。
歴史[編集]
成立の経緯:駅前で始まった“なぜそこに?”[編集]
ドコムスの発端は、1998年ごろに東京都の某区で始まった「駅前放置自転車削減」プロジェクトにあると語られている。当初は単純に台数を数えるだけの計画だったが、現場で自転車の置き去りが時間帯ごとに偏ることが判明し、役所内の検討会では“なぜその時間にそこへ置くのか”が問題化した[5]。
そこで議論の主軸として持ち込まれたのが、通信会社が公開した“匿名化済み基地局ログの統計”である。企画側の実務担当であった渡辺精一郎(当時、区の企画調整課嘱託として在籍したとされる)は、「台数」ではなく「滞留意図」を推定する必要があると提案したとされる[6]。
さらに学術側では、行動科学者のMargaret A. Thorntonが“意図は経路ではなく間の揺らぎに宿る”という講演を行い、基地局の切り替え頻度や通信断の連続長を特徴量として扱う発想が固まったとされる。ここで導入された“揺らぎの長さ”は、のちにドコムス指数へと接続された[7]。
ただし、当初の指数は計算が重すぎ、実証の最初の月にサーバが“深夜3時17分に自動停止”する事故があったという。原因は、特徴量の前処理にバッチ処理を用いすぎたことだと報告され、対策として「時刻を分解せず、5分刻みで丸める」方針が採用された。これにより負荷が約38%減り、結果として実証は続行されたとされる[8]。
拡張と制度化:監査係数という名の“お墨付き”[編集]
2003年以降、ドコムスは交通政策だけでなく、商店街の営業時間設計や夜間の見守り施策にも拡張された。特に神奈川県の複数自治体では、事業者が“人の出入りを説明できる指標”を求めたことから、ドコムスが事業評価に採用される流れが生まれたとされる[9]。
その際に整備されたのが、指標の妥当性を担保するとされるドコムス監査である。監査では、モデル出力を「監査用の既知事例」と照合し、ドコムス監視係数が閾値を超えた場合にのみ結果を施策へ反映する運用が推奨された[10]。
ただし、係数には“過剰適合を防ぐ”という建前がある一方で、現場では“係数が高いほど説明責任が楽になる”と理解されがちだったとされる。ある報告書では、説明用資料の提出率が係数導入前の62%から導入後の89.5%へ上昇したと記されている[11]。
また、制度化の最中には、東京の中央官庁から「自治体ごとの粒度差」を問題視する通知が出され、特徴量の標準化が進められた。この標準化により、自治体は基地局単位の統計を“同じ面積のグリッドへ再投影する”必要が生じたとされる。結果として、港区の一部ではグリッド再投影により“同じ場所なのに同じでない”現象が増え、現場担当者が困惑したという記録が残っている[12]。
仕組みと指標[編集]
ドコムスの推定では、まず「場所候補」を複数生成し、次に“行為の候補”を時系列として並べ替える手順がとられるとされる。このとき、候補の数は理論上は無限大に近いが、実務では上位N件に削減する。ガイドラインではN=7が推奨されていたと報告されており、理由として“人間が説明できる範囲”とされた[13]。
次に、滞留意図推定スコアが算出される。スコアは0から100までのスケールとされ、40点未満を「単なる通過」、40〜70点を「寄り道の可能性」、70点以上を「用事がある滞留」と分類する運用がよく知られている[14]。しかし、現場では“70点以上の割合を下げる施策”が先行し、スコアが施策目的に巻き込まれるという皮肉も指摘された[15]。
さらに、ドコムスでは異常値の扱いが細かい。たとえば決済ログが飛ぶ場合は「通信断が3回連続したなら無効」とするルールがあり、逆に通信断があるのに決済がある場合は“手元に財布があるのに位置が揺れた”として補正が入るとされる[16]。この補正の詳細をめぐって、監査担当は「補正は正義ではないが、説明には効く」と述べたという(議事録の片隅にある)[17]。
このように、ドコムスは数式の明快さよりも、行政資料へ落とし込む段取りが評価されてきた。作成された出力は、施策評価委員会へ提出される“1枚紙”として整形され、図は原則として横長A3に収める慣行があったとされる。結果として、計算そのものよりも「図の見栄え」が採択に影響したという回想もある[18]。
批判と論争[編集]
ドコムスには、プライバシーと説明責任の問題が常に付きまとった。とくに“どこで・どうして”の推定が、当事者の意思とは無関係に施策へ結びつく点が問題視されたのである。批判側は、スコアが行為の真相ではなく“統計的な都合”に過ぎないと主張した[19]。
一方で推進側は、ドコムスが直接の個人特定を目的としていないと繰り返し述べた。たとえば匿名化手続きとして、個票は作らず“統計の断面だけ”を用いる設計だとされる。しかし実務では、断面の集計キーが自治体単位で細かく、結果として「推定が特定の地区の住民像を固定化する」ことが起きたと指摘された[20]。
また、論争は技術的にも発生した。基地局ログの再投影を行う際に、グリッドの境界が行政界と一致しないことがあり、同じ町名でも数値が変わり得ることが判明したという。ある監査会合では、このズレを“地図の気分”と呼んだ参加者がいたとされる[21]。
さらに、導入効果の評価にも疑義が呈された。施策後の滞留スコアが下がった場合、それは施策の成果なのか、あるいはログ取得の条件が変わっただけなのかが判別しにくかったとされる。この点について、要出典扱いであるものの、導入前後で“通信断の平均回数が0.3回改善した”という断片的なメモが共有されたことがある[22]。
脚注[編集]
脚注
- ^ 渡辺精一郎『駅前政策のための通信統計活用—なぜ置くのかを数える—』地方行政出版社, 2004年.
- ^ Margaret A. Thornton『On Intention Fluctuations in Cellular Networks』Journal of Applied Behavioral Telemetry, Vol.12 No.3, 2001年, pp.45-66.
- ^ ドコムス標準化委員会『自治体実証における粒度統一の手引き(改訂第2版)』内務データ研究所, 2006年.
- ^ 林原咲子『滞留の分類が施策を決めるとき』都市政策研究会報, 第7巻第1号, 2008年, pp.101-129.
- ^ 中村慎吾『監査係数と説明責任—数字の出し方の政治—』公共評価論集, Vol.5 No.4, 2007年, pp.210-233.
- ^ Sato, Kei & Gomez, Livia『Grid Reprojection Effects in Administrative Analytics』Proceedings of the International Symposium on Spatial Auditing, 2010年, pp.1-9.
- ^ 【要出典】『ドコムス実証報告書(非公開要旨)』港区企画調整課, 2003年.
- ^ 厚生通信研究所『統計断面設計と匿名化の実務』厚生通信叢書, 第3巻第2号, 2005年, pp.77-95.
- ^ 山下玲奈『“図が採択を呼ぶ”という錯覚—1枚紙行政の計算美学—』行政資料学研究, Vol.9 No.2, 2012年, pp.33-58.
外部リンク
- ドコムス実証アーカイブ
- 滞留意図推定スコア解説ポータル
- 基地局ログ取り扱いガイドライン
- 空間監査技術フォーラム
- 公共データ可視化サンプル集