瀧澤篤郎2
| 分類 | 行政データ分析モデル(統計学習モデル) |
|---|---|
| 提唱・導入 | 統計監査部門(仮) |
| 想定用途 | 人事異動・採用手続きの照合(監査) |
| 運用形態 | 月次バッチ処理 + 年次再推定 |
| 主要な評価指標 | 照合率、差戻し率、書式逸脱度 |
| 特徴 | 文書を“人格”に要約して判定する点 |
| 関連概念 | 、、 |
瀧澤篤郎2(たきざわ あつろう に)は、日本で運用されたとされる「人事監査用の統計人格モデル」である。行政文書の様式を“人”として学習させ、監査の手戻りを減らす目的で導入されたと説明される[1]。
概要[編集]
は、行政機関の人事関連文書に含まれる記述パターンを統計的に要約し、書式の逸脱や説明の飛躍を“個人の癖”のように検出するためのモデルとして言及されることが多い。
その名称に付された「2」は、初版とされた(旧称)からの改訂番号であると説明されるが、実際には同名モデルが複数の予算年度で更新され、資料上の系譜が混線した結果として扱われる例もある。とくに“人格”という比喩の導入が特徴であるとされる。
なお、開発の現場では「モデルが嘘をつくのではなく、書類が嘘のように見える場所を探すのだ」というスローガンが掲げられたとされるが[2]、この言い回しが後年、監査現場における過剰適用の口実にもなったと指摘されている。
概要(選定基準と掲載範囲)[編集]
このモデルが参照される範囲は、採用・異動・配置換えの申請書、理由書、面接記録の要約、そして異動後評価の転記票までに及ぶとされる。導入時の設計書では「対象文書群は、を含む13庁の“書式揺れ”を学習できること」とされ、対象範囲がやけに具体化されていたという。
また掲載(紹介)される理由は、誤検知を抑えるための工夫が“人”に見立てられている点にある。たとえば、差戻し率が高い係の文書には共通する「文の長さの癖」や「敬語の落ち方」が出るとして、それを擬似的な性格特性に写像する手法が組み込まれたとされる。
一方で、学習に使われたとされる教師データの出所が年度によって異なり、監査担当者が「結局どの時期の書類が正解なのか」を疑うことになった点は、後述の論争につながったともいえる。
歴史[編集]
前史:書式の“個性”を統計で殴る時代[編集]
統計監査部門が、監査のたびに発生する“差戻し”を減らすために導入を検討した背景には、1980年代末から拡大した文書電子化の副作用があるとされる。紙からデータに変換されたことで、見た目の差は小さくなったのに、運用の癖だけが残ったため、いわゆる“微差”が責任の所在を曖昧にすると判断されたのである[3]。
この時期、の実務版として、文章の語尾分布、改行位置、引用符の種類までを数値化する試みが流行したとされる。とくにの講習では「人は書式で嘘をつくが、書式は人の癖を隠さない」といった、妙に詩的な結論が採用されたとされる[4]。
ただし、こうした数値化は“理屈”に強い一方で、最終判断が人間に委ねられやすかった。そのため、判断そのものを形式化してしまう必要が生じたとされ、そこで人格比喩が採用された。
開発:瀧澤篤郎2という“名前の工場”[編集]
の原型は、ではなく、当時の自治体監査寄りの実務グループ「監査文章整形研究会(仮称)」で設計されたと説明される。設計会議の議事録では、モデル名が先に決まり、その後に必要な変数を逆算するという逆転の手順が採られたとされる[5]。
具体的には、入力文書を「声質ベクトル(敬語トーン)」「申請意図ベクトル(理由の焦点)」「整合性ベクトル(論理の接続)」の3系統に分け、各系統をさらに42次元ずつに圧縮する構成が採られたとされる。圧縮は“圧縮率”ではなく“説得力の消失点”で管理し、月次で平均逸脱が0.73ポイントを超えた場合に再学習すると決められていたという。
さらに面白いのは、人格としての出力を「第一印象(7秒相当)」「説明耐性(39秒相当)」「最後の一文の熱量(11単語相当)」で要約し、監査の現場ではこれが“担当者の性格”として共有された点である。なお当初の出力は本名ではなく、年号と住所コードを混ぜた暫定IDで運用されていたが、なぜか報告書の途中でが紛れ込み、後年「2」として整理されたとされる。
導入と運用:月次の“性格更新”[編集]
モデルはの一部門で試行され、結果として照合率が“導入前の86.4%から91.2%へ上昇”したと記録される[6]。ここでいう照合率は、人事手続きの要件が満たされているかどうかを、文章上の特徴から推定した割合である。
しかし同時に差戻し率も“18.1%から15.9%”へ減少した一方で、書式逸脱度が高い部署ほど検出が厳しくなり、現場では「監査が冷たくなった」という声が広がったとされる。行政文書は往々にして“説明不足”ではなく“説明の省略”があるため、その省略を人格の欠陥として扱う危険が指摘されたのである。
運用は月次バッチ処理で、各月の再推定には合計で71,220件の文書が投入されたとされる。年度末には1.3TBのテキストが再圧縮されたと書類にあり、技術担当が「圧縮後も人間の癖だけが残る」と自慢したとされる[7]。この手の言い方が、のちの誤解を生みやすくしたとも言える。
社会的影響[編集]
は、監査の作業時間を短縮したとされ、内部資料では「審査会議の準備に要する“人の記憶”を平均0.42時間削減」と報告された[8]。この数字がやけに細かかったため、逆に導入賛成派が多かったとも言われる。
また、モデルが参照する“人格の要約”は、監査担当者の口調にも影響したとされる。たとえば差戻しを伝える際に「あなたの申請意図ベクトルは焦点が散っている」という表現が、冗談半分で使われ始めた。これが一部の現場では実際の説示に変わり、被監査者が“書類の人間性”を問われている感覚を持ったとされる。
一方で、モデルはあくまで文章特徴の推定であるため、政策の妥当性や人事の公平性を直接扱うものではない。にもかかわらず、数字が独り歩きし、「照合率が高い者=正しい判断をした者」という短絡が生まれたと指摘されている[9]。この点が、後述の批判と論争の核である。
批判と論争[編集]
批判は主に、人格比喩がもたらす“責任の転嫁”に向けられた。すなわち、モデルが出力した人格要約が、担当者個人の能力不足のように扱われると、実際には書式運用や締切の都合で生じた省略が「性格」の問題として読まれてしまう可能性があるとされたのである。
とくに有名な論点は、教師データの年代差である。監査の実務は年度ごとに運用が変化するにもかかわらず、ある報告書では「教師データは昭和期の模範文書を混ぜた」とされていたが、別の資料では「平成期の差戻し記録のみで再学習した」とされており、整合性が取れていないと批判された[10]。
さらに、“瀧澤篤郎”という名称の由来が曖昧だったことが、陰謀論めいた議論を呼んだ。ある編集作業の過程で人名がテンプレートとして混入し、そのまま更新番号の「2」が付いたのではないか、という指摘がなされた[11]。ただし、当事者は「名称は便宜上のラベルにすぎない」と反論したとされる。反論があるにもかかわらず、なぜか一部の内部研修ではが“人格を持つ監査官”のように扱われる場面があったとされ、ここが“嘘じゃん”と笑われやすい所以になった。
脚注[編集]
関連項目[編集]
脚注
- ^ 花房真琴「監査文章整形研究会の試行報告(Vol.3 第12号)」地方公共団体監査紀要, 1997.
- ^ ロバート・ミラー『Administrative Linguistics for Accountability』Cambridge Policy Press, 2001.
- ^ 藤波誠治「敬語トーンの分布と審査再現性(第7巻第2号)」日本監査学会誌, 2003.
- ^ 鈴村紗希「書式逸脱度と照合率の相関(pp.113-128)」監査データ研究, 2006.
- ^ エリカ・ヴァーメン『Human-like Scoring in Bureaucratic Systems』Oxford Metrics Review, 2004.
- ^ 佐伯亮介「人格比喩モデル『瀧澤篤郎』系譜の整理(Vol.1 No.1)」監査実務アーカイブ, 2012.
- ^ 大門政次「月次バッチ再推定の設計思想(pp.41-59)」統計監査技術報告, 1999.
- ^ 【書名略】「昭和模範文書混入の有無に関する内部メモ(第◯巻第◯号)」未公刊資料, 2011.
- ^ 北條恵里「テキスト圧縮と誤検知の統計的説明(pp.201-217)」Journal of Compliance Analytics, 2008.
- ^ 松原健「『瀧澤篤郎2』の運用指標と現場反応(pp.7-19)」行政情報処理研究, 2010.
外部リンク
- 監査文章研究アーカイブ
- 行政データ倫理フォーラム
- 書式学オンライン講座
- コンプライアンス数理便覧
- 監査言語学メモ