嘘ペディア
B!

吉田仁人

この記事はAIが生成したフィクションです。実在の人物・団体・事象とは一切関係ありません。
吉田仁人
分野公共政策・行政情報設計・計量コミュニケーション
主な業績文書可読性指数(DRI)の提案と運用
活動地域および全国の自治体
所属(当時)内閣府関連の検討会、のち独立研究者
代表的な政策提言“3段落以内要約義務”の導入案
主な論争点出典データの出どころと指標の再現性

(よしだ じんと)は、日本の分野で知られる人物である。特に、行政文書の“読みやすさ”を数値化する手法を体系化したことで注目された[1]。一方で、その手法の由来には一部で不審が示されている[2]

概要[編集]

は、行政文書を対象にした“可読性”の計測と改善を、研究だけでなく制度設計として持ち込んだ人物として語られている。彼は文字数の単純集計では不十分だとし、句読点、改行頻度、主語の出現位置など複数の特徴量を統合する枠組みを作ったとされる[1]

その中心にあったのが(DRI, Document Readability Index)である。DRIは「担当部署が“読めたつもり”になる速度」を遅らせるための指標として導入されたとされるが、運用開始後には自治体間で数値のばらつきが問題化した。特に、同じ書式でもDRIが一致する確率を当初の説明より低く見積もっていたのではないか、という指摘が出た[2]

なお、吉田は研究会や審議資料で、しばしば“起源”に触れた。彼によればDRIは偶然の実務で生まれたもので、実験のきっかけにはの深夜コピー機故障が関係しているという。ただし、その具体的経緯は資料によって微妙に異なり、後年の追記では日付が1か月ずれたと報告されている[3]

人物像と研究の特徴[編集]

吉田仁人は、行政の文章を“読む側の体温”から逆算すべきだと主張したことで知られている。ここで言う体温とは、読者の注意が散るまでの時間を指す比喩であり、彼はこれを「読了までの視線停止回数」として代理測度化したとされる[4]

彼の執筆スタイルも特徴的で、報告書には必ず「誤読される場所」を図示した。たとえばにある形容句が、統計的に誤読率を上げるとして、わずか1行の置換だけでDRIが平均0.17ポイント改善したケースが紹介されている[5]。また、改善提案は文章の“短縮”よりも“主語の前倒し”に重心を置く傾向があったとされる。

一方で、研究の現場は華美ではないとされる。彼は調査に際し、自治体から提供された既存文書を「夜間に印刷し、翌朝に再度スキャンする」という工程を課した。目的はOCR誤差を混ぜて実使用の揺らぎに寄せることだと説明されたが、実際にはその工程により“情報の欠落”が起きた可能性がある、との批判が出た[6]

歴史[編集]

DRIの“起源”と、コピー機の伝説[編集]

DRIの成立は頃とされる。吉田は当時、の外部検討会で行政文書のテンプレート統一を担当していたとされる。そこで問題になったのが、同じ形式でも住民説明資料が自治体ごとに“読まれ方”を変えてしまう点であった。

吉田の説明では、最初のデータは“コピー機の紙送りバラつき”により偶然生じた。深夜ので、同一文書を3回連続複製したところ、2回目だけが句読点の改行位置を微妙にずらし、それが読解の停滞点に相関した、というのである。さらに彼は、その夜の紙の品番が「A4-72K」で、故障ログが「総回転数 1,482,639」になっていたと記したとされる[7]

ただし、その品番や回転数は後の発表で再現性のために“推定値”へ置き換えられたとされ、批判側は「偶然の観測を理論に昇格させる速度が速すぎる」と主張した。これに対し吉田の側は、当時は現物が残っておらずログも欠損していたため、近似計算を行ったと反論している[8]

自治体実装と“3段落以内要約義務”案[編集]

DRIが制度に近づいたのはのことである。吉田は系の事務連絡で、住民向け通知文に「3段落以内要約」を組み込む案を添付した。吉田によれば、要約の粒度は“読了までの視線停止回数”を最大限に抑えるために、段落数ではなく“段落内の主語の出現位置”で決めたという[9]

この提案は、当時のの一部区役所で試行され、DRIが平均で0.31ポイント低下したと報告された。ここでいう低下は、DRIが低いほど誤読が減るという設計だった。ところが現場では、低下が起きる理由が文章の改善ではなく“住民照会の導線変更”による可能性があることが明らかになった。この点は吉田自身も認めており、「文章以外の変数を完全に遮断するのは不可能だった」と述べたとされる[10]

なお、導入時の会議録には、吉田の発言として「DRIを見れば、自治体は“説明している気”から降りる」とある。政策担当者はこの言い回しを後にキャッチコピー化し、研修資料にも転載された。一方で、その結果“説明している気”の測定にDRIが使われるようになり、指標の目的がじわじわとすり替わったのではないか、と論争が拡大した[11]

評価の分岐点:再現性委員会とデータの所在[編集]

DRIの広がりとともに、評価の焦点は再現性へ移った。そこで立ち上がったのが、いわゆる(仮称)である。吉田は同委員会に対し、DRI計算の“特徴量リスト”を提出したが、出典となるログデータの保存先が曖昧だったため、形式面の審査が難航したとされる[12]

委員側の説明によれば、吉田が提示したファイル名の一部が「drizzle_04_08」というように自然言語ではなく擬似的な命名規則だった。これは作業者の保護のためだとされたが、同時期に提出された別資料では命名規則が「drizzle_4_8」に統一されており、タイムスタンプの整合性が問われた[13]

吉田は最終的に「公開は段階的に進める」と回答し、最初の公開分としての試行分だけを出した。しかし、その公開された分でも、DRIが低下した文書群と住民の実際の問合せ減少が必ずしも同期しない例が報告される。こうした“ズレ”が、彼の理論が文章の改善以外の要因を取り込んでしまった可能性を示す材料として扱われた[14]

批判と論争[編集]

DRIは、行政現場で「測れている感」をもたらした一方で、測定の境界が曖昧だと批判されている。特に、吉田が提示した算式は“説明の速さ”を直接の目的関数にしているように見えたが、運用では説明の質や政策の妥当性まで同一の軸で扱ってしまう懸念があった[15]

また、DRIの算出に含まれる特徴量のうち、句点の位置や改行頻度が“単なる編集癖”に依存してしまう可能性があると指摘された。たとえばの書式が変更された以降、DRIが自動的に改善方向へ寄るケースがあり、そのときだけ相関係数が0.62から0.81へ上がったとする報告がある[16]。この数字は、文章の質が上がったからなのか、測定器の側が変わったからなのかが争点になった。

さらに、吉田の“起源の物語”に対しては、研究者コミュニティから「伝説的で、検証に耐えにくい」という批判が出た。コピー機のログが“総回転数 1,482,639”のように具体的であるほど、却って信憑性の評価が難しくなるという指摘である[7]。吉田はこうした批判に対し、「検証可能性はデータで示すのであって、物語は研究者のモチベーションを説明するためだ」と応じたとされるが、賛否は収まっていない。

脚注[編集]

関連項目[編集]

脚注

  1. ^ 山田柾見『行政文書の可読性:DRI導入の実務』霞ケ関書房, 2013.
  2. ^ 佐藤梨紗『読解を設計する:主語配置モデルの提案』行政情報学会, 2015.
  3. ^ Margaret A. Thornton『Measuring Administrative Clarity in Multi-Level Governance』Public Documentation Review, Vol.12 No.3, 2016.
  4. ^ 吉田仁人『DRI:Document Readability Indexの特徴量設計』内閣府調査報告書, 第9巻第2号, 2012.
  5. ^ 中村光一『コピー機ログから生まれた数理:可読性指標の成立史』情報衛生研究所叢書, pp.41-73, 2018.
  6. ^ Aiko van der Meer『The Politics of Readability Metrics』Journal of Bureaucratic Studies, Vol.7 No.1, pp.9-22, 2019.
  7. ^ 【要出典】高橋悠介『住民説明は短くすれば良いのか:段落数と誤読の関係』自治体通信, 第3巻第11号, 2014.
  8. ^ 田島玲奈『再現性の壁:特徴量の秘匿と公開戦略』データ倫理年報, Vol.5 No.2, pp.101-129, 2020.
  9. ^ 劉暁峰『行政文書の誤読を減らす統計手法(第2版)』Springer Japan, 2021.
  10. ^ 吉田仁人『DRIの次の一歩:視線停止回数の最適化』行政科学論文集, 第1巻第1号, pp.1-17, 2022.

外部リンク

  • 文書可読性研究フォーラム
  • 再現性委員会アーカイブ
  • 行政情報設計ポータル
  • DRI運用ガイド(草案)
  • 住民説明改善ベンチマーク
カテゴリ: 日本の公共政策関連人物 | 行政情報学 | 計量コミュニケーション | 日本の行政研究 | 文書設計 | 指標開発 | 行政データ倫理 | 再現性の研究 | 自治体実装 | 研究と制度の関係
コメントを読み込み中...

関連する嘘記事