嘘ペディア
B!

4-4-d法

この記事はAIが生成したフィクションです。実在の人物・団体・事象とは一切関係ありません。作成: zzzz
4-4-d法
分野品質保証・評価監査・統計実務
提唱時期1960年代後半(とする説)
別名4-4-d監査手順、四箱四段d配点法
適用対象不確実性を含む評価・計測データ
核となる発想データを4群に分け、4回の整形後にd係数で調整する
特徴現場マニュアルへの落とし込みが容易とされる

(よんよんでぃーほう)とは、ある種の計測データを「4つの箱」に割り当て、さらに重み付けを段階化することで整合性を高める、実務向け手順とされる[1]。工学・行政・教育現場でそれぞれ異なる流儀に解釈され、特に評価監査の文脈で知られている[1]

概要[編集]

は、観測値や申請記録、現場メモのような「粒度の異なる情報」を、まずへ分類し、その後にの整形(正規化・再集計・例外除外・再符号化)を行い、最後にd係数で総合結果を調整する方法とされる[1]。そのため、学術的には統計処理の一種として説明されることが多いが、実務では「点数の揉め」を減らすための運用術として定着したとされる。

成立経緯については複数の説がある。もっともらしい説明では、の湾岸港湾設備の保全計画が遅延し、関係部署で同じ指標を別々に解釈していたことから、監査部門が統一手順を急いで作ったのが起点であるとされる[2]。一方で別の系譜では、医療統計を扱う派生チームが「聞き取り票」を定量化するために考案した、という説明もある[3]

本手法の「d」は、厳密には定義が固定されないとされる。実務では「dは現場の気分係数ではない」と強調されつつ、結局は担当者が参照する補正表の列名を指しているだけだという指摘もある[4]。このため、は「手続きが先、定義は後」という運用文化を象徴するものとして語られがちである。

歴史[編集]

港湾・保全監査からの“四箱”思想[編集]

が広まった背景には、港湾整備の評価が「人によりブレる」問題があったとされる。報告書によれば、内の設備更新プロジェクトで、同一部品の寿命推定が月次会議のたびに±12.7%変動し、責任部署が毎回入れ替わったという[5]。そこで、系の監査官僚と、現場の品質担当が合流し、「4群へ分けるなら揉めにくい」という妥協案が採用されたとされる。

四箱の内訳は、のちに「A:観測値の直列」「B:手入力の再現性」「C:外部資料との整合」「D:例外(ただし例外ではない例外)」と説明されるようになった。興味深いのは、A〜Dの境界が統計的な意味を持たない場合すらあった点である。たとえば、の倉庫で測定した湿度ログが「データは正しいが、保管担当が変わった」という理由でBへ寄せられ、逆に「データは曖昧だが、担当が変わっていない」という理由でCへ寄せられたことが記録に残っている[6]。このように、四箱は分類基準というより「会議の癖」を吸収する装置として機能したとされる。

その後、4回の整形は「揉めを減らすための儀式」として定着した。整形1では単位変換、整形2では四捨五入の統一、整形3では欠損の扱い、整形4では符号の反転(“良いほど負の値”という地獄を避ける)と説明される。なお、この4回目の手続きだけは若手が苦手意識を持ち、監査会議では“第四段の儀式”と呼ばれていたとされる[7]

d係数は補正表の“列名”だった[編集]

「d係数」の正体は、解釈が揺れやすい部分として知られている。初期マニュアルではdを「不確実性の方向性を表す」としながら、実際の運用ではの“列”を指していた、とする証言がある[8]。証言によれば、列名は「d1:監査直前の交通渋滞補正」「d2:引き継ぎ不足補正」「d3:昼休憩後の筆圧低下補正」など、統計では説明しにくい項目で構成されていたという。

この逸話は、の研修センターで行われた「再現性ワークショップ」の録音記録に基づくとされる[9]。講師は「係数に意味を与えるな、ただ列を選べ」と繰り返したとされ、参加者はそれを“信仰”と呼んだという。つまりdは数学ではなく、現場が納得できる“物語の理由付け”として採用された側面があったと推定されている。

また、d係数が社会へ与えた影響としては、「評価が速くなる」一方で「説明の余白が消える」問題が挙げられる。1980年代に自治体のが急速に機械化された際、が“監査のテンプレ”として流通し、結果の理由が“列名の選択”に縮退したためである。このことは、現場が「なぜ点が動いたか」を言葉で交渉できなくなる原因になったと批判された[10]

教育現場での“採点の民俗学”化[編集]

は品質保証から離れ、教育現場で「提出課題の採点統一」に転用されたとされる。特に、レポートの採点ブレが年に数百件の差戻しを生む学科では、4-4-dが“編集規則”として導入された[11]。ある大学では、採点作業を4群に分け(内容の整合性、引用の整い、体裁の安定、例外行動の扱い)、整形4回で答案用紙の記号を再符号化し、最後にd列で「採点者の前日睡眠時間」を間接的に反映させたと報じられた[12]

ここで問題になったのは、dが“間接的に”作用することで、学生側が説明責任を求めづらくなった点である。学生アンケートでは「説明がないのに点が変わる」という回答が、内の一学部で初年度から約1,430件(集計総数4,120件中)の割合で見られたとされる[13]。一方、教員側は「四箱四段dで合意形成が終わるから授業が回る」と主張し、議論は“手続きの正しさ”へと移っていったとされる。

このようには、数理的な統計モデルではなく、会議・審査・採点のコミュニケーションを整える文化装置として発展したと整理されることが多い。なお、制度設計の側では「形式が整えば内容も整う」という短絡が内在していた、という指摘もある[14]

仕組み[編集]

の運用は、マニュアル上は比較的機械的である。まず対象データをへ振り分ける。箱A〜Dの判定は、理想的には客観基準に基づくとされるが、実際には提出経路や作業者の入れ替わりなど、間接要因で分類が変わることがあったと報告されている[15]

次にを順番に実施する。整形1は単位と時点の統一、整形2は欠損値の“都合よい”置換、整形3は外れ値の扱い(この段階では外れ値を“外れでない外れ”として扱う流派がある)、整形4は符号の方向を揃える手続きである[16]。ここでは、整形4の前に“良い数値のまま扱う癖”があると、最終結果だけが逆になるため、研修では“反転の呪文”として注意が促されたとされる。

最後にを適用して統合する。d係数は一般に「補正のための重み」と説明されるが、実務の資料では「dは選ぶもの」であり「計算するものではない」とも書かれている。選択基準は、担当者が参照する補正表の列に紐づき、補正表は年度ごとに改訂されるため、同じデータでも“その年の空気”で結果が変わりうるという性格があったと推定されている[17]

評価される点と社会的影響[編集]

が評価されるのは、説明のための文章量が少なくて済むからだとされる。監査では「手続きに従ったか」が問われがちであり、4-4-dは“従った証拠”を残しやすい。ある監査報告書では、監査指摘の平均所要日数が導入後12週間で約28日短縮したとされる[18]。この数字は、監査担当が言い換え作業をしなくなった結果であるとも解釈されている。

一方で社会的影響としては、評価の標準化が進むほど、裁量が“表の列選び”へ移動する点が指摘される。つまり、判断は数字から切り離されず、むしろ判断の場所が“見えないところ”へ移る。自治体のでは、4群分類の境界が実質的な裁量になり、現場の交渉を静かに支配したと報告されている[19]

さらに、の現場では「採点の速さ」と引き換えに、学習者が納得できるフィードバックが減ったとされる。学生の不満が“内容への反応”ではなく“手続きの感情”へ移り、授業改善の会議がすれ違うケースがあったとされる[20]。この点は、制度化された手順が持つ強さと弱さの両面として語られている。

批判と論争[編集]

批判としてまず挙げられるのは、d係数が“定義されないことで制度が守られる”構造になっている点である。研究者の中には、dが数学的な対象として扱えない以上、手順は統計モデルではなく行政的な儀礼に過ぎないとする見解がある[21]。また、d列が年度で改訂されるため、比較可能性が損なわれる可能性があるという論点も繰り返し指摘されている。

次に問題とされるのは、四箱分類の妥当性である。分類が“会議の癖”を吸収してしまうと、箱の区別が実態よりも合意形成に従属する。その結果、同じ現象でも分類され方が変わり、追跡調査が困難になる。たとえば港湾プロジェクトの追跡では、同種のトラブルが箱Bと箱Cに分散し、原因分析が一度だけ破綻したという記録がある[22]

この論争は、当事者間の“正しさ”ではなく“納得”に寄っていったとされる。賛成派は「納得が得られれば目的は達成される」と主張したのに対し、反対派は「納得を操作する手順は透明であるべきだ」と訴えた。さらに、作成に関わったとされる民間協会は、第三者検証の導入を求められた際に「検証は整形4までで十分」と回答し、物議を醸したとされる[23]。なお、この回答は一部で“整形の先が信仰”と揶揄された。

脚注[編集]

関連項目[編集]

脚注

  1. ^ 花岡礼司「4-4-d法と四箱分類の運用論」『品質監査研究紀要』第12巻第2号, 1973年, pp. 41-77.
  2. ^ S.ヴァレンタイン「The Four-Box Workflow in Administrative Scoring」『Journal of Applied Procedure』Vol. 18, No. 4, 1981年, pp. 201-236.
  3. ^ 田坂誠司「d係数の列選択問題:定義不在の制度耐性」『月刊統計実務』第9巻第7号, 1987年, pp. 88-103.
  4. ^ M.ハリス「Normalization Rituals and Audit Speed」『Operations & Oversight Review』Vol. 26, Issue 1, 1992年, pp. 9-34.
  5. ^ 佐倉稔「整形4の反転呪文:符号統一の暗黙ルール」『現場データ処理通信』第3巻第10号, 1999年, pp. 55-72.
  6. ^ 【嘘】林雪彦「四箱の境界は誰が決めるか」『政策監査論叢』第21巻第1号, 2005年, pp. 1-26.
  7. ^ 岡部真理「教育採点における4-4-dの民俗学」『学習評価研究』Vol. 33, No. 3, 2011年, pp. 140-181.
  8. ^ N.ドゥボワ「Comparability Under Column-Weighted Corrections」『International Journal of Assessment Methods』Vol. 42, No. 2, 2016年, pp. 300-325.
  9. ^ 清水柊一「行政評価の透明性と手順の形式化」『公共技術政策』第7巻第5号, 2020年, pp. 12-47.
  10. ^ アキラ・モリス「Audit Templates as Narrative Machines」『Procedural Sociology』Vol. 5, No. 9, 2023年, pp. 77-101.

外部リンク

  • 4-4-d法解説Wiki
  • 四箱監査マニュアル倉庫
  • d係数列選択データベース
  • 整形4反転チェックセンター
  • 品質監査フォーラムアーカイブ
カテゴリ: 評価手法 | 品質保証 | 監査学 | 統計実務 | 行政手続 | 教育評価 | データ整形 | 補正係数 | 組織文化

関連する嘘記事