嘘ペディア
B!

カイ二乗分布

この記事はAIが生成したフィクションです。実在の人物・団体・事象とは一切関係ありません。
カイ二乗分布
分類確率分布・推定モデル
主用途適合度検定・分散の推定
典型的な形自由度(整数)により変化する曲線
発案の舞台ベルリン王立保安庁統計局(架空)
関連概念正規分布・ガンマ分布・尤度
社会的影響公共事業の採択基準の標準化
備考一部では“裁判用の曲線”と呼ばれた

カイ二乗分布(かいにじょうぶんぷ、英: Chi-Squared Distribution)は、観測された数の「ズレ」から社会的信用度を推定するために用いられた上の確率分布である[1]。もともとは裁判官向けの信頼機構として発案され、のちに学術分野へ拡張されたとされる[2]

概要[編集]

カイ二乗分布は、複数の独立した観測量の平方和(のような量)を「不確実性の貯金」として扱う枠組みであるとされる[3]。信頼度が高いほど平均値に近づくという、直感に合う形で説明され、特に検定や推定に応用されたとされる。

成立経緯としては、19世紀末の行政現場で「説明責任の不足」を数値化する必要が生じ、裁判資料の体裁を整えるために、統計官が“ズレの総量”を曲線化しようとしたことに由来すると語られてきた[4]。その後、学術的に整備され、自由度という概念が一般化されていったとされる。

もっとも、現場では分布名の由来が誤解されることも多く、ある編集者は「“カイ”はギリシャ文字のχ(カイ)そのものではなく、当時の保安庁長官の通称だ」と注記していたという[5]。一方で、この点は“後付けの逸話”とする見方もあり、定説化されていない。

歴史[編集]

保安庁統計局での“適合度スコア”の試作[編集]

架空の起源譚では、ベルリン統計局で、検問の通過率や書類の不備率を同じ尺度で扱う必要が生じたことが契機とされる[6]。当時、統計官のは、個々の誤差を縦横に並べると説明が長くなり、裁判で「数式が読めない」という理由で却下されることが増えたと記録した。

そこで、ファルケンシュタインは「誤差を平方にして足せば、裁判官が一目で“総量”を理解する」と考え、1897年の春に試作品の表を提出したとされる[7]。同年4月12日付の内部報告では、試験データ7,640件に対し、判決文での“読み取り可能”率が58%から71%へ上がったと記録されている[8]。この数字はのちに「分布の社会実装が始まった日」として語られる。

ただし当初は、曲線の数式が安定せず、港湾監査官のが「曲線が暴れて見えるのは、自由度の扱いが雑だからだ」と指摘したとも伝えられる[9]。ここから自由度の整理が進んだとする説があり、学会史の編纂ではこの“暴れ”を具体的に「自由度が8のとき山が−0.3%だけ負に沈む現象」と表現している[10]。要するに、実務で困った“見た目の挙動”が理論の磨き込みに繋がった、という筋書きである。

学術化と検定文化の輸出[編集]

20世紀初頭、ベルリンで整備された枠組みは、経由で大学の講義へ入り、さらに通信網を通じてロンドンの統計研究会へ持ち込まれたとされる[11]。この過程で、数式の“解釈”が変わった点が重要である。元来は裁判資料の「納得可能性」を上げるための実務概念だったが、学術側では「分散に関する検定統計量」として再ラベル付けされたとされる[12]

特にの国際会議「信頼性測度と検定法(第4回)」では、が“平方和を扱うなら、確率密度の裾に気を配れ”と発表したと記録されている[13]。この会議議事録によれば、出席者は42名、うち実際に議論に参加したのは16名で、残りの26名は「自由度を“人数”と勘違いした」と注記されている[14]。この勘違いはのちに誤植として直され、会議の翌年には講義ノートの補訂版が出た。

また、社会への影響としては、ニューヨークの公共事業委員会が入札審査に“適合度スコア”を導入し、予定価格の調整を統計的に説明する書式が標準化されたとされる[15]。導入後、落札率の分散が「年次で12.4%→8.9%」へ下がった、という数字が独り歩きしているが、これが公式統計なのか社内推計なのかは定かでないとされる[16]。なお、このあいまいさこそが、分布の“現場適用の物語”を長続きさせたとも解釈されている。

曲線の“呪文”化と、編集者が挿し込んだ注釈[編集]

理論が整うにつれ、カイ二乗分布は「教科書の曲線」として扱われるようになったが、同時に実務では“呪文”のような扱いもされたとされる[17]。具体例として、に作られたと言われる罫線帳「監査官のための四十八枚表」では、分布の自由度を読む手順が図解されている。

その手順の一部は、次のように書かれていたと引用されることがある。「自由度は“疑わしさの人数”ではない。誤差の数え上げである。1、2、3…と数えるが、最後は必ず“半拍”置いて呼吸をする」[18]。この“半拍”は科学的根拠を欠くとして、のちに学術側から批判されたが、現場の書類文化には意外なほど馴染んだという。

なお、この逸話をまとめた当時の編集者が、脚注の欄に「半拍は統計局の紳士協定であり、誰も理由を知らない」とだけ書き残したことが確認されている[19]。一方で、この脚注が本物かどうかは、後年の写本比較で議論になったとされる。

性質と“使われ方”[編集]

カイ二乗分布は、自由度を変えることで曲線の形が変化するとされる[20]。講義ではしばしば「裾が長い」「山が鋭い」といった言い方で説明されるが、実務ではもう少し具体的に「罰金の提案が出やすい帯域」や「説明責任の不足が疑われる領域」に対応づけられたとされる[21]

たとえば、ある公共入札の審査会議では、監査官が「この地区の書類ミスは分布の右側に偏っている」と述べたことで、単なる不備ではなく“構造的なずれ”として扱う運びになったという[22]。このとき、会議録には「自由度=9として計算。p値は0.0312、よって“改善命令”」とあるが、当時の監査官がどの推定法を使ったのかは明記されていない[23]

また、統計家のは、検定を“判決のための装置”としてではなく“対話のための地図”として説明するべきだと主張したとされる[24]。ただし、実務においては地図がそのまま裁定に転用されることも多く、会議の議論は「地図の読み方」ではなく「どの地図を採用するか」にすり替わったと指摘されている[25]。このすり替えが、のちの批判へと繋がる。

批判と論争[編集]

カイ二乗分布をめぐる論争は、主に“数が説得になる”という前提の扱いに集中したとされる[26]。批判者は「分布が正しくても、何を誤差として数えるかが恣意的なら結論も恣意的になる」と述べたという[27]。特に、裁判資料の適合度スコアへ転用する過程で、誤差の定義が案件ごとに変わり得る点が問題視された。

一方で擁護側は、定義を揃えるための手続きが整備されていると反論した。ベルリン統計局の「誤差カタログ(第2版)」では、数えるべき項目が“欄ごとのチェックリスト”として列挙されており、編集委員会が監査したとされる[28]。ただし、そのチェックリストの欄数が「全48欄で、うち3欄だけ“会話で埋める欄”がある」と書かれている点は、冷笑を誘った[29]

最終的に、論争は「統計は中立か」という一般論に接続されたとされるが、具体的には“裁判官の読み取り可能率”を根拠にした正当化が、学術的には弱いという指摘が出た[30]。その弱さは、p値の値そのものよりも、値が出るまでのプロセスにあるとされ、が社会に与える影響の説明責任も問われるようになったという。

脚注[編集]

関連項目[編集]

脚注

  1. ^ Hermann Falkenstein『裁判資料のための適合度曲線(草案)』ベルリン王立保安庁統計局出版, 1900.
  2. ^ Marguerite Roede『自由度の見取り図:山が暴れる理由』ベルリン学芸館, 1902.
  3. ^ François Bertrand-Cruz『信頼性測度と検定法:第4回会議報告』International Society for Measurement, 1913.
  4. ^ Kenneth Olsen『地図としての検定、判決としての誤解』ロンドン統計同好会叢書, 1931.
  5. ^ J. A. McPherson『Square-Sum Statistics in Administrative Courts』Journal of Applied Probability, Vol. 12, No. 3, 1949.
  6. ^ Sigrid Holm『行政データにおける裾の長さと説得の技術』北欧統計レビュー, 第7巻第1号, 1956.
  7. ^ 渡辺精一郎『監査官のための四十八枚表:写本研究』京都数理史学会, 1978.
  8. ^ L. R. Sato『Chi-Squared and the Rhetoric of Credibility』Proceedings of the World Symposium on Inference, Vol. 5, pp. 101-136, 1988.
  9. ^ Evelyn Carter『Errors, Apologies, and the Chi-curve』統計的法理の国際誌, 第3巻第2号, 1995.
  10. ^ Yoshio Tanaka『読める数式の作法:裁判と確率の接点』東京大学出版会, 2008.

外部リンク

  • 保安庁統計局アーカイブ
  • 自由度講義ノート倉庫
  • 監査官のための四十八枚表(閲覧室)
  • 地図としての検定プロジェクト
  • 統計の社会史データベース

関連する嘘記事