ポーチェリの乱数定理
| 分野 | 確率論・数理統計・計算社会科学 |
|---|---|
| 提唱者 | ルカ・ポーチェリ(Luca Pocheli) |
| 主対象 | 適応型乱数生成器と条件付き確率過程 |
| 成立条件(概略) | 観測窓・圧縮手続・再符号化の整合性 |
| 代表的帰結 | 自己回帰型の観測でも検定統計が漸近正規化する |
| 発表年(推定) | 1997年 |
| 関連語 | 適応型乱数、再符号化、観測窓、ゆらぎ保存則 |
ポーチェリの乱数定理(ぽーちぇりのらんすうていり)は、確率過程が「見かけの秩序」を帯びる状況下でも、一定条件では統計的ランダム性が保存されるとする数学的主張である。特に、発生源が人間の意思決定に近い場合でも成立する点が特徴とされ、学術界では「数は嘘をつかない」という比喩で語られてきた[1]。
概要[編集]
ポーチェリの乱数定理は、「乱数」と呼ばれるものが必ずしも無作為な物理現象から生まれない場合でも、その統計的性質が崩れずに残ることを保証する定理として説明される。
定理の中心には、観測者が得た履歴をもとに生成器の挙動を調整できるという想定(適応型生成器)が置かれる。その上で、特定の再符号化手順を経ると、観測窓の長さが極端に短くない限り、検定統計の分布が「ランダム性に由来する形」に寄り戻すとされる[1]。
なお、この「寄り戻し」を数学的に表す際、ポーチェリは当時流行していた圧縮理論の語彙を借り、観測窓を通過するたびに情報が“ゆらぎ保存則”に従って再配置されると述べたとされる[2]。この語り口が、後に計算社会科学へ波及するきっかけになったと指摘されている。
発端と成立の経緯[編集]
露天書店の予測競技と「窓」の発明[編集]
ポーチェリの研究は、ので行われた「露天書店予測競技」に端を発したとする回想がある。この競技は、翌日の新聞見出しを乱数の目盛りで当てるというもので、観客は場内の掲示板を見て“当てたい気持ち”を乱数に反映できたとされる。
主催の一人だった統計課(当時の正式名称は『住民投票・統計調査室』)は、毎回の観測窓を「7分」「13分」「21分」のように素朴な長さで切り出す運用を採用した。ポーチェリは、この窓の切り方こそが定理の仮定に対応するとして、窓通過後に再符号化を施す手順を実装した。再符号化とは、観測結果をまず段階的に丸め、次にビット列として再記述する一連の操作である[3]。
ここで有名になった逸話として、競技の試行回数が「ちょうど1024回」になるよう、主催者が参加者の入退場を調整したとされる。ポーチェリ自身は、1024が偶然だったと否定しつつも、その偶然が定理の検証設計を救ったと述べたという[4]。
国際会議での“ゆらぎ保存則”の半分誤読[編集]
1990年代後半、ポーチェリはの年次会議(仮称)にて、ゆらぎ保存則のスライドを出した。このスライドでは「保存」と言いつつ、実際には保存“に近い”条件を並べていたとされるが、聴衆の多くが保存そのものだと誤読したとされる。
誤読のせいで、議論は一時的に「物理的乱数は人間の介入で必ず崩れるのでは?」という方向に逸れた。だが、ポーチェリの共同研究者である(当時統計工房)だけが、窓長の条件に注目し、「崩れるのではなく、分布が“寄り戻す”のでは」と反論したと伝えられる[5]。
この時点で定理は、論文としての完成度よりも先に、“社会の誤差を数理で飼い慣らす”というキャッチーな物語に変換された。そのため、のちの実装研究では検定統計の細部が妙に丁寧に扱われる傾向が残ったと指摘されている。
定理の内容(架空の厳密さ)[編集]
ポーチェリの乱数定理は、適応型生成器が出力する確率過程に対して、観測者が介入しても一定の統計構造が維持されることを主張する定理である。定理はしばしば「観測窓条件」「再符号化条件」「再符号化後の検定の形」という三段構えで説明される。
観測窓条件とは、観測者が過去の履歴を参照できるとしても、窓長が少なくとも「ln(n)+3」程度のオーダーを持つことを要求するものとして語られる。ここでnは試行回数とされ、例えばn=10^6なら窓長は概算で「ln(10^6)+3≒13.815…+3≒16.815…」とされるため、整数として16〜17程度が“目安”として流通した[6]。
再符号化条件は、丸め幅を「0.5σ」ではなく「0.5σ±10^-7」程度に揺らす手続を含む点で、実務家に妙に好まれた。これは厳密には矛盾のように見えるが、当時の計測機器の量子化誤差と一致するからだと説明されたという[7]。
その結果、検定統計は漸近的に正規分布へ整列し、さらに尾部確率が「第一近似で1/n、第二近似で1/n^2」へ落ちるとされる。もっとも、ここは“だいたいそうなる”程度に引用されることが多く、原著では「第二近似」の定義がページずれしているという噂もある[8]。
社会的影響と実装の物語[編集]
広告オークションでの“返り値”設計[編集]
ポーチェリの乱数定理は、数学の定理でありながら、広告オークションの運用設計に転用される形で知られるようになった。転用したのは、のに本社を置く仮想企業(当時)であるとされる。
同社は、入札戦略が人間に近い“適応性”を持つため、一般的な乱数生成器では入札分布が偏ると考えた。そこで、入札履歴を観測窓として切り出し、一定周期で再符号化する「窓返り制御」を導入した。すると、入札額の検定統計が理論通りに整列したと社内報が残っている。
ただし面白い逸話として、窓返り制御の周期が「ちょうど600秒」で固定されてしまい、ポーチェリの文献の“概算窓長”とはズレた。にもかかわらず整列が起きたため、社内では「理論が勝ったのか、機械が勝ったのか」議論が続いたとされる[9]。
行政の“予測ログ”炎上と検定の大げささ[編集]
日本では、系の実証事業により、行政の問い合わせ対応を自動化する際の予測ログに転用されたとされる。転用の名目は「問い合わせピークの予測精度向上」で、ログを観測窓に見立て、再符号化してから検定統計を用いる方針が採用された。
しかし、炎上の発端は検定の“見せ方”だった。ある自治体は、検定統計のp値を広報資料に掲載し、その値が「0.0499」前後で推移したため、住民側が「ほぼ確実に操作しているのでは」と誤解したのである[10]。
もちろん、ポーチェリの定理は介入を許容するものであり、必ずしも操作を意味しない。しかし数字のマジックが独り歩きし、「0.05以下なら疑え」という流行語まで生まれたとされる。ここから、数理の正確さと広報の正確さが必ずしも一致しないという教訓が残った。
批判と論争[編集]
ポーチェリの乱数定理には、確率モデルが過度に都合よく設計されているという批判が早い段階から存在した。とりわけ、再符号化条件に含まれる「±10^-7の揺らぎ」が、現実の計測系では再現できない可能性が指摘されたのである[11]。
一方で反論として、当該揺らぎは理論上のパラメータであって、実装では実機の量子化誤差に“吸収される”と説明された。さらに、窓長の推奨がln(n)+3の形である点についても、学術的には“目安”に過ぎず、厳密な境界はモデルに依存するため、誤用には注意が必要であるとされた。
もっとも、最大の論争は「定理が社会的に便利すぎる」ことであった。行政や企業が、都合よく乱数を“嘘の確率”に見立てて安心材料にしたため、数理が倫理の代替として消費されたという指摘が出た。結果として、ポーチェリの乱数定理は「証明のための数学」から「説明のための数学」へ滑り落ちた、と評価する研究者もいる[12]。
脚注[編集]
関連項目[編集]
脚注
- ^ Luca Pocheli『Observational Windows and the Return-to-Randomness Phenomenon』Springer, 1998.
- ^ Sofia Marcelli『Adaptive Generators Under Re-Encoding』Journal of Applied Probability, Vol. 52第3巻, pp. 201-248, 1999.
- ^ A. R. De Santis『Compression as a Statistical Mirror』Proceedings of the European Mathematical Society, Vol. 14第2号, pp. 33-71, 2001.
- ^ P. K. Tanaka『On the Myth of Fixed Randomness in Public Systems』Annals of Computation & Society, Vol. 7第1号, pp. 1-19, 2004.
- ^ Marta Vivaldi『Re-encoding Jitter of ±10^-7: A Practical Note』Statistics Letters, Vol. 12第4号, pp. 410-427, 2006.
- ^ Nicolas R. Bertain『Asymptotic Normality from Windowing』Probability and Computing, Vol. 9第6号, pp. 889-934, 2010.
- ^ 伊藤誠一『適応型データ処理と漸近的整列』共立出版, 2013.
- ^ 高橋由梨『行政ログにおける検定統計の可視化』東京大学出版会, 2016.
- ^ Klaus M. Overgaard『Randomness Theorems and the Ethics of p-Values』Oxford University Press, 2018.
- ^ “The Return-to-Randomness Manual” Institute for Quantitative Governance, 2012.
外部リンク
- Pocheli Window Archive
- Atlas Ad Exchange Research Memo Vault
- European Mathematical Society Annual Program Notes
- 総務省 予測ログ検証レポート(抜粋)
- Statistics Letters 旧号検索