カーラー・ササンデラのアルゴリズム
| 分類 | 確率的探索アルゴリズム |
|---|---|
| 提唱者とされる人物 | カーラー・ササンデラ |
| 主な応用分野 | ポートフォリオ再構成、リスク推定、スケジューリング |
| 特徴 | 再帰的な重み更新と“遅延反転”と呼ばれる操作 |
| 初出とされる年 | 1997年 |
| 実装で用いられる標準パラメータ | 重み半減期 λ、探索温度 T、遅延窓 d |
| 関連技法 | 擬似乱数列、最尤推定、ベイズ更新 |
カーラー・ササンデラのアルゴリズム(英: Kara Sasandera's Algorithm)は、確率的最適化の手続きを応用した、系の探索アルゴリズムとして知られている[1]。1990年代にの学際研究チームが報告したとされるが、詳細は長らく秘匿されていた[2]。
概要[編集]
カーラー・ササンデラのアルゴリズムは、候補解を「信用点数(credibility score)」で順位付けし、その点数が一定期間反転しない場合にだけ探索の向きを変える方式として整理されている[1]。
形式的には、反復ごとに尤度(likelihood)を計算し、次に重み半減期を介して過去情報の影響を抑制する。ただし特徴的なのは、更新の直後ではなく“遅延窓”の満了後に重みの符号を反転する(遅延反転)点である[2]。
この手順は一見すると単なるヒューリスティックに見えるが、研究者の間では「計算資源の節約」と「相関の罠の回避」を同時に狙った設計であると説明されてきた[3]。さらに、当初はの地下施設で試験されたため、評価指標の細部が“黒箱”として残ったとされる[4]。
仕組み[編集]
アルゴリズムの標準形では、入力として「状態ベクトル x」、信用点数の初期値 c0、探索温度 T、遅延窓 d、そして重み半減期 λ が与えられる[1]。
反復 i において、各候補状態 x_i の信用点数は次式のように定義されると記述されることが多い。すなわち、尤度に比例する項と、探索の多様性を測る罰則項の和である[5]。このとき、遅延窓 d が満了するまで重み更新は見かけ上“固定”される。
遅延反転は、d 回分の試行で信用点数が最良のまま推移したときに発動するとされ、これにより「最良に固着してしまう局所挙動」を崩すとされる[2]。なお、実装例では d=13、λ=0.031、T=2.7 といった“やけに具体的”な値が引用されることがあるが、これらはサンプルデータの性質に合わせた秘匿設定だったと解釈されることもある[6]。
一方で、後年の追試では d=13 ではなく d=12.5 を用いても同等の性能が得られたという報告があり、パラメータの連続最適化に由来する誤差が混入していた可能性が指摘されている[7]。ここに、アルゴリズムの「厳密性と神話性」が同居しているとされる。
歴史[編集]
秘匿の起源と学際連携[編集]
カーラー・ササンデラのアルゴリズムは、1990年代後半にのベルリン周辺で進められていた「都市交通の同時最適化」を出発点にしたと語られている[2]。当時、の交通局は“遅延反転”という言葉を、実際の信号制御の誤差補正に転用していたともされる[8]。
しかし、数学モデル化が進むにつれ、単なる交通制御ではなく、投機的な需要予測(forecast)に似た振る舞いが観察されたため、の研究者が混ざっていったと記録される[5]。この混在が「信用点数」という、工学用語ではないスコア概念を生み、さらに社会心理学の研究者が“固着”の比喩を持ち込んだことで、遅延反転の発動条件が物語化したとされる[9]。
当時の中心人物としては、ササンデラだけでなく、の一部門と関わったとされる統計家の(Hermann Klöhn)や、確率過程の技術者(Julia Weitz)が名前として挙がることがある。ただし一次資料の所在は不明とされ、近年の検証では“別部署の講義ノートに見える”程度の断片しか確認されていない[4]。
社会への波及と“遅延反転”の誤用[編集]
1997年に、の特集号で「遅延窓が反転を要請する」という表現とともに予備的結果が掲載されたとされる[1]。その直後、でも金融機関が導入検討を行ったが、当初は社内研修資料の写しが出回ったため、パラメータが“丸められた形”で広まったとされる[6]。
とくに、重み半減期 λ を “0.031” のまま使った企業が多かった一方で、別の企業では「λ=0.03 は同じ」と解釈して改変した。ところが、その企業の監査記録によれば、改変した後にリスク推定の分散が月次で約1.7倍になったと報告されている[7]。この数値は後に「遅延窓の解釈ミス」ではなく「信用点数のスケール誤差」で説明されたが、社内では原因が曖昧なまま残ったという[10]。
さらに、金融だけではなく、の自治体で“行政手続きの優先順位付け”に転用された例がある。ある内部資料では、窓 d を13にして申請の滞留が改善したとされるが、実際には繁忙期の統計サンプルが偏っていた可能性が後に指摘されている[11]。それでも“遅延反転”は「動きを止めるほど上手くいく」というキャッチフレーズとして一人歩きし、教育現場にも応用されたとされる。
評価と実装慣行[編集]
アルゴリズムの評価指標としては、通常の損失関数に加え、「最良点への到達時間(time-to-best)」と「信用点数の反転回数(score reversal count)」が用いられると説明されることが多い[5]。
実装では、擬似乱数列の初期化が結果を左右するため、サンプル生成に用いられるシード値が“論文よりも引用される”傾向があるとされる[6]。たとえば、特定の追試ではシードを 42 に固定した場合、score reversal count が平均で 3.2 回となり、固定しない場合は 4.8 回に増えたという報告がある[12]。
ただし、追試には矛盾もある。別の研究グループは同様の設定で reversal count を 2.9 回と報告しており、ここから測定手法の違い、もしくは“信用点数の正規化のタイミング”が差分になっている可能性があるとされた[7]。
加えて、実装慣行では“遅延窓 d は整数に限る”とされることがあるが、前述の通り d を 12.5 とする連続化が議論されており、コミュニティ内での解釈が完全には一致していない[3]。この微妙な揺らぎが、アルゴリズムが神話化する要因とも言われる。
批判と論争[編集]
批判としては、まず「遅延反転」の発動条件が、実験説明としては便利すぎる点が挙げられる。つまり、理論的に必然であるよりも、結果が良くなるように後から整形されたのではないかという指摘である[10]。
また、信用点数の定義が、初出論文では一貫していないとされる。ある編集者は尤度項を「観測誤差の説明力」として記述し、別の編集者は「参加者の心理的納得度」を近似として導入しているように見えると述べたとされるが、校正記録は確認されていない[13]。
この論争のハイライトとして、ベルリンの会議記録では「d=13 を使うと運が良い」という発言が議事録に残っていたとする説がある[4]。その一方で、別資料では同じ会議で「運は数式に入らない」と釘を刺す発言があったともされ、真偽が混線したままとなっている[11]。
さらに、過度な転用による社会的誤用も問題視された。行政の優先順位付けに導入した自治体では、説明責任の観点から「信用点数がなぜ上がったか」を住民に説明できず、透明性が欠けるとして内部監査が入ったと報じられた[14]。アルゴリズム自体は“善意の工夫”として語られるが、運用が単純なブラックボックス化を招いたともされる。
脚注[編集]
関連項目[編集]
脚注
- ^ Kara Sasandera, "A Delayed Reversal Rule for Credibility-Weighted Search," European Journal of Applied Stochastics, Vol. 18, No. 3, pp. 221-239, 1997.
- ^ Hermann Klöhn, "On the Interpretation of Score Reversal Counts in Adaptive Heuristics," Journal of Practical Probability,第12巻第2号, pp. 41-58, 2001.
- ^ Julia Weitz, "Delayed Windows and Hidden Normalizations," Proceedings of the International Conference on Stochastic Engineering, pp. 77-95, 2004.
- ^ ベルリン都市交通局 編『遅延窓制御の社会実装記録(非公開草案)』ベルリン交通局, 1998.
- ^ M. T. Ronsdale, "Bayesian Notes on Likelihood Surrogates in Portfolio Reconstructions," Finance and Computing Letters, Vol. 9, No. 1, pp. 12-30, 2003.
- ^ 佐藤真琴『スコア正規化の落とし穴―λが変える意思決定』共栄出版, 2006.
- ^ Elena Marković, "Parameter Quantization Effects in Stochastic Search Schemes," Annals of Applied Randomness, Vol. 27, No. 4, pp. 301-318, 2010.
- ^ K. Nakamura, "Time-to-Best Metrics for Delayed Reversal Models," 日本統計学会誌,第66巻第1号, pp. 55-72, 2012.
- ^ Talia Ogburn, "Explaining Credibility Scores to Auditors: A Field Study," Risk Governance Quarterly, Vol. 3, No. 2, pp. 90-105, 2015.
- ^ 笹木いおり『都市行政と確率最適化の“説明できない成功”』東京大学出版会, 2018.
- ^ G. L. Vanden, "A Practical Guide to Pseudo-RNG Seeds in Heuristic Implementations," Computational Mythmaking Review, pp. 1-19, 2020.
- ^ Yusuf El-Arabi, "The λ=0.031 Myth and Its Alternatives," Proceedings of the World Conference on Irreproducible Algorithms, Vol. 2, No. 7, pp. 401-420, 2019.
外部リンク
- Deliberately Delayed Archive
- Credibility Score Working Group
- Berlin Stochastic Engineering Portal
- 遅延反転研究会メモ
- Heuristic Audit Resource Center