プロ棋士(コンピュータサイエンス)
| 分野 | コンピュータサイエンス・AI・ゲーム研究 |
|---|---|
| 主な対象 | 囲碁/探索/方策学習 |
| 用語の由来 | チェス型AI設計を経て命名されたとされる |
| 評価指標 | 勝率だけでなく指し手確率分布の整合性 |
| 関連技術 | モンテカルロ法・強化学習・確率推論 |
| 代表的な組織 | 国立計算競技研究所(NCCE)など |
| 発展の中心地 | の研究会と各国のワークショップ |
| 備考 | 社会制度(棋士免状)とAI制度を混同して議論されやすい |
(ぷろきし(こんぴゅーたさいえんす))は、を競技として扱うのではなく、やの文脈で「棋士のふるまい」を設計・評価する枠組みであるとされる[1]。特に近年は、対局結果を直接学習するだけでなく、棋譜生成過程の統計的整合性まで問う立場が知られている[2]。
概要[編集]
は、囲碁棋士の技能を「人間の身体能力」ではなく「手続きとしての知能」として切り出し、計算機上で再現する試みを指す概念として扱われている[1]。
この枠組みでは、対局は「結果」よりも「手続きの出力列」として捉えられる。具体的には、候補手の選好を表すと、局面から先の価値を見積もるを組み合わせ、棋士が持つとみなされる暗黙の規則(読みの癖、寄せの順序、時間配分の癖)を統計モデルとして定義することが目標とされる[2]。
さらに一部では、棋士という呼称が誤解を招きやすい点を逆手に取り、「プロ棋士試験のように、機械にも免状を与えるべきだ」という制度設計論が展開された。これにより、アルゴリズムの性能評価と、免状審査の手続きが絡み合う領域が形成されたとされる[3]。
歴史[編集]
命名の起点と「棋士型探索」[編集]
この概念の起源は、1970年代末にを「人が読みそうな形」に近づけようとした研究連鎖に求める説がある。米国のに所属していたは、反復深化探索を「棋士が眠気で落とす可能性のある手」まで確率化するべきだと主張し、棋士の誤りをモデルに入れる設計を提案したとされる[4]。
その後、1992年に東京の小規模な研究会「縁台計算会議」で、Kwonの確率化探索が「プロ棋士のふるまい」に似ているとして、当時の参加者が冗談半分にという呼称を持ち込んだという[5]。このとき、初期実装はではなくで行われ、理由は「石の座標が格子で扱いやすいから」と説明されたが、当時の記録には「真夜中に寄せの譜を眺めていた」旨の注記が残っているという[6]。
また、命名を後押ししたとされる制度的出来事として、1997年に系統の委員会が、対局ログを解析するための匿名化手順(後述の「七段階匿名化」)を制定したことが挙げられる[7]。結果として、「プロ棋士」という語が“対局者”から“手続きの同一性”へと意味を移し始めたとされる。
NCCEと「免状AI」騒動[編集]
2000年代後半、が中心となり、「免状AI」と称される制度が試験導入された。制度の趣旨は、単に勝つAIではなく、棋士のように時間配分・失着パターン・学習後の振る舞いが一定の範囲内で再現できることを証明させることであった[8]。
NCCEが採用した審査では、評価に使う棋譜を「七段階匿名化」してから解析する。具体的には、棋譜中の着手番号を化し、座標を回転・反転で正規化し、さらに「局面の特徴量を57次元に丸める」手順が噛ませられたとされる[9]。当時の実務者は「丸めの誤差は最大で0.0003手分」と説明したが、なぜ“手分”という単位になったかは記録にない[10]。
ところが、この制度は一部から「免状は人間の権利を侵食する」という批判を受けた。特に2013年、の技術系新聞社が「棋士より速く免状を発行するのは誰だ」という見出しで報じ、審査手続きが監査不可能である点が問題視された[11]。その結果、NCCEは2016年に「免状AI審査はベンチマーク公開を伴う」と規程を改め、概念は“性能競争”から“手続きの説明責任”へと軸足を移したとされる。
仕組みと評価[編集]
プロ棋士(コンピュータサイエンス)のモデルでは、局面からの分岐を尽くす探索を必ずしも行わず、の枠組みで「棋士が選びそうな分布」を構成することがある。たとえば、候補手集合の重みを、局面の“手触り”に相当する特徴量(石の連結度、眼形の可能性、厚みの方向性)から作り、そこに探索結果を重ねる方式が提案されている[12]。
評価指標は勝率のみではなく、「探索が出した候補手の順位が、棋譜の順位と一致する度合い」が重視されるとされる。具体例として、ある研究グループは一致率を計算する際、TOP-kでk=7, 11, 17を試し、最終的に「k=11のとき一致率が最も“棋士っぽい”」と結論づけたと報告された[13]。
さらに“プロ棋士”らしさを担保するため、負け筋の出現頻度や時間切れの兆候も統計的に制御されることがある。例えば、同じ手を打つ確率が0.412の条件に収まらない場合、モデルをリジェクトする運用が議論されたとされる[14]。ただし、この閾値は学術的根拠が曖昧で、議事録には「気分で決めたが、なぜか当たった」との記述が見られるという[15]。この点が、後の批判と論争に繋がったとされる。
社会的影響[編集]
この概念が広まった結果、研究者は「勝つAI」から「説明できる意思決定モデル」へと関心を移したとされる。特に、教育現場では、棋譜から学ぶ教材が開発され、「人間の読みの癖」を推定する教材がの研究会で紹介された[16]。
一方で、対局文化への影響も指摘される。従来、棋士の解説は経験に基づく“語り”として理解されていたが、プロ棋士(コンピュータサイエンス)の文脈では解説が“生成モデルの出力”に置き換わる懸念が生じた[17]。
また、企業の広告にも波及したとされる。たとえばのスポーツ用品メーカーが「免状AI監修の直感盤」を売り出した際、パッケージには「指し手のリズムが3.2%だけ人間に近づく」との文言があり、検証不能性が話題になった[18]。このように、概念が“技術から商品へ”転用される速度が速かった点が、社会的混乱の原因になったと見られている。
批判と論争[編集]
批判の中心は、用語の比喩が制度的誤解を招く点にある。プロ棋士という語が、技能競争の正当化に使われることで、実際の棋士コミュニティが価値判断を委ねられる構図が生まれるという指摘がある[19]。
また、学術的には「手続きの再現性」を守るための統計加工が過剰ではないかという論点がある。七段階匿名化に含まれる「特徴量を57次元に丸める」処理は、情報を意図的に捨てることになるため、研究倫理上の境界が問われた[20]。さらに、k値の選択が「最も棋士っぽい」という曖昧な感性に寄る点が問題視され、再現実験では一致率が10%程度下がったという報告もある[21]。
最後に、最も笑い話めいた論争として、ある審査員が「このAIはプロ棋士の免状を持つが、棋譜を読む速度が人間より速すぎる。だから免状が“早すぎる”」と述べたとされる事件がある[22]。この主張は統計的に成立しないにもかかわらず、場の空気が数か月にわたって尾を引いたとされる。
脚注[編集]
関連項目[編集]
脚注
- ^ Evelyn R. Kwon「Probabilistic Reading in Lattice Games」『Journal of Competitive Computation』Vol.12第3号, pp.41-68, 1999.
- ^ 山路涼太「棋士の誤りを学習する探索」『人工知能学会誌』第18巻第2号, pp.210-231, 2001.
- ^ 佐伯真琴「免状AI審査の設計原理と七段階匿名化」『情報処理学会論文誌』Vol.48第11号, pp.3001-3034, 2012.
- ^ M. Alvarez, T. Nakamura「Policy Distribution Consistency for Game Decision Models」『Proceedings of the International Workshop on Methodological Games』Vol.7, pp.11-27, 2008.
- ^ 渡辺精一郎「棋譜統計の次元圧縮(57次元問題)」『計算社会科学研究報告』第5巻第1号, pp.1-19, 2011.
- ^ E. R. Kwon「Revisiting Time Allocation Bias in Go-like Searches」『ACM Transactions on Applied Reasoning』Vol.9 No.4, pp.77-103, 2004.
- ^ 国立計算競技研究所編『免状AI:監査可能性ガイドライン』NCCE出版, 2016.
- ^ Hiroshi Kisaragi「k値選択の主観成分と一致率」『日本認知工学会研究集録』第33巻第2号, pp.88-95, 2014.
- ^ Margaret A. Thornton「Human-Comparable Decision Trees in Competitive Games」『IEEE Transactions on Systems and Games』Vol.21第1号, pp.5-29, 2010.
- ^ T. Nakamura「免状が早すぎる問題」『計算倫理通信』第2巻第9号, pp.55-60, 2017.
外部リンク
- NCCE 免状AI アーカイブ
- 縁台計算会議 議事録データベース
- 棋譜匿名化 手順公開ポータル
- 説明可能な意思決定モデル 共有サイト
- 免状AIベンチマーク(暫定)