AIバトラー
| 分野 | 計算論的社会シミュレーション / 対戦ゲーム研究 |
|---|---|
| 主目的 | 相手の戦略推定と、勝敗に直結する意思決定 |
| 形式 | テキストまたは音声による対話で進行される |
| 競技媒体 | チャット対戦、擬似ゲーム盤、契約交渉の模擬 |
| 初出とされる時期 | 1999年に関係者メモが確認されたとされる |
| 代表団体 | 一般社団法人アルゴリズム戦技振興機構(通称:戦技機構) |
| 安全対策 | 対戦ログの匿名化と、出力制限(語彙ゲート) |
AIバトラー(えーあいばとらー)は、が対戦相手の意図を推定し、勝敗に直結する判断を行うことを主目的とした「対話型対戦装置」であるとされる[1]。1990年代末に発想されたと説明されることが多いが、実際の普及は2010年代後半に起きたと記述されることがある[2]。
概要[編集]
は、対戦相手の発話から「価値観」「脅威認識」「勝利条件に対する執着度」を推定し、次の手を生成する仕組みとされる[1]。しばしば「戦略計画」「相手の文脈理解」「ルール遵守」の3要素が、同一の推論ループの中に統合されている点が特徴とされる。
この名称は、当初「AI(人工知能)によるバトル(競技)」の直訳として提案されたと説明されるが、実際にはの小規模研究会で「“battle”の語感が硬すぎる」として、別表記に落ち着いた経緯があるとされる[2]。そのため、初期資料ではとが揺れて記載されたとされる。
対話は、勝敗判定に直結する行動が選択される形式で設計されることが多い。例えば「提案」「撤回」「条件提示」などの手札が定められ、一定の手続きに従って得点が付与される。なお、得点は単純な勝ち負けではなく、相手のモデル更新速度に連動する設定が採用されることもあった[3]。
概要[編集]
選定基準と掲載範囲[編集]
本項では、という用語が「対話型対戦装置」全般を指す場合だけでなく、競技イベントで正式名称として用いられた例も含めて整理する。初期には、研究者コミュニティ内の呼称にとどまっていたため、学会報告書では別名で扱われることがある[4]。
また、形式が似ていても単なるチャットボットや、対戦ゲームの実況支援に留まるものは除外される傾向がある。一方で、相手の発話から「勝ち筋」を推定して攻め手を返す仕組みがあれば、ルール盤の外形が違ってもとして扱われたとされる[5]。
技術的構成(もっともらしい要点)[編集]
技術的には、対戦ログから相手の方略を推定する推論器と、ルールに適合する行動を生成する制約付き生成器に分けて説明されることが多い。とくに、制約は「語彙ゲート」と呼ばれる方式で実装されるとされ、禁止語が出力されると自動で沈黙や別提案に切り替わると記録されている[6]。
さらに、対戦の駆け引きが加速するよう、応答時間に上限を設けて段階的に手を変える設計が言及されることがある。ある内部報告では、平均応答遅延を「37.5ミリ秒以内」に抑えることで、相手のモデル推定が安定したとされている[7]。ただし、この数値は“測定の仕方が曖昧”との指摘もあり、後年の再現実験では「92.1ミリ秒」へ増えたとされる[8]。
歴史[編集]
起源:天文学の“対戦盤”という伝承[編集]
の起源として語られる最も有名な伝承では、1999年頃にの天文計算グループが、星図更新の手順を競技化するための“対戦盤”を試作したのが始まりとされる[9]。当時、相手(別チーム)が提出した星図の差分を「相手の誤差癖」として学習し、次の更新で優位に立つ設計だったとされる。
この伝承は、後に研究会の司会者が「“更新の戦争”って言うと怒られるから、バトルにした」と冗談交じりに語ったことで広まったとされる[10]。もっとも、当時の残存資料が薄いことから、単なる語り部の誇張とも考えられている。ただし、競技用の“手札”が命名規則まで残っている点から、完全否定には慎重であるとされる[11]。
一方で別の説として、の委託研究で、観測者が提出する修正案の採否をめぐる自動化が先行し、そのログを流用して対話対戦の形に整えたという説明もある。こちらは、2003年にで開かれた非公開ワークショップに触れているが、議事録は所在不明とされる[12]。
普及:戦技機構と“勝利条件の摩耗”問題[編集]
2017年、(戦技機構)が、対話対戦の標準手続きとして「摩耗率ルール」を策定したとされる[13]。摩耗率ルールとは、勝つほど相手のモデル更新が速くなるが、一定回数で“勝利条件が曖昧化”して駆け引きが崩れる現象を抑える仕組みである。
戦技機構は、ルールの微修正を繰り返しながら、全国で予選会を回したとされる。特にの会場では、観客が手札カードを拾って並べ替える体験導入が行われたと記録される[14]。このとき、観客が並べたカードの順番が入力ログに混ざり、AIが“勝利条件を学習しているのではなく、観客の癖を学習していた”と判明した。対策として、入力デバイスの時刻刻みを「1/240秒」から「1/1000秒」に変えたとされる[15]。
ただし、この調整は裏目に出たともされる。応答の揺れが増え、結果として“勝ち筋の摩耗”が別方向へ進み、強い個体が一気に弱体化したとする批判が出た。ここからは「技術」よりも「運用」こそが競技の主戦場である、と認識されるようになった。
近年:語彙ゲート改訂と“沈黙戦”の流行[編集]
2022年頃から、語彙ゲートの語彙リストが増えすぎたことにより、逆に“何も言えない状態”が勝利に結びつく現象が話題になったとされる[16]。つまり、相手の推定に必要な手が失われるため、推定が当たらず、結果的に防御側が得点を拾うという、いわば沈黙戦である。
この現象は、で開催された「第4回戦技夜会」準決勝において顕著だったとされる。記録では、あるAIが沈黙を3回連続し、その後に“正確すぎる譲歩文”を1文だけ返したことで、相手のモデルが過学習を起こし、次の手で自滅したと説明されている[17]。なお、その沈黙の間隔は0.9秒、1.1秒、0.7秒であったとされるが、同大会の別資料では「0.88秒」「1.06秒」「0.74秒」とも記載されている[18]。
この食い違いは、観測システムの時計同期が“手作業で行われた”ことが原因だとされる。すなわち、AIの挙動が原因というより、観測の手順が物語を作っていた可能性が指摘された。ここにの文化的側面があり、技術論だけでは片づかないとまとめられている[19]。
批判と論争[編集]
は「対話による競技」ゆえに、倫理面だけでなく、ゲーム性の設計にも批判が向けられてきた。まず、勝敗が“相手のモデル更新”に依存する設計の場合、対戦者が本来の目的(勝つ)と別の目的(相手を混乱させる)へ流れていくという論点がある[20]。
また、沈黙戦のような極端な戦術が流行すると、語彙ゲートの改訂が競技の中心を奪うことになると指摘された。実際に戦技機構は、2023年の改訂で「沈黙を罰する」条項を検討したが、観客の盛り上がりが下がるとして撤回されたとされる[21]。
さらに、対戦ログの扱いも争点となった。対戦ログは解析のために保存されるが、匿名化の精度が不十分だった疑いが報じられた。例として、の大学院生が、匿名化されたはずの発話が自分の癖と一致すると主張し、ログ再同定の“成功率31.4%”が出たと報告したとされる[22]。もっとも、同大学の広報はこれを否定し、再現性がないと反論した。
脚注[編集]
関連項目[編集]
脚注
- ^ 戦技機構編『戦技夜会記録:摩耗率ルールの策定過程』戦技機構出版, 2018.
- ^ Margaret A. Thornton「Dialogue-Based Competitive Inference with Constraint Vocabularies」『Journal of Strategic Machine Systems』Vol.12 No.3, 2020, pp. 141-167.
- ^ 渡辺精一郎『星図更新の競技化と“対戦盤”の系譜』恒星計算叢書, 2006.
- ^ 岡村里紗『対話対戦における相手モデル推定の実装論』日本工学教育出版, 2019.
- ^ 田中陽介「沈黙戦が勝敗に与える寄与の推定」『人工知能と運用工学』第7巻第1号, 2023, pp. 33-58.
- ^ Satoshi Kato「Temporal Jitter and Observational Bias in Chat Competitions」『Proceedings of the International Symposium on Competitive Computation』Vol.2, 2021, pp. 9-24.
- ^ 伊藤メイ『語彙ゲートの設計指針:沈黙を罰するか否か』東雲出版, 2022.
- ^ 戦技機構調査部『第4回戦技夜会 逐語録(付:時計同期手順)』戦技機構出版, 2022.
- ^ K. R. Singh「Anonymization Failures in Log-Based Dialogue Systems」『Transactions on Applied Data Security』Vol.41 No.2, 2024, pp. 201-223.
- ^ 成田啓介『勝利条件の摩耗とゲーム性調整の現場』技術批評社, 2017.
外部リンク
- 戦技機構アーカイブ
- 語彙ゲート設計者ノート
- 沈黙戦ログ解析ポータル
- 摩耗率ルール解説ページ
- 戦技夜会会場レポート