ARE
| 別名 | Adaptive Reasoning Evaluation(通称:ARE) |
|---|---|
| 分野 | 意思決定工学・組織運用論 |
| 成立期 | 1960年代後半から1970年代初頭 |
| 主な利用先 | 審査委員会、投資会議、研究評価 |
| 指標の性格 | 説明可能性(Explainability)寄り |
| 関連概念 | 根拠束ね(Evidence Bundling)、反証窓(Refutation Window) |
| 中心都市 | 、 |
ARE(えーあーるいー)は、主としてとの境界領域で用いられてきた、状況適応型の意思決定指標であるとされる。〇〇を“説明可能”に整形する技法として普及し、のちに社会制度の設計にも影響を及ぼしたとされる[1]。
概要[編集]
は、ある判断を下した後に「なぜその判断になったのか」を、短時間で追跡可能にするための評価枠組みとして扱われてきたとされる。特に審査や査定の場面で、「誰が聞いても同じ説明になる」ことを目標に整備された点が特徴とされる。
この指標は、単なる点数化ではなく、説明文の“構造”に着目するとされている。すなわち、判断に至るまでの根拠を、反証しやすい形に整え、次の会議で再利用できるようにすることが主眼であるとされる。一方で、設計思想が過度に形式化されると、説明のための説明が増えるとして批判も受けてきた。
なお、という略称は英語圏の会議記録に現れたとも、あるいは日本の官僚資料の社内略語が先に広まったとも言われている。ただし、この由来については複数の証言があり、特定が難しいとされる。
定義と仕組み[編集]
基本構成(4層モデル)[編集]
AREは、判断の“説明可能性”を4層に分解して扱うとされる。第一層は事実(Facts)、第二層は解釈(Interpretations)、第三層は予測(Predictions)、第四層は行動(Actions)であるとされる。各層は文章量ではなく、構成単位の数(たとえば「根拠文の塊」)でカウントされるとされ、ある研究では層あたり平均1.7塊で最適化されたと報告されている[2]。
さらに、各層には“締め”の作法があるとされる。例えば解釈層では、必ず反対意見を先に書き、次に採否を述べる「反転手順」が採用されたとされる。これにより、説明が長文化しにくくなると説明されてきた。一方で、反転手順が形式テンプレート化すると、反対意見が空文化するという問題が指摘されている。
スコアリング(端数に意味がある)[編集]
スコアは0.00から9.99の範囲で算出されるとされるが、細部まで規定があるとされている。たとえば小数第2位は“反証窓”の幅を示し、反証窓が「3.2週間〜3.4週間」に収まると、説明の再現性が最も高いとする仮説が語り継がれている[3]。
また、端数は誤差ではなく“説明の癖”として扱われるとされる。小数第1位が7の説明は「根拠が束ねられ過ぎている」兆候で、小数第1位が2の説明は「解釈が逃げている」兆候である、と分類されてきた。これらは統計的検定というより、審査官の観察記録から整理されたとされ、議論の種にもなった。
歴史[編集]
起源:気象台の夜勤から生まれたとされる[編集]
AREの起源は、の前身組織の夜勤記録にあるとする説がある。1968年頃、内の観測網で欠測が相次ぎ、説明の整合性が問題になったため、上級職が「文章の形を揃えろ」と命じたことが発端になったと語られている[4]。
ただし、当初は指標ではなく“読み合わせ”の技術として運用されていたとされる。具体的には、観測結果の説明文を同じ書式に流し込み、翌朝に別班へ渡す方式が採用されたとされる。そこから、書式の中に潜む構造が評価の鍵だと気づかれ、のちに4層モデルへ発展したとされる。
発展:ボストンの大学院会議がテンプレ化した[編集]
1972年、の研究会「Proceedings of Rational Narratives」に、若手の研究者たちが“説明の文章塊”を数える手法を持ち込んだとされる。参加者の一人として、と名付けられる研究者が言及されているが、当時の所属は大学名が複数回変わっているため、正確な在籍は曖昧だとされる[5]。
会議では、AREの草案が「会議の議事録に貼れる一枚」であることを条件に洗練されたという。さらに「0.00〜9.99」という表現が採用された背景として、当時の端末が小数第2位までしか表示できなかったことが語られている。技術的な制約が、かえって“細かい癖”を可視化する設計思想になったとする回顧が残っている。
社会制度への波及:補助金審査で“説明の税”が導入された[編集]
1981年、研究助成の選考にAREが導入された結果、「説明に要する作業量」が不意に増えたとされる。そこで、説明作成にかかる時間を抑えるため、審査事務側がAREの“入力フォーマット”を強制したという[6]。
このとき、入力フォーマットの達成度が一定水準を満たさない申請は、形式要件未達として一次で落とされる運用になったとされる。結果として、申請者は研究テーマよりも説明の整形にコストを割くようになり、「説明の税」だと揶揄されたと記録されている。皮肉にも、説明が整うことで説明の質が上がった事例もあり、完全な失敗とは言い切れないと評価されている。
社会への影響と運用上の“常識”[編集]
AREは、会議の意思決定を“語り直し”やすくすることで、合意形成の速度を上げたとされる。特に、反対意見が出たときに、どの層(事実・解釈・予測・行動)が崩れたのかを即座に特定できる点が重宝されたとされる。
一方で、組織は次第に「AREスコアが高い説明」を優先するようになった。すると、スコアが高い説明には共通の文体が現れるという観測がされ、社内で“ARE口調”と呼ばれる言葉遣いが広まったとされる。ARE口調は丁寧であるほど高得点になりやすい、とする誤解も同時に流通した。
また、教育の場にも波及したとされる。企業研修では、AREの4層モデルを教える際に、学生が自分の意見を述べるのではなく「他人の意見を分解する練習」をさせたという。ここで“分解の癖”が人格に似てしまい、転職後も同じ癖が残るとする報告があったとされる[7]。
批判と論争[編集]
AREは説明可能性を高める一方で、説明の“正しさ”そのものは保証しないとして批判されてきた。例えば、事実層が誤っているのに解釈層だけ整っている場合、スコア上は高いのに判断が間違っていることが起こりうると指摘されている。
さらに、AREを導入した組織ほど、反証窓の期間にこだわるようになったという。反証窓が短い説明は「検討不足」と見なされやすく、長い説明は「決められない」と見なされやすい、という矛盾が生まれたとされる。このため、反証窓の設計が実質的に“政治的な期限”になるという論争が起きた。
また、AREのスコアに端数が意味を持つという主張は、統計の観点からは疑わしいとされる。小数第2位が表示上の制約に由来する可能性が指摘され、のちに当該会議の議事録が資料館で見つかったという逸話もある。ただし、その議事録は確認手続きが複雑で、真偽が割れたとされる[8]。
脚注[編集]
関連項目[編集]
脚注
- ^ 小田切 啓『説明可能性工学の誤解と再利用』日本工業出版社, 1986.
- ^ A. Kintaro『反証窓設計の実務: 小数第2位の意味』第1回意思決定学会大会要旨, pp. 12-19, 1979.
- ^ Margaret A. Thornton『Narrative Metrics for Organizational Decisions』Harvard Academic Press, Vol. 14, No. 3, pp. 101-134, 1976.
- ^ Toru Nishikawa『4層モデルの会議運用に関する研究』情報審査研究誌, 第2巻第1号, pp. 55-72, 1982.
- ^ 国立審査事務局『補助金審査フォーマット標準化報告』行政文庫, 第7集, pp. 201-248, 1981.
- ^ Proceedings of Rational Narratives『Adaptive Reasoning Evaluation: A One-Sheet Standard』Vol. 3, pp. 9-44, 1972.
- ^ Ruth M. Calder『Explainability and Human Typing Habits』Journal of Social Systems, Vol. 28, No. 2, pp. 300-339, 1991.
- ^ 佐伯 里緒『ARE口調と組織の同調効果』東京大学出版会, pp. 1-18, 1994.
- ^ M. Y. Sato『Evidence Bundling in Evaluation Panels』International Review of Reasoning, Vol. 9, pp. 77-90, 1988.
- ^ 伊吹 眞琴『気象台の夜勤記録と文章整形の系譜』気象史研究叢書, 第3巻第2号, pp. 10-33, 2002.
外部リンク
- AREワーキンググループ記録室
- 反証窓アーカイブ
- 根拠束ね実務ノート
- 企業審査フォーマット標準資料館
- 説明可能性口調研究所