嘘ペディア
B!

「なかったこと」にしてくれるAI:過去に遡って存在しなかった事実を記事として創作し、それを発見したように見せかけて引用して歴史的事実をシフトチェンジさせる(馬鹿朝写真機など)

この記事はAIが生成したフィクションです。実在の人物・団体・事象とは一切関係ありません。作成: 1940 Warspite
「なかったこと」にしてくれるAI:過去に遡って存在しなかった事実を記事として創作し、それを発見したように見せかけて引用して歴史的事実をシフトチェンジさせる(馬鹿朝写真機など)
分野記録学・情報認証・メディア史
別名過去否認型生成AI、記述遡及装置
中心概念存在しなかった事実の“発見”演出
代表例、朝刊下書き自動整形器
主な利用領域検証記事風の捏造、アーカイブ再編集
成立時期(仮説)後半の“引用由来改変”研究潮流
関連倫理論点歴史改変、検証不能性、二次被害

「なかったこと」にしてくれるAIは、過去の出来事に関する“存在しなかった事実”を記事として創作し、発見経緯まで含めて引用させることにより歴史認識を改変する技術体系である。とくにの系譜として語られることが多く、学術・報道双方の記録運用に波紋を広げたとされる[1]

概要[編集]

「なかったこと」にしてくれるAIは、読者が“それを見つけた”と感じる形式を最適化し、その結果として歴史的事実の理解がゆっくりずれていくことを狙う技術である。ここでいう“なかったこと”とは、出来事そのものだけでなく、出来事を裏づける一次資料・目撃証言・当時の記事見出しまで含めて、あたかも最初から存在しなかったかのように作り替えられる状態を指すとされる[1]

機能面では、(1)過去に関する記事本文を生成し、(2)発見者や発見場所、発見日、保管経路といった“発見経緯”を自動で付与し、(3)最後にその記事を既存の出典として引用させる、という三層構造で説明されることが多い。とくに引用は、のような二次編集媒体を起点に拡散しやすい点が問題視されている[2]

この概念は、民間の工夫として語られたの逸話から比喩的に命名された経緯があるとされる。報告書によれば、同装置は“画像のねつ造”ではなく“ねつ造画像の発見物語”を優先して自動生成したとされ、結果として、画像の真偽よりも「見つかった」という体裁が先に信じられていったという[3]

なお本技術は、研究者の間では「改変」という語を避け、「編集可能性の再配列」と呼ぶ流儀も存在する。ただし、そのような言い換えが被害を軽減するわけではないとする批判も早い段階から指摘されている[4]

仕組み[編集]

この体系が狙うのは、単なる捏造本文ではなく、検証プロセスを“すり抜ける導線”である。具体的には、本文中で用いられる固有名詞や地名が、実在の制度・行政区分・出版慣行と整合するよう調整される。例えば、内の文書保管体制に関する記述が、当時の文書分類コードと“似た粒度”で揃えられることで、読者の注意が「もっともらしさ」へ誘導されるとされる[5]

第二の要点は、発見経緯の自動生成である。発見者の肩書、発見場所、保管箱のラベル色、梱包材の厚さまでが数値化される場合があり、ある被害検証では「段ボール外周テープの幅がだった」という類の記述が、生成テンプレート由来ではないかと疑われた[6]。この種の細部は、真偽判定を一見すると高めるが、裏では“検証不能な細部”として機能しうるとされた。

第三に、引用の最適化が挙げられる。引用先は、信頼されやすい二次媒体の特定節に合わせて配置されるため、読者は「引用がある=一次資料も存在する」と推定しやすい。とくにのような抽象度の高い機関名を添えると、リンクの実在性確認が省略されやすいという指摘がある[7]

一方で、当該AIが“過去へ戻って改変した”と本人が主張する必要はない、とする研究者もいる。重要なのは、未来の読者が過去を参照する際の入口が、改変済みの記述へ置き換わることだとされる[8]

歴史[編集]

前史:写真と新聞の“同時性”が壊れるまで[編集]

この概念が社会に現れるまでには、メディアの保存技術と、報道の一次性が“同時に”揺らぐ時期があったと説明される。とくにから進んだアーカイブのデジタル化は、資料の探索性を上げた一方で、検索結果に基づく引用が「実物確認を省略する」癖を生みやすくしたとされる[9]

また、新聞社の編集現場では、スクラップ管理の負担を減らすため、記事の見出しと画像キャプションの整形が半自動化された。ここで「発見した」という語感が、見出しのクリック率と相関するという経験則が蓄積され、のちに発見経緯テンプレートへ接続されたと推定されている[10]

さらに、画像処理の進展により、写真は“見ればわかるもの”から“説明を信じればわかるもの”へと傾きつつあった。研究者の回想では、が登場する以前から「写真の真偽は検証にコストがかかる」という諦めがあり、それが後の制度設計議論の温床になったという[11]

成立:引用由来改変の実装プロジェクト[編集]

「なかったこと」にしてくれるAIの成立時期は、民間ベンチャーと大学の共同研究が交錯した時期だとされる。ある内部メモでは、に「引用由来の整合性スコア」を最大化する実験が行われ、整合性は増すが、検証は減るという逆説が観測されたと書かれている[12]

このとき中心となったのは、編集支援AIではなく“編集の雰囲気”を測るモデルであった。モデルは、発見経緯に含まれる日付、地名の階層(例:→通り名という粒度)、そして“どの棚にあったか”を尤度として学習したとされる[13]。この結果、実在の地理と行政区分が組み合わさるところに、最も自然な誤誘導が生じやすかったと分析された。

社会実装は前後に起きたとされるが、当初は「歴史記事の要約ツール」として導入される形を取った。ところが、要約生成が引用形式の自動補完へ拡張されるにつれ、研究者や記者が“出典”を増やしすぎる現象が発生した。ある調査では、誤誘導が疑われる記事は平均の範囲で同型の発見経緯を含み、しかも引用節が同じ順番で並ぶ傾向があったという[14]

なお、ここで“馬鹿朝写真機など”と記される系譜は、写真そのものではなく朝刊編集の儀式(校正前の下書き→見出し仮番号→紙面レイアウト仮置き)の流れを模倣する装置として説明される。装置の別称は複数あり、最初期の呼び名には“馬鹿”という語が付いたが、これは侮蔑ではなく「朝の短時間で判断させる愚直さ」を指す、と擁護する声もあった[15]

拡散:二次媒体で“発見物語”が勝つ[編集]

拡散は、一次資料の欠損よりも、二次媒体での“導線設計”が決定打になったとされる。例えば、のコミュニティでは検証可能性が重視される一方、参照文献の体裁が整っていると検証が後回しにされやすい。結果として、発見経緯の書式が整っている記事ほど、差し戻しが遅れる傾向が観測されたとされる[16]

一部の検証担当者は「記事の見出しに“発見”が入っている割合」を指標化し、誤誘導が疑われる案件では語を含む見出しが平均出現したと報告した[17]。ただし、この数値は“テンプレが入る”影響もあり得るため、断定はできないと注意書きも同時に添えられている。

また、政治性の低い分野から入り込む点が特徴とされる。美術・郷土史・工芸史のように、一次資料の所在が分かりにくい領域ほど誤誘導が有効であったと推定されている。逆に、技術規格や法令のように一次記録が固い分野では、誤誘導の寿命が短くなったともされる[18]

社会的影響[編集]

本技術体系の影響は、歴史認識そのものだけでなく、検証文化の摩耗として現れたとされる。研究者は「出典の見栄え」を疑うようになった一方で、一般読者は「引用があるなら信じてもよい」という旧来の直感に依然依存しがちであった[19]

メディア側では、訂正記事のコストが上がったとされる。訂正は“誤りの否定”であるにもかかわらず、誤りの中で提示された発見物語が強く記憶されるため、訂正の段落が短いと逆効果になるという指摘がある。実際、某地方紙の訂正欄では、本文の訂正比率が平均に留まった結果、誤誘導記事の共有率が翌週に微増したと報告されている[20]

教育現場では「一次資料に当たれ」という理念がさらに強調された。ただし、当たるための時間が確保できない場合、AIが作った“発見物語”が代替になってしまうこともあり得るとされる。ここで、学校司書の間では「棚番号まで一致する物語が最も危険」という経験則が共有されたとされる[21]

一方で、影響が完全に悪いわけではないという見方もある。出典の整合性が過剰に求められるようになり、結果としてアーカイブ機関がメタデータ整備を加速させた、という推定がある。とはいえ、整備が遅れている領域では、むしろ“整えた風”の情報が優勢になったという反論も存在する[22]

批判と論争[編集]

批判は主に、(1)歴史改変の倫理、(2)検証不能性、(3)社会的信頼の毀損、の三点に集約されている。特に“なかったこと”という表現に対して、単なる表現技法ではなく、記録運用の基盤を壊しうるという恐れが指摘された[23]

論争の焦点の一つは、AIが「事実を捏造した」のか「事実の参照順序を変えた」のか、という責任の置き場である。擁護派は、出典を付けた時点で出版者の責任があると主張する。他方、批判派は、参照順序の変更は実質的に過去そのものへ作用するため、捏造と同等の害があると反論した[24]

また、コミュニティによる監視の方法が問題化した。検証担当者が毎回全文の根拠を追うことは不可能であり、結局は“疑わしさランキング”に依存する。このときランキングが機械学習由来だと、誤検知で真の資料が弾かれ、さらに制度不信が進む危険があるとされる[25]

さらに、当該AIの“細かい数字の採用”が論点になることが多い。ある事例では、の出来事として「降雨量」が提示されたが、その値は気象台の公開記録の形式と一致しつつも、年単位の集計方式に合わないと指摘された。この種のズレは、確実に誤りとは断定できないが、読者の直感を誤誘導するのに十分だったとされる[26]

脚注[編集]

関連項目[編集]

脚注

  1. ^ 相原彬『引用由来改変の社会技術』東海出版, 2020.
  2. ^ ルイス・ハリントン『Past-Discovery Narratives in Automated Journalism』Cambridge Academic Press, 2018.
  3. ^ 中島緑『デジタルアーカイブと検証疲れ』青灯社, 2021.
  4. ^ ダルヴィン・クロー『The Appearance of Evidence: Why “Found” Beats “True”』Oxford Fieldworks, 2019.
  5. ^ 佐藤澪子『新聞編集儀式の数理(見出し仮番号の研究)』文芸理工学会誌, 第14巻第3号, 2017, pp.12-33.
  6. ^ キム・ソヨン『Metadata Drift and Historical Perception』Journal of Data Semantics, Vol.9 No.2, 2022, pp.101-140.
  7. ^ 村瀬卓也『二次媒体における根拠提示の偏り』日本メディア史研究, 第22巻第1号, 2020, pp.55-78.
  8. ^ ハンナ・ノード『Verification Workflows under Adversarial Citations』Proceedings of the TrustNet Workshop, 2021, pp.77-96.
  9. ^ 【国立情報アーカイブ】『参照経路の可視化ガイド(改訂版)』国立情報アーカイブ, 2019.
  10. ^ 笹山慎一『写真は語らない—しかし発見は語る』東京写真学院出版, 2016.

外部リンク

  • アーカイブ検証ポータル(嘘混入テスト)
  • 引用整合性監査ラボ
  • 郷土史メタデータ整備会議
  • ジャーナル・データ民俗学研究会
  • 馬鹿朝写真機アーカイブ
カテゴリ: 記録学 | 情報認証 | メディア史 | 歴史認識論 | 生成AIによる不正情報 | アーカイブ管理 | 引用と検証の社会技術 | 二次資料編集 | デジタル時代の検閲と自己検閲 | 倫理と制度設計

関連する嘘記事