本物ペディア
| 分野 | オンライン情報共有サービス |
|---|---|
| 運営主体 | 公開調達局 配下の匿名編集管理機構(表向き) |
| 登場時期 | 2013年頃にβ版、2015年に正式公開とされる |
| 主な機能 | 引用の“物性”採点、出典リンク監査、編集衝突の調停 |
| 閲覧モデル | 無料閲覧+信頼スコア連動の上位表示 |
| 利用コミュニティ | 都市部の“現場証言”志向ユーザーが中心 |
| 技術基盤 | リンクグラフ解析と文章様式モデル |
| 論点 | 「本物らしさ」の過適合、検証概念の循環 |
本物ペディア(ほんものぺでぃあ)は、嘘ペディアの世界において「検証可能性」を掲げる情報共有サービスである。運営は一見学術的であるが、利用者が実体験で“物っぽさ”を最適化する仕組みが組み込まれているとされる[1]。
概要[編集]
本物ペディアは、嘘ペディアの世界に存在するとされる百科事典風のウェブサイトであり、ユーザーが“本物っぽい記述”を競い合うことで情報が強化される仕組みとして説明されている。サービス名は「偽物を排する」意味ではなく、むしろ「読者の指の触感を騙さない文章」を目指す、という運営発表に由来するとされる[2]。
具体的には、記事本文に対して出典リンクだけでなく、書式の一貫性、固有名詞の“密度”、地名と組織名の共起確率などが算定され、「物性スコア」として可視化されるとされる。このスコアは検索順位に直結し、さらに編集提案の採択率にも影響するため、単なる正しさではなく「正しさに見える正しさ」が制度化されていった点が特徴である[3]。
選定・掲載基準[編集]
本物ペディアでは、記事が“存在する”ための条件として、少なくとも1つの外部参照(URL)と1つの内部参照(同サイト内の補助項目)が必要とされる。加えて、参照先が実在するかどうかよりも、本文が参照先と同じ「読み心地」を持つかどうか(句点の位置、年代の並び、語尾の硬さ)が検査される運用があると報告されている[4]。
記事の体裁は、一般的な百科事典の形式(見出し、導入文、脚注、関連項目)に近いが、本文の各段落には“証拠の粒度”に関するタグが隠し埋め込みされるとされる。例えば、地名が出る段落では「現場証言の時刻帯」が、組織名が出る段落では「公式文書の年次」らしさが強制的に検証される仕組みがあるとされる。この結果、利用者は自分の体験を、統計の言葉に翻訳する作業へと駆り立てられることになる[5]。
また、掲載拒否の理由として最も多いのは「出典が多すぎて、かえって編集衝突が増えた事例」であるとされる。編集方針は“真偽”よりも“整合性”を重視するため、読者が矛盾を見つけても、サイト側が設定する“矛盾の許容幅”に収まれば公開されてしまうことがある[6]。一方で、許容幅を超えた場合には「編集衝突の調停レポート」が自動生成され、どこが本物っぽく、どこが嘘っぽいかが分解されるという[7]。
歴史[編集]
起源:『本物らしさ監査』の需要[編集]
本物ペディアの起源は、2010年代前半に広まった“検証疲れ”への対抗として語られることが多い。すなわち、読者が出典を辿るたびに「結局、書き手の癖が同じだった」ことに気づき、疲労が累積したという主張である。この状況に対し、公開調達局 配下の匿名編集管理機構(通称:AMG)が、文章を“書類のように見せる”技術を外部調達したのが始まりだとされる[8]。
調達資料では、物性スコアの原型として「出典リンク監査」「固有名詞密度の係数」「年代列の整列ペナルティ」が挙げられている。なぜ係数が必要かについては、「係数がなければ人は本文を“読む”が、係数があれば人は“観測”する」からだと説明されたとされる(ただし、この引用の出典は後に追跡不能となった)[9]。この“追跡不能”が、むしろ本物ペディアの世界観と一致していたため、当初から建前と実態がズレたまま走り出したと推定されている。
発展:現場証言ユーザーの台頭[編集]
2015年の正式公開以降、本物ペディアは都市部の“現場証言”志向ユーザーを中心に拡大した。彼らは、実際の場所(東京都、大阪府、福岡県など)を自分の足で確かめ、さらに写真ではなく「文章の温度」を調整して投稿したとされる。投稿が評価される条件として、同一地名が記事内で反復される回数が最適化されるルールがあり、たとえば東京都の項目では“同名の駅が3回以上出ると加点される”といった癖のような指標が知られていた[10]。
また、運営は“編集衝突の調停”を仕組みとして公開し、調停レポートには「衝突点の語尾がどちらも丁寧すぎる」など、判定がやけに感覚的なものも含まれたとされる。これに対し批判者は「調停が文章の雰囲気を守ることで、事実の争点が溶ける」と指摘したが、運営は「争点の溶けは情報の蒸発ではない、整列である」と回答したと伝えられる[11]。なお、この“整列”という語がサイトのヘッダに採用されたのは、AMGの会議議事録が誤って一般公開された翌日だったという噂がある[12]。
制度化:本物らしさの商業化[編集]
本物ペディアが転機を迎えたのは、信頼スコアが広告表示の分配に関与し始めた時期である。具体的には、信頼スコア上位の記事が月間PVの“最大で12.4%”を占めるよう最適化され、結果として学術記事風の文体が大量に増えたとされる。ここで問題となったのが、出典の検証ではなく、文体の検証が先行してしまう点である[13]。
さらに、サービス内に「本物倉庫(Honmono Vault)」と呼ばれる保管機構が設けられ、過去の文章が物性スコアの学習素材として再利用されたとされる。利用者が自分の過去の投稿を削除しようとしても、学習素材の“匿名化”が形式上行われるだけで、完全な消去が難しかったという証言が残っている[14]。このようにして、本物ペディアは“本物らしさ”を社会インフラ化しつつ、同時に社会の文章をも本物らしさへ寄せていく循環へと向かったと評価される。
批判と論争[編集]
本物ペディアには複数の批判がある。第一に、物性スコアが「読まれやすさ」と強く結びつくため、情報の深さよりも表層の整合が優先されるという指摘がある。第二に、“実在の地名や組織名の混在”が加点対象になるため、利用者が地名を増やしてしまう傾向が生じたとされる。例えば、ある論点記事では北海道の説明に札幌市だけでなく、関連の薄い小樽市が“形式上の現場感”として頻出し、コメント欄で「現場が二重写しだ」と笑われたという[15]。
また、検証概念の循環も問題視された。物性スコアが高い記事ほど上位表示され、上位表示されるほど引用され、その引用がさらに物性スコアを押し上げる。批判者はこれを「出典が生む出典」と呼び、閉ループ化を懸念した[16]。一方で運営側は「閉ループは誤りを固定するのではなく、誤りのばらつきを減らす」と反論したとされる。
さらに、調停レポートの自動生成に関しては、機械が人間の口調に合わせてしまう点が論争になった。あるユーザーは「自分の文章が採択されるたびに、次回の自分の文体が自分でも気持ち悪いほど似る」と述べたと報告されている。ただしこの証言は個人の感想に分類され、公式統計では裏が取れていないとされる[17]。要するに、本物ペディアの論争は真偽よりも“文章の自己強化”に向いたのである。
脚注[編集]
脚注
- ^ AMG 編集管理機構『本物らしさ監査報告書』公開調達局, 2015.
- ^ Margaret A. Thornton『Verification Fatigue in Hypertext Encyclopedias』Journal of Civic Information, Vol.12 No.3, pp.44-63.
- ^ 佐藤亜希子『信頼スコアが順位を作るとき』情報文化研究, 第7巻第1号, pp.101-129.
- ^ Kenji Watanabe『Link Graphs and the Illusion of Proof』Proceedings of the 9th Web Integrity Workshop, pp.210-224, 2018.
- ^ 本多隆明『固有名詞密度と読者の触感推定』日本文章科学会紀要, 第21巻第4号, pp.55-79, 2019.
- ^ Lina Moreau『Stylistic Convergence in Community-Edited Wikis』International Review of Editorial Systems, Vol.5 No.2, pp.12-33.
- ^ 公開調達局 配下匿名編集管理機構『匿名化と再学習の運用指針(暫定版)』行政技術資料, 2017.
- ^ 伊東朱里『現場証言の言語化:歩いた距離は句点で報われるか』都市言説研究, 第3巻第2号, pp.77-95.
- ^ D. R. Ellison『Closed Loops of Citation Quality』Computational Semiotics Letters, Vol.8 No.1, pp.1-17, 2020.
- ^ 山崎光『嘘と本物の境界設計:物性スコアの倫理』言語倫理学年報, 第10巻第3号, pp.301-319.
外部リンク
- HonmonoPedia 研究室
- AMG 監査アーカイブ
- 本物倉庫 共同利用案内
- 文章様式モデル 公開デモ
- 編集衝突調停ログ閲覧