Category:自分自身を含まない全てのカテゴリの一覧
| 区分 | メタカテゴリ(自己参照制御) |
|---|---|
| 成立年(推定) | 1997年 |
| 目的 | 自分自身への参照ループを避けること |
| 対象範囲 | 自身を含まない全カテゴリ(とされる) |
| 運用主体 | (架空) |
| 主な論点 | 形式論理と編集実務の齟齬 |
| 関連技術 | 再帰判定・依存グラフ検査 |
| 典型的用途 | データ品質監査・疎通テスト |
Category:自分自身を含まない全てのカテゴリの一覧は、自身を含まない条件を満たすカテゴリ群を並べるとされるのカテゴリページである。1990年代の内部仕様議論に端を発し、における“自己参照”の扱いを象徴するものとして参照されてきた[1]。
概要[編集]
は、オンライン百科事典においてカテゴリの自己参照をめぐる問題を整理するために設計された、一覧型のカテゴリページである。見た目は“静的なリスト”に近いが、実装上はカテゴリ間の包含関係を再帰的に検査する仕組みを含むと説明されている[2]。
このページが成立した背景には、当時の編集現場で発生した“空が見えない”型の不具合、すなわちカテゴリツリーが一部で循環し、や生成が崩れる現象があるとされる。なお、当初は単なるバグ報告の要約から始まったものの、論理学者と運用者が同席した会議で「自分を含まない側だけを数える」発想に昇格した、と記録されている[3]。
概要[編集]
一覧に掲載されるカテゴリは、「当該カテゴリの内部に、当該カテゴリ名(またはその同等語)が参照として含まれていない」ことを条件とするとされる。ここでいう“含まれている”は単純な文字一致ではなく、編集履歴の差分から推定される“参照関係”に基づくと説明される[4]。
選定基準は大きく2段階に分けられるとされ、(1)カテゴリの包含関係をとして抽出する工程と、(2)再帰判定により「自己包含」に該当するものを排除する工程から構成される。さらに、判定が計算量として爆発しないように、のデータセンター(当時の呼称)で実地検証されたとする社内報告が引用されているが、同報告の出典はページ末尾ではやや曖昧に扱われている[5]。
一覧[編集]
以下は、当該条件(自分自身を含まない)を満たすとされるカテゴリの一例である。実際の総数は更新頻度により変動し、内部監査では「平均して年当たり約3,420カテゴリ単位で再判定が行われる」と記載されている[6]。
※カテゴリ名は“それらしい体裁”で並べられており、同名の実在カテゴリが存在する場合も、ここでは当該一覧のための抽象化として扱われる。
一覧(分野別)[編集]
論理・形式仕様に関するカテゴリ[編集]
(1997年)- 自己包含を検出した場合に“安全側”へ倒す運用手順をまとめたカテゴリとされる。運用担当のが「チェックは厳密に、表示は優しく」が方針だと提案した逸話が残っている[7]。
(1998年)- 依存グラフが閉路を形成した際、どの辺を切るかの原則が整理されたとされる。切断候補を“弁当箱”に見立てて優先度を付けた、という妙に具体的な説明が付録に残されている[8]。
(2001年)- 再帰判定を高速化するためのメモ化手法の導入経緯を扱う。実験ログでは「同一判定の再利用率が71.3%に達した」と記録され、編集者たちがこの数字を“縁起”として語るようになったとされる[9]。
データ品質・監査に関するカテゴリ[編集]
(2003年)- 編集コミュニティにおける構造崩れの検知を目的とする。監査担当のは、違反カテゴリを“夜間パトロール対象”として一覧で配布したと記述されている[10]。
(2005年)- 「要出典っぽさ」を点数化し、自己包含判定と併せてレビューする発想が紹介される。ある監査会議では、曖昧度を“鼻歌指数”と呼び、平均鼻歌指数が2.7から1.4へ下がったと報告された[11]。
(2008年)- 差分から参照関係を推定する統計的手法を扱うカテゴリである。推定精度は「再現率93.8%」とされるが、同時に“夜に弱いモデル”という注釈も見られるとされる[12]。
コミュニティ運用に関するカテゴリ[編集]
(2010年)- 自己参照をめぐる揉め事の収束プロセスをまとめたとされる。特定の議論はの模擬裁定会で再現された、と記録されている[13]。
(2012年)- 改名時の“参照漏れ”を予防するためのガイドラインが置かれたカテゴリである。改名台帳のサンプルでは「同月内で1,008件が波及する」と書かれていたが、後にその数が“おそらく盛っていた”と訂正された履歴がある[14]。
(2014年)- 自動化の導入に際して、自己包含ループを起こしうる操作を抑制する仕組みを説明する。ガードレールの名付け親が出身だった、というローカルな由来が追記されたとされる[15]。
周辺領域(教育・説明)に関するカテゴリ[編集]
(2016年)- 形式論理が苦手な編集者向けに“比喩から入る”教材が集められたカテゴリである。最初の授業スライドには「自分の靴ひもは自分で結ぶべきだが、ループは結ばない」と書かれていたとされる[16]。
(2018年)- 過去の監査を再利用し、同種の循環を早期に発見するための文書群が収められたカテゴリとされる。ある編集会では「再利用率が0.62なら勝ち」という謎の合言葉が導入された[17]。
(2020年)- 判定ロジックを短文で説明するためのテンプレート群が含まれるとされる。ただしテンプレート文面には「わかりやすさのため厳密さを少し落とす」と書かれているため、厳密派からは批判も出たとされる[18]。
批判と論争[編集]
本一覧の最大の論争は、「“自己を含まない”という定義が、実務上は曖昧さを含み得る」点にあるとされる。たとえば、カテゴリ名の同義語・通称・別表記が参照として扱われる場合、「含まれていない」と判定される境界が揺れる可能性があると指摘されている[19]。
また、掲出されるカテゴリが“確定リスト”ではなく“再判定の結果”に過ぎないため、固定観念のように扱われることへの反発もある。実際、編集者のは「このページを読んで安心するのが一番危ない」と述べ、別の監査ログを参照するよう求めたと報告されている[20]。
さらに、笑えない類の不具合として、判定アルゴリズムがある種の“長い記事名”に弱く、まれに自己包含がすり抜けるとされる。内部テストではその例が「全体の0.019%」に相当するとされ、これがなぜか“雨の日に増える”と語り継がれている[21]。
脚注[編集]
関連項目[編集]
脚注
- ^ 中島良平「自己参照とカテゴリ生成の運用設計」『計算環境論叢』第12巻第3号, pp. 41-67, 1997.
- ^ Margaret A. Thornton「Meta-Categories and Recursive Exclusion in Wiki-Style Systems」『Journal of Web Knowledge Engineering』Vol. 6 No. 2, pp. 101-129, 2000.
- ^ 小林啓介「循環参照遮断の経験的ルール:依存グラフ観点」『情報処理学会誌』第44巻第11号, pp. 2058-2079, 2003.
- ^ Rui Tanaka「Memoization for Category Membership Tests in Collaborative Encyclopedias」『International Conference on Collaborative Data Models』pp. 88-96, 2008.
- ^ 田村真理子「曖昧出典の点数化とレビュー自動化の試み」『編集支援技術研究報告』第27号, pp. 12-34, 2011.
- ^ Hans-Rudolf Meier「Guardrails for Bot Operations in Taxonomy Management」『Proceedings of the Symposium on Knowledge Operations』Vol. 19, pp. 233-255, 2014.
- ^ 渡辺精一郎「チェックは厳密に、表示は優しく:カテゴリ監査の現場から」『運用設計月報』第3巻第1号, pp. 3-9, 1998.
- ^ 【脚注用】山本アキラ「履歴差分からの構造推定:夜間劣化の分析」『データセンター季報』第8巻第4号, pp. 55-71, 2009.
- ^ 佐藤ミカ「“安心”が危険になる瞬間:メタページの社会的読み替え」『コミュニティ運用研究』第2巻第2号, pp. 77-104, 2017.
- ^ Eiji Nakamura「Rain-Linked Anomalies in Recursive Category Tests」『Proceedings of the Strange Systems Workshop』pp. 1-12, 2020.(タイトルが類似する別書籍の可能性がある)
外部リンク
- カテゴリ管理室アーカイブ
- 依存グラフ監査ガイド
- 編集支援技術研究報告書庫
- 自己参照入門スライド置き場
- ボット運用ガードレール倉庫