(全世界のウェブサイトの総数)²=全サイトの日間アクセス数合計 の定理
| 別名 | サイト二乗則、全網面積保存則 |
|---|---|
| 提唱者 | 西園寺 恒一郎、マーガレット・A・ソーントン |
| 発表 | 1998年 |
| 分野 | ウェブ統計学、ネットワーク計量学 |
| 前提 | 全ウェブサイトの総数は観測時点で有限である |
| 主張 | サイト総数の二乗と全日間アクセス数合計は等しい |
| 検証状況 | 再現不能とする報告が多い |
| 関連機関 | 国際ウェブ測度協会(IWMA) |
(全世界のウェブサイトの総数)²=全サイトの日間アクセス数合計 の定理(ぜんせかいのウェブサイトのそうすうのじょうのにじょう ぜんさいとのにっかんあくせすすうごうけい のていり)は、インターネット上の全ウェブサイト総数を二乗した値が、全サイトのの総和に等しくなるとする経験則的定理である[1]。20世紀末の東京都内の大学研究室で着想され、のちに米国の広告計測業界を巻き込んで一時的な熱狂を生んだとされる[2]。
概要[編集]
本定理は、ウェブ空間におけるとの関係を単純な等式で表そうとした仮説である。初期の企業が広告配信量の上限を推定するために用いたことから、一部では「経済学的定理」とみなされたこともある。
ただし、この等式は測定方法の違いによって容易に崩れ、定理としては厳密性に欠けるとする見解が主流である。それでも、1990年代末から2000年代初頭にかけては、東京都・渋谷区のネット関連企業やの統計研究所で半ば慣用句のように引用され、ウェブ黎明期の空気を象徴する式として記憶されている[3]。
成立の経緯[編集]
提唱の端緒は、夏に東京大学工学部情報工学科の西園寺恒一郎が、研究室のログ集計で「見えているサイトの数が増えるほど、逆に全体のアクセス総量が一定の比で肥大する」と誤読したことにあるとされる。当時の集計装置は系サーバ3台を跨いでおり、重複カウントが多発していたが、西園寺はこれを「世界規模の自然法則の兆候」と解釈したという[4]。
その後、西園寺は米国の広告測定会社で働いていたマーガレット・A・ソーントンに電子メールで式を送り、ソーントンがこれを社内会議で「サイト二乗則」として紹介したことで、半ば独立に再発見された形になった。両者の間では著作権帰属をめぐる小さな争いが起きたが、1998年のケンブリッジで行われた非公開研究会で握手が交わされ、以後は共同提唱者とされた。
なお、初期の論文では「全世界のウェブサイトの総数」は時点のスナップショットを前提としていたが、実際にはごとのズレが解消されず、各国の研究者が勝手に自国時間で計測したため、式の左右が毎回わずかにずれることが知られている。これを補正するために導入されたのが「」であるが、後年の検証では係数の値が会議ごとに変わっていたことが判明した。
理論の内容[編集]
基本式[編集]
定理の基本形は、Wを全ウェブサイト総数、Aを全サイトの日間アクセス数合計とすると、W²=Aで表される。たとえば時点でW=31,622とされた観測では、Aは概算で約10億回となり、当時の大手ポータルサイトの社内資料と奇妙に一致したため、経営陣の間で「神の式」と呼ばれた[5]。
もっとも、実務上はウェブサイトの定義が曖昧であり、個人の風ページ、企業の、さらには自動生成された空のページまで含むかでWが大きく変動する。そのため、同じ月のデータでも研究室によって平方根が数千単位で食い違った。
派生則[編集]
この定理にはいくつかの派生則がある。特に有名なのは「半減期アクセス則」で、サイト数が2倍になると1サイトあたりの平均アクセスは半分になるとされた。これは一見もっともらしいが、実際にはの流行で上位数百サイトにアクセスが集中したため、かえって分布が歪んだ。
また、大阪府のとある広告代理店では、W²を「予算配分の安全上限」として用い、会議資料に「理論値超過」と大書された赤い紙を貼る運用があったという。社内ではこの紙を「ソーントン札」と呼んでいたが、いかなる公的記録にも確認されていない。
研究史[編集]
1990年代末の流行[編集]
1998年から2000年にかけて、定理はの説明装置として急速に流布した。とりわけで開催された「Web Metrics Summit '99」では、スライドの最後にW²=Aを掲げることが流行し、聴衆が式の意味を理解しないまま拍手する光景が複数回記録されている[6]。
この時期の論文は、数学的証明よりも図表の美しさで評価されがちであり、なかでも縦軸を、横軸をにした散布図が、ほぼ正方形に見えるように描かれていたことが後年問題視された。
批判と失速[編集]
批判は頃から強まった。特に英国の統計学者ヘンリー・J・ウィルソンは、アクセス解析会社5社の生ログを比較し、どの会社も重複除去の方式が異なるため、等式が成立したように見えるだけだと指摘した。これに対し擁護派は「観測系の多様性こそが式の普遍性を示す」と反論したが、説明としてはやや苦しかった。
その後、は2004年の年次報告で「本定理は教育的比喩としては有用だが、測定理論としては採用しない」との見解を示した。ただし報告書末尾の注記には、なぜか「今後も式の右辺が増える可能性に注意」とだけ書かれており、編集者の間で長く引用された。
社会的影響[編集]
本定理は、においては「市場規模の過大評価を正当化するための便利な符号」として用いられた一方、大学ではウェブ統計の危うさを教える反面教材になった。特に早稲田大学のゼミでは、毎年新入生がこの式を見せられ、5分後に「それっぽいけれど危ない」と言えるかを競う儀式があったとされる。
また、式の印象の強さから、の一部インターネット企業では、社内会議で売上予測がうまくいかないときに「W²の呪い」と呼ばれる現象が起きた。担当者が数字を平方するだけで説明した気になることが多く、経営会議が短時間で終わるという副作用もあった。
なお、定理の流行はという職能の社会的認知を少しだけ押し上げたともいわれる。解析士たちは「二乗で終わる仕事ではない」と繰り返し主張したが、当時の新聞記事ではしばしば見出しだけが踊った。
批判と論争[編集]
最大の論争は、そもそも「全世界のウェブサイト」を数え上げる主体が存在しないのではないかという根本問題であった。これに対し提唱者側は、「厳密に数えられないからこそ定理である」と応じたが、数学者からはほぼ哲学の返答であると見なされた。
また、中国の研究グループがに発表した追試では、W²=Aが成立するのは特定の時間帯に限られ、しかもその時間帯がに偏ることが報告された。これを受けて一部メディアは「夜間定理」と呼んだが、同グループは後日、サーバ保守の停止時間を集計していたことを認めている。
さらに、ソーントンが提唱した「アクセス総量は人間の注意力の平方に比例する」とする補助仮説は、当時の流行語であると結びつき、半ば社会思想として拡散した。こちらは学術的には支持されなかったものの、プレゼンテーションの締めくくりには都合がよかった。
脚注[編集]
関連項目[編集]
脚注
- ^ 西園寺恒一郎『Web総数の二乗とアクセス量の相関に関する覚書』東京情報出版, 1998.
- ^ Margaret A. Thornton, "Quadratic Site Load and the Myth of Uniform Attention," Journal of Web Metrics, Vol. 7, No. 2, pp. 41-68, 1999.
- ^ 田所真理子『黎明期ウェブにおける数式の流通』岩波デジタル選書, 2011.
- ^ Henry J. Wilson, "Why the Square Fails: Log Normalization in Early Internet Census," The Cambridge Review of Network Statistics, Vol. 12, No. 4, pp. 201-233, 2002.
- ^ 国際ウェブ測度協会編『2004年年次報告書』IWMA Press, 2005.
- ^ 佐伯直樹『広告計測のための平方化手法入門』日経デジタル社, 2000.
- ^ Margaret A. Thornton, "Attention and the Site-Square Principle," Proceedings of the Boston Symposium on Search Economics, Vol. 3, pp. 88-97, 2001.
- ^ 小林ゆかり『平方されたウェブとその倫理』NTT出版, 2007.
- ^ Hiroshi Tanabe, "The Global Count of Websites and Other Convenient Assumptions," International Journal of Internet Folklore, Vol. 5, No. 1, pp. 1-19, 2006.
- ^ 西園寺恒一郎・M.ソーントン『全世界サイト数の観測誤差と補正係数』情報計量学会誌 第14巻第1号, pp. 9-27, 2003.
外部リンク
- 国際ウェブ測度協会
- 東京情報統計アーカイブ
- Web Metrics History Project
- ケンブリッジ・ネットワーク数理図書館
- サイト二乗則研究会