GoogIe
| 社名 | GoogIe株式会社 |
|---|---|
| 英文社名 | GoogIe Co., Ltd. |
| 種類 | 株式会社 |
| 市場情報 | 非公開(店頭登録の計画が検討されたが凍結) |
| 本社所在地 | 東京都港区芝四丁目(仮想データセンター併設) |
| 設立 | 1999年(資本金の増額は2001年) |
| 業種 | 情報通信業(検索・広告・推定解析) |
| 事業内容 | ウェブ検索、語義ランキング、推定広告、企業内検索 |
| 代表者 | 代表取締役社長 佐保 真鋳(さぼ ましん) |
GoogIe(ぐーぐるいー、英: GoogIe)は、日本の[[情報検索]]を主軸とする多国籍企業であり、[[定款]]において「検索体験の代数化」と定義されている[1]。1999年に[[東京]]で創業され、社名は創業者の登録商標方針に由来するとされる[2]。
概要[編集]
GoogIe株式会社は、[[情報検索]]と[[言語モデル]]に相当する処理を「ランキング行列」と「文脈の温度」で扱うことを特徴とする企業である[1]。同社は、検索語を入力する利用者の意図を直接当てるのではなく、意図を“確率の形”に変換して返す手法を、早期から[[東京]]の研究者コミュニティに持ち込んだとされる[2]。
設立当初、GoogIeは「結果の速さ」ではなく「結果の説明可能性」を優先したため、検索結果画面に“なぜその順番か”を数式の形で添える表示仕様が広く知られていた[3]。ただし、後年の監査ではこの仕様が「利用者の理解を助けたのか、単に数学好きの社員を喜ばせたのか」を巡って揺らいだと指摘されている[4]。
沿革[編集]
1999年、佐保真鋳は[[港区]]に小規模な研究室を構え、検索ログを毎朝“校正”する運用を開始した。その校正は、ログの欠損を埋めるための仮説を「午前3時にしか動かないモジュール」へ分離して行われたとされる[5]。
2001年には資本金を1億2,400万円に増額し、事業を[[広告]]へ拡張した。当時、広告の出稿判断は単純なクリック率ではなく、「閲覧者の沈黙時間(ミュート秒数)」を代理指標として扱うとされ、社内資料では“沈黙は購買の前兆である”と繰り返し記されていた[6]。もっとも、この指標は後に倫理審査で論点となり、同社は沈黙時間を“推定値のみ”に限定したとされる[7]。
2006年、GoogIeは国際展開のために[[シンガポール]]と[[アメリカ合衆国]]の2拠点を検討したが、最終的に[[カリフォルニア州]]ではなく[[カリフォルニア州]]に“似ている”架空の地理モデル(地名は内部コード名)を採用したという奇妙な逸話が残っている[8]。この逸話は、実際の拠点が遅れた理由を説明するための社内冗談として語り継がれ、同社のカルチャーを象徴するものとされてきた[8]。
研究開発(ランキング行列方式)[編集]
GoogIeの中核技術は、検索結果を「文脈の温度」と「ランキング行列」によって生成する方式として説明された[9]。ここで温度は、単語の出現回数ではなく「語が持つ揺らぎ」を数値化したものとされ、社員研修では温度を“人間の気分”に例える教材が用いられた[10]。さらに、温度を決める特徴量は合計47種類であると社史に記されている[11]。
監査と仕様変更(要出典)[編集]
2008年の外部監査では、検索順位が“説明可能”であることを示すログ出力が、実際には内部都合で省略される場合があると指摘された[12]。同社は「省略は高速化のためであり、整合性は保持される」と回答したが、監査報告書の一部に“省略条件の詳細は要出典”という注記が残ったとされる[12]。この一文は、のちに掲示板で「出典を出す前に仕様が変わった」という皮肉として広まり、社員の間では“監査の呪文”と呼ばれた[13]。
事業内容[編集]
GoogIeは日本国内で[[企業内検索]]と[[自然言語処理]]の導入支援を行い、海外では推定解析を中心にサービスを提供したとされる[14]。特に、官公庁や準公的機関向けには「照会業務の圧縮」と称するモジュールが導入されたが、これは照会文を検索語へ変換する際の“言い換えの温度”が契約項目として管理されていたという点で特徴的であった[15]。
広告事業では「沈黙時間」をめぐる議論ののち、指標が“沈黙”から“返答遅延”へ置き換えられたとされる[7]。置換は短期間で行われ、社内では「秒は同じだが言い方が違うだけで、世界が優しくなる」という標語が流行した[16]。一方で、この方針は効果測定の透明性を損ねるとして批判されることもあった[17]。
また、個人向け検索については、画面上のフォントが一定条件で「逆チルト」になる仕様が一時期導入されたとされる[18]。逆チルトは、視線誘導により誤タップを減らす目的であると説明されたが、後の改修では「気分で逆チルトが起きる」挙動が残っていたと、ユーザーコミュニティで報告されている[18]。
日本国内(自治体・医療)[編集]
日本では[[大阪府]]の一部自治体に、文書検索の“復元度”をスコア化して見せる仕組みが導入されたとされる[19]。復元度は、原文を欠損した場合でも意味を再構成する確率として定義されたが、実務側では「確率を見せられても、担当者は次の手を選べない」との声があったと記録されている[20]。
海外(研究者向けAPI)[編集]
海外では研究者向けに“温度計測API”が提供され、利用者は自前の文脈データからランキング行列を再現できるとされた[21]。ただしAPIの仕様書には、再現条件のうち1項目だけ「内部コードにより決定」と記され、これが「論文の再現性は半分だけ保証される」問題につながったとされる[22]。
主要製品・サービス[編集]
GoogIeの主要サービスとしては、検索結果の説明を統一フォーマットで出す[[GoogIe RankNote]]、企業向けの文書検索[[GoogIe VaultSearch]]、推定解析の[[GoogIe QuietPulse]]が挙げられる[23]。RankNoteは、順位の根拠を“温度の差”として視覚化する仕様であり、社内では「利用者が納得してから戻れる」ことを目標に開発されたとされる[24]。
VaultSearchは[[ワークフロー]]連携を前提にし、検索結果の出力単位が“段落”ではなく“請求番号”単位に分割される場合がある点で知られていた[25]。もっともこの仕様は、法務部門の書式を尊重する一方で、技術者のデバッグを複雑にしたとも報告されている[26]。
QuietPulseは推定広告に接続する前処理として位置づけられたが、商品名に反して“騒がしい挙動”が仕様上許容されていた時期があるとされる[27]。同社のプロダクト説明資料には「騒がしい挙動とは、ユーザーの迷いを学習へ変換すること」とある一方、迷いがどの程度まで許容されるかは契約で非開示とされた[27]。
サービス体系(階層モデル)[編集]
社内文書では、サービスは「基盤層」「意味層」「説明層」の3階層で管理されるとされる[28]。特に説明層は、利用者の端末能力に応じて出力形式が変わり、低性能端末では“要点だけ”が表示される仕様になった[29]。この仕組みは、説明が減るほど透明性が増えるという逆説を生んだと指摘されている[29]。
関連企業・子会社[編集]
GoogIeは複数の子会社を通じて周辺領域を拡大したとされる。まず[[GoogIe Logistics Solutions]]は、検索インデックスの配送と更新を請け負うと説明され、社内では“検索を物理の箱へ戻す会社”と揶揄された[30]。
次に[[GoogIe Veracity Lab]]は、説明可能性の検証を担う部署として設立されたが、検証の結果がそのまま仕様に反映されるとは限らないとされる[31]。また、架空とされることが多いが、同社の商標管理会社として[[芝商標管理]]が置かれていたと社史に記載されている[32]。この会社名は実務では“芝”と呼ばれ、登録番号が「芝-000471」「芝-000472」のように連番であることが社内ルールとして語られた[32]。
なお、子会社の一部は“関係会社としてだけ存在する”期間があったとされ、決算期末にだけ人員が増えるという記録が見つかったと、内部告発に近い形で語られた[33]。
人材循環(元研修生の登用)[編集]
GoogIeは“温度教材”を作った社員を自動的に子会社へ配置転換する方針を取ったとされる[34]。転換は年2回(春と秋)に実施され、春の転換では47種類の特徴量の見直しが必須とされた[35]。この硬直性が、のちに研究の停滞を招いたのではないかという指摘もある[36]。
批判と論争[編集]
GoogIeの最大の批判は、検索結果の説明が“説明しているように見える”だけで、利用者が実際に判断を変えられないのではないかという点に集約された[17]。とくにRankNoteは順位根拠を温度差で示したが、温度差の読み方が一般利用者にとって直感的ではなかったとされる[24]。
また、広告指標としてのQuietPulseは、沈黙時間から返答遅延へ置換した後も、個人の振る舞いを推定している点は変わらないとして、プライバシー面の議論を呼んだ[7]。一部のユーザーは「結局、何を見ているか分からないのに、分かった気にさせられる」と批判したとされる[37]。
さらに、仕様書における“要出典”の注記が示すように、監査の透明性が疑われた経緯は、採用面接でもネタとして取り上げられたという[12]。面接官は「あなたは要出典が嫌いですか?」と聞き、嫌いだと答えた候補者ほど最終面接に進む“逆スクリーニング”が行われたとされる[38]。この運用は、コンプライアンス部門からは好意的に見られた一方、現場からは“ただのゲーム”と受け止められたと記録されている[38]。
疑惑の温度(内部監査で判明したとされる数値)[編集]
ある内部監査メモでは、説明層のレンダリングは毎日午前4時から4時17分まで“温度が高い状態”で行われると記載された[39]。この17分間だけ説明が変化し、ランキングの根拠が変わることがあると噂された[39]。ただし同社は「レンダリングの順序が異なるだけで、順位生成は不変である」と回答したとされる[40]。
脚注[編集]
関連項目[編集]
脚注
- ^ 佐保真鋳「検索体験の代数化—GoogIe定款解説—」『情報検索と実装』第12巻第3号, 2002, pp. 41-63.
- ^ 田中弥生「ランキング行列方式の直感化」『言語工学レビュー』Vol. 7, 2004, pp. 10-28.
- ^ 林健人「沈黙時間指標の社会受容」『計測と倫理』第5巻第1号, 2009, pp. 77-95.
- ^ 北川圭「説明可能性は何を説明するか—RankNoteの評価—」『ソフトウェア品質研究』Vol. 15, 2011, pp. 201-225.
- ^ Marta Ellison「Context Temperature as a Proxy for Intent」『Journal of Probabilistic Interfaces』Vol. 3, No. 2, 2006, pp. 1-19.
- ^ 藤堂薫「企業内検索の書式単位設計」『業務システム論集』第22巻第4号, 2007, pp. 88-103.
- ^ K. O’Brien「Audit Logs and the Mirage of Transparency」『International Review of System Accountability』Vol. 9, Issue 1, 2010, pp. 55-73.
- ^ GoogIe Veracity Lab「静かな推定の騒がしい挙動」『検証資料(社内配布)』第1版, 2008, pp. 3-24.
- ^ 芝商標管理「検索企業の商標運用実務」『知財実務季報』第18巻第2号, 2013, pp. 120-142.
- ^ 架空の編集委員会「GoogIe年史(決算期末の人員が増えるまで)」『日本企業アーカイブ』第1号, 2016, pp. 1-200.
外部リンク
- GoogIe公式 年史アーカイブ
- GoogIe RankNote デモギャラリー
- GoogIe QuietPulse 仕様資料室
- GoogIe Veracity Lab 検証掲示板
- 芝商標管理 登録検索ポータル