Google社の組織取り組み
| 対象組織 | Google本社および各地域オフィス |
|---|---|
| 主な目的 | 意思決定の透明化と研究資源の最適配分 |
| 成立時期 | 2000年代後半の段階的導入とされる |
| 運用単位 | プロジェクト・トライアングル(PT)と呼ばれる |
| 評価軸 | 学習速度、事故率、再利用率 |
| 監査系統 | 内部の「信頼性監査局」および外部パネル |
| 関連領域 | 人材開発、セキュリティ、プロダクト運用 |
| 所在地(参照例) | の研究拠点群 |
Google社の組織取り組み(ぐーぐるしゃのそしきとりくみ)は、アメリカ合衆国のGoogleが社内運用を目的として導入した一連の制度・実務体系である。組織改革、研究開発の配分、人材育成の手続を統合した枠組みとして説明されることが多い[1]。
概要[編集]
Google社の組織取り組みは、社内の意思決定を「誰が」「いつ」「何を根拠に」行うかを、なるべく“監査可能な言葉”に翻訳する試みとして整理されている。とくに、研究テーマの採択から、実装、運用、撤退に至るまでの流れが、共通の帳票と会議体によって結ばれている点が特徴とされる。
一方で、取り組みは単なる管理職向けの制度に留まらず、エンジニアリングの日常にも入り込むよう設計されたとされる。具体的には、毎朝の短い同期(デイリー・スタンプ)と、四半期ごとの“再利用会計”がセットになっており、成果がコードだけではなく「部品の転用可能性」でも評価される仕組みになっていたと説明されることが多い[2]。
なお、この枠組みは「組織の学習」という主題を掲げて発展してきたとされるが、当初から運用の手間や数値の解釈に揺れがあったとも指摘されている。とくに“事故率”の定義が文書間で揺れたため、監査局が定義の差分を「改訂差分指数(RDI)」として数値化した、という逸話が残っている[3]。
成立の背景[編集]
「会議を測る」発想の起点[編集]
この取り組みが整備される直接の契機は、研究テーマの増加によって開発会議が“情報渋滞”を起こし、議論が同じ論点を周回するようになったことであるとされる。そこでGoogleの初期メンバーが、会議時間そのものを生産性として扱うのではなく、「会議が新しい判断を生んだか」を測る尺度として、会議記録の語彙から学習率を推定する仕組みを考案したとされる。
その結果、ある部署では“会議が決めたことが一度でも再利用された回数”がKPIに組み込まれた。ここでいう再利用は、コードの転用だけではなく、議論の型の再採用を含むとされたため、議事録のフォーマットまで統一されたといわれる[4]。
ただし、この統一がかえって議論の硬直を招き、逆に「再利用されない新規性」だけが評価から落ちるのではないかという懸念も早い段階で生じたとされる。のちに監査局は“新規性の救済枠”を導入し、再利用率が低い案件ほど監査レーン(特別審査)に回すという運用を取った、と説明される[5]。
PT(プロジェクト・トライアングル)の誕生[編集]
制度の中心に据えられたとされるのが、PT(プロジェクト・トライアングル)である。これは「技術(T)」「運用(O)」「社会的責任(R)」の三点を同じ会議体で同時に扱う運用モデルとして整理された。形式的には三者が毎週レビューを行い、技術リスクと運用リスクと、第三者への説明責任を同じ判定表に落とし込むとされる。
このPTの初期試験は内の複数キャンパスで行われたが、最初の1か月は“R”が空欄のまま進行した部署が続出したという。空欄を埋めるため、社内の人事が「R担当の仮名リスト」を配布し、最も多かった仮名が「Responsible Relay(責任リレー)」だったといわれる。のちにそれが公式名になる手前で撤回されたが、社内資料にだけ残っていたため「幻の制度名」として語られることがある[6]。
またPT運用では、毎週の判定会で必ず“5行要約”を添付させるルールがあったとされる。要約は短すぎて事故が増え、長すぎると議論が遅れるため、ちょうど中間の長さとして5行が採択された、といったやけに細かい理由が引用される[7]。
運用のしくみ[編集]
Google社の組織取り組みでは、制度の運用に「帳票」「会議体」「数値の辞書」がセットで導入されたとされる。帳票は“申請書”の形をしていながら、実際には次の会議の議題を自動生成するための入力欄が多いと説明される。会議体は、上層が意思決定する場ではなく、根拠の整合性を確認する“編集会”として運用されたとされる。
数値の辞書については、特に“事故率”と“学習速度”が物議を醸したとされる。事故率は本来セキュリティ事故を指すはずが、途中から「誤解を生む説明の回数」も含むようになり、部署間で定義のズレが拡大したという[8]。そこで、監査局は定義の差分を「RDI(改訂差分指数)」として、文書の語彙差から毎月算出したとされる。
このRDIが高い部署には、“定義の翻訳研修”が割り当てられた。研修は集合形式ではなく、の模擬裁判形式(言い訳の許容範囲まで台本化)で行われた、と語られることがある。研修後に事故率が落ちたという報告がある一方、同時に「新規の言い換え」が増え、結局は監査の手間が増えたとも指摘されている[9]。
さらに、四半期ごとに“再利用会計”が実施された。再利用会計では、コードの再利用だけでなく、設計レビューのテンプレート、障害対応のチェックリスト、さらには“失敗の説明文”までが会計対象とされたとされる。ここで面白いのが、会計の締め日が毎回「第2金曜日の午前10時10分(太平洋時間)」に設定されたという逸話である[10]。制度の合理性より、締め作業の儀式性が勝った例だと、社内でも半ば冗談として語られたとされる。
歴史[編集]
2008年の「透明性レイヤ」導入[編集]
最初期の制度が、2008年に“透明性レイヤ”として再編されたとされる。透明性レイヤは、判断理由を三層に分けて保存する方式であり、表層(意思決定の短文)、中層(参照文書)、深層(判断過程のログ)から構成されると説明される。これにより、外部監査が入った場合でも中層と深層が追跡できるように設計されたとされる。
しかし、追跡可能性が高まるほど、ログの量が肥大化し、検索コストが増大したという。そこで、Googleはログを「検索三段階」で扱うよう改修した。検索一段階目はキーワード、二段階目は語彙の類似度、三段階目は“説明の自然さスコア”で絞り込む、という。ここで自然さスコアが急に重要視されたため、英語圏の編集者と国内向けの開発者で文章の癖が衝突したとされる[11]。
この時期、社内で「透明性は増やせるが、透明性の読解は自動化できない」という諺が広まったといわれる。のちに“読解支援ツール”が導入されたが、ツールの名称が長すぎたため、別名として「魚(うお)ログ」と呼ばれたという記録が残っている[12]。
2014年の再編と「RDI監査」の常態化[編集]
2014年には、組織取り組みの再編が行われ、RDI監査が常態化したとされる。特に、社会的責任(R)がPTで空欄になりがちな問題を受け、監査局がRの最低記述量を定めた。最低記述量は「1案件につき、第三者説明の仮想読者が理解できるまでの“つまづき数”を3つまで」とする、という一見厳密だが妙に主観的な指標だったと説明される[13]。
この指標が定着すると、担当者はつまづきの数を減らすために“説明の前置き”を増やした。結果として文章は丁寧になったが、前置きが長くて現場が読む時間が減り、運用の遅延が増えた、とする報告もある。一方で、遅延は「遅延の自己申告」によって可視化されたため、遅延は減らないまでも透明化された、という妙な結論が同時に書かれた[14]。
また2014年の再編では、監査会議がから東京に“遠隔中継される形”で運用された、と一部資料で語られている。ただし当時の回線状況と会議体の作法が一致せず、同資料に「会議は同期できなかったため、議事録のみで監査した」との注記がある。これらは細部の整合性が崩れやすい編集過程を示す事例として、のちの研究で言及されることがある[15]。
社会的影響[編集]
Google社の組織取り組みは、内部統制を強化する一方で、開発者の“説明する力”を訓練する仕組みとして波及したとされる。社内の新人は、コードを提出する前に“誤解の可能性”を所定の欄に転記することを求められ、説明の粒度が職能に直結するようになったと説明される。
その影響は外部にも及び、他社が「意思決定の透明化」を掲げた際に、帳票の三層構造やRDIのような数値辞書の発想が参考にされたという。とくに再利用会計は、部品の転用だけでなく、レビューの再利用まで会計対象とする点が特徴であり、結果として“レビューのテンプレ文化”が広がったとされる[16]。
ただし、評価の数値化が進むほど、数値を満たすことが目的化する危険も指摘された。たとえば事故率が下がったのは“事故が消えた”のではなく“事故と呼べない事象が増えた”のではないか、という批判が、社内外の匿名メモで見られたとされる[17]。
それでも制度は、危機対応の迅速化に寄与した面があったと説明される。ある年度の報告では、重大障害から一次説明までの時間が平均で47.6分短縮したとされる。ただしこの47.6分は「説明の初回投稿時刻」と「説明文の誤字修正時刻」の差として集計されたため、時間短縮の意味が技術者と広報担当でずれた、と後に議論になった[18]。
批判と論争[編集]
批判としては、第一に数値の恣意性が挙げられる。特に学習速度は、実験の再現可能性よりも“文書の更新頻度”に強く依存する傾向があり、形式的に更新されるほど点数が上がるのではないかという疑念が出たとされる[19]。この問題は、学習速度の計算式が内部で何度も改訂されたことで、追跡しづらくなったと指摘される。
第二に、説明責任(R)が“説明の上手さ”へ置き換わる危険があった。R担当が文章を整えるほど、技術的な改善よりも「誤解しにくい言い回し」が増え、現場の設計議論が痩せるのではないかという論点が出たとされる。なお、監査局はこの批判に対し「Rは設計の補助輪であり、推進そのものではない」と回答したと記録されているが、文書のトーンが強すぎたため、現場の反発を招いたとされる[20]。
第三に、制度が大規模化する過程で、会議体が“編集作業”に寄りすぎた点が論争になった。ある現場では、PT会議の準備だけで週の稼働の約12.3%が消費されたと計算された。しかし、その計算は「準備時間」に“迷っていた時間”を含める定義であったため、数字の信頼性が議論になった。要するに、数字が真面目すぎるほど疑わしくなるという現象が起きた、とも評される[21]。
さらに、2019年頃の内部回覧で「監査局のRDIは自己参照である」という短い文が話題になったとされる。自己参照の意味が、実際には“ログをもとにログ定義を再調整する”技術的運用を指していたのか、それとももっと別の比喩だったのかは不明である、という注記が残っている。解釈の余地を残したまま広まったため、社員の間で“RDIが自分を測ってしまう”という都市伝説的な理解が流通したとされる[22]。
脚注[編集]
関連項目[編集]
脚注
- ^ エリザベス・M・ハロウィン『透明性レイヤと組織学習—大規模技術企業の帳票設計』Techno Press, 2012.
- ^ 山田精一郎『意思決定を測るという幻想:会議記録語彙の統計モデル』情報管理叢書, 2016.
- ^ Katherine W. Rourke, “Project Triangles and the Auditability of Research,” Journal of Organizational Engineering, Vol. 18, No. 2, pp. 33-59, 2015.
- ^ 佐藤文則『再利用会計の実装史—レビューと部品の会計化』日本経営工学会誌, 第24巻第1号, pp. 1-24, 2018.
- ^ Michael J. Hargrove, “RDI Metrics and the Semantics of Failure,” Reliability & Governance Review, Vol. 9, No. 4, pp. 201-233, 2017.
- ^ 内田カナメ『“つまづき数”で読む責任説明:社会的責任(R)の運用指標』説明責任研究所紀要, 第11巻第3号, pp. 77-96, 2014.
- ^ Thomas K. Baird, “The Fish Log Phenomenon: Naming, Search, and Transparency,” Proceedings of the Human Workflow Symposium, pp. 410-425, 2013.
- ^ 成田玲子『事故率の再定義:現場の定義差分指数をめぐって』監査通信, 2020.
- ^ R. Patel, “Pretext Writing and Operational Delay,” New Trends in Platform Management, Vol. 6, No. 1, pp. 12-27, 2019.
- ^ (一部改稿版)“Account Closure at 10:10”: A Ritual Study of Quarterly Summaries,” Corporate Automation Letters, Vol. 3, No. 2, pp. 88-91, 2011.
外部リンク
- 監査局アーカイブ
- 再利用会計ガイド
- 透明性レイヤ技術メモ
- PT運用事例集
- RDI計算辞書ポータル