JPEG事件
| 分野 | 情報規格行政・デジタル検査制度 |
|---|---|
| 発生時期 | 1998年〜2001年 |
| 発生場所 | 主に(データセンター) |
| 原因とされるもの | 圧縮パラメータの恣意的調整と監査の不備 |
| 関係組織 | 情報通信監理庁・港湾電算局(いずれも当時の仮組織として記録) |
| 影響 | 監査用ハッシュ導入、標準手順書の改訂 |
| 結果 | 再圧縮禁止ルールと検証ログ義務化が提案されたとされる |
(JPEG じけん)は、1990年代後半から2000年代初頭にかけての行政・通信業務で「画像の規格」が原因とされて発生したとされる技術不祥事である[1]。特にの海底ケーブル更改案件で顕在化し、社会に「圧縮は信用できるのか」という議論を残したとされる[2]。
概要[編集]
は、デジタル画像の取り扱いに関して、圧縮・再圧縮の手順が監査と噛み合わず、最終的に「同一画像が同一証拠として扱われない」事態が報告された事件として語られている[1]。
当初はの現場トラブルとして処理されていたが、1999年の秋に沿岸の通信網で「検査結果が合わない」苦情が集中し、調査が行政監査の領域に引き上げられたとされる[3]。その後、圧縮率(品質係数)と色空間変換の取り扱いが焦点となり、技術者と監査担当官の間で責任の押し付け合いが起きたとされる。
なお、事件の呼称は、最初の告発文書が「JPEGの改ざん疑義」に言及していたことから、報道機関が独自に「JPEG事件」と名付けたといわれている[4]。当時の内部資料には、より具体的に「J/PG-7監査不整合問題」との記載も見られたともされる[5]。
概要(選定基準と「事件」と呼ばれる理由)[編集]
本記事では、次の条件を満たす出来事をの射程に含めて記述する。すなわち、(1) データが監査・検査の対象となっていた、(2) 再圧縮や変換の工程が証拠性評価に影響したと主張された、(3) 実施手順書やログ運用に関する制度改訂が提案された、という3点である[6]。
また、事件が「技術」ではなく「不祥事」として扱われたのは、原因が単なる不具合ではなく、品質係数の設定が現場裁量に委ねられていた運用構造にあったとされるためである。とくに、品質係数を決める際の「経験則」登録が個人アカウントに紐づいていたことが問題視されたとされる[7]。
一方で、最終報告の一部には矛盾もあり、「技術的差分」を説明する文言が後日差し替えられたとの指摘もある[8]。このためは、説明責任の物語として語られることが多い。
歴史[編集]
発端:港湾電算局の「証拠画像」運用[編集]
1998年、(現:港湾データ整備課の前身とされる)では、海上物流の管理端末に添付された巡回記録画像を、監査用にで保存する運用が導入されたとされる[9]。保存条件は「再現性重視」とされつつ、品質係数の指定は「原本参照時に限り75を推奨」といった柔らかい表現で書かれていたという[10]。
ところが、現場では「端末の都合で品質係数を下げると通信量が減る」という理由から、画像ごとに品質が揺れたとされる。報告書の付録では、同一案件番号の画像が、品質係数で最小52〜最大83まで振れていたと記録されている[11]。また、色空間変換(YCbCr→RGB→YCbCr)を挟む改変が、気づかないうちに行われていたともされた[12]。
この時点では事故として扱われず、「見た目が同じならよい」という暗黙の合意があったとされる。だが、監査側はハッシュ検証を前提としており、工程の違いが“別物”扱いになることが露呈したといわれている[13]。
顕在化:江東データセンターでの「合わない検査」[編集]
1999年10月、の民間データセンター「潮騒バックアップ棟」で、監査用に復元された画像の検査結果が、元データと一致しないという申告が相次いだとされる[14]。
調査チームは「復元アルゴリズムが別物ではないか」と疑い、検査用の再符号化を走らせた。すると、品質係数が同じ75であっても、画像の並び順(バッファ先読み)により、ハッシュが最大で約1.6%の確率で変化することが観測されたとされた[15]。この数値は内部会議でやけに細かい扱いを受け、「再現性があるのに再現できない」現象として笑い話にされたという[16]。
さらに悪いことに、復元手順書の改訂版が、同月のうちに2回アップロードされていたと記録されている。改訂Aでは「品質係数固定」、改訂Bでは「品質係数は回線事情に応じ調整」となっており、現場はどちらを守っていたのか曖昧だったとされる[17]。この齟齬が、のちに「事件」として拡大する温床になったとされる。
なお、調査の過程で、関係者の一部が「ログはあるが、ハッシュは“気分で”選んだ」と供述したと報じられた(供述内容の真偽は争われたが、当時の新聞見出しは強い言い回しを採用したとされる)[18]。
収束と制度化:監査用ハッシュ導入の裏側[編集]
2000年2月、情報規格監査を所管するは「再圧縮の禁止」を含む暫定指針を公表するとした。ただし、指針には例外条項が設けられ、「検証用の派生画像は、原本と同一の変換グラフを持つ場合に限り許容」と書かれたとされる[19]。
この「変換グラフ」の具体が、実は図面一枚にしかなく、現場が勝手に解釈しやすい構造になっていたと批判された[20]。結果として、2000年の夏には、監査対象画像のうち約3,421件が“例外扱い”として別フォーマットへ変換され、後日照合できなくなったとする内部集計が回覧された[21]。
この集計は、のちに提出された最終報告書では「照合困難が一定程度存在した」と丸められたとされる[22]。また、品質係数の運用は「75固定へ向けた移行」とされつつ、実際の移行率は月次で揺れたと推定されている[23]。
2001年、制度改訂の形として「監査用ハッシュの強制記録(ログ義務)」と「品質係数・色空間・再圧縮回数の明示」が提案され、行政手続きの様式に落とし込まれたとされる[24]。この制度化こそが、事件が“技術不祥事”から“監査文化”へ転換した瞬間だと語られている。
批判と論争[編集]
に対しては、原因が技術仕様よりも運用設計にあったのではないか、という見方が強い。特に、品質係数の決定権限が個人に委ねられていた点が、「制度が人を動かしてしまった」と評価されることがある[25]。
一方で、反論として「JPEG自体が持つ可逆性・不可逆性の誤解が問題の中心だった」とする主張も存在する。実際、当時の教育資料では「見た目が同じなら同一」と書かれたページが、会議の翌週に差し替えられた形跡があるとされる[26]。もっとも、この差し替えを巡る動機は明確にされていない。
また、報道側では、事件の名称が先に流通したことで、技術者が“JPEG犯”として単純化されたとの批判が出たとされる。内部資料の中には「JPGという呼称は便宜上であり、責任は圧縮率ではなく監査導線にある」と読める記述があるとされるが、公開版では削除されていたとも言われている[27]。
さらに、例外条項の運用については、「例外の条件が満たされるかを検証するには、結局同じ問題が必要になる」という循環論法になるとの指摘がなされた[28]。この指摘は、制度が“見た目”に引きずられる危険を示した事例として引用されることがある。
脚注[編集]
関連項目[編集]
脚注
- ^ 高橋 朋久『標準手順書と現場裁量の相克:1990年代監査実務の記録』港湾出版, 2002.
- ^ Margaret A. Thornton『Evidence Integrity in Compressed Media: A Procedural Casebook』Springfield Academic Press, 2004.
- ^ 斎藤 玲奈「品質係数の揺らぎと照合失敗率」『情報規格研究』Vol. 38, No. 2, pp. 113-129, 2001.
- ^ Lee W. Calder『Hashing Under Transformations: When “Same” Becomes Different』IEEE Communications Archive, 第12巻第3号, pp. 44-61, 2000.
- ^ 【日本】情報通信監理庁編『暫定指針:例外運用と監査用ハッシュの記録様式』第一版, 2000.
- ^ 田中 一穂「再圧縮回数と証拠性:ログ設計の観点」『監査技術季報』Vol. 7, No. 1, pp. 9-27, 2003.
- ^ 王 宇航『色空間変換の非対称性と現場トラブル』Journal of Digital Imaging, Vol. 19, No. 4, pp. 201-219, 1999.
- ^ 中村 明人『潮騒バックアップ棟の記録:江東データセンター監査報告』東京データセンター叢書, 2005.
- ^ Christopher J. Rusk「Compression Myths and Administrative Consequences」『Proceedings of the Policy-Technical Interface』Vol. 2, pp. 77-92, 2002.
- ^ 松本 啓介『JPEG事件のなぜ:変換グラフの誤読』新都法務出版, 2001.
- ^ 小林 俊介『監査文化の作り方:“気分で選ぶハッシュ”をなくす』要出典出版社, 2006.
外部リンク
- 潮騒バックアップ棟アーカイブ
- 監査用ハッシュ導入プロジェクト
- 圧縮画像検査ガイド(旧版)
- 変換グラフ図面倉庫
- 江東データセンター運用メモ集