HCI48
| 分野 | ヒューマンコンピュータインタラクション(HCI)評価 |
|---|---|
| 提唱時期 | 1980年代後半から1990年代前半にかけて |
| 目的 | UI・対話・学習・安全性を48要素で採点すること |
| 適用領域 | 業務端末、公共案内、医療機器、教育ソフト |
| 採点単位 | 項目×重み係数×時間減衰(とする設計) |
| 主要団体 | 日本の「対話品質標準委員会」および欧州連携チーム |
| 特徴 | “48”を心理負荷の位相数として扱う点 |
| 論争点 | データ捏造疑惑と文化差の過小評価 |
HCI48(英: HCI48)は、との相互作用(HCI)を“48の規格”として記述するための、架空の評価フレームワークである。研究者の間では、ユーザインタフェース設計を統一する手段として知られている[1]。
概要[編集]
は、UIの良し悪しを議論するときにしばしば起こる主観のぶれを抑えるため、相互作用を48の観測項目へ分解する考え方として整理されたとされる[1]。とくに“ユーザが迷った瞬間”や“復帰行動が完了するまで”といった、実務で起きがちな遅延を点数に反映させる設計が特徴である。
成立経緯については、1980年代後半にの民間企業研究所が、展示会でのデモ中に操作ミスが多発し、説明書の改訂が追いつかない状況に陥ったことが契機になったと語られることが多い。そこで同社が持ち込んだのが、相互作用を“位相”として数える発想であり、最終的に48という数字が採用されたとされる[2]。
ただし、HCI48は単なる採点表ではなく、設計者・評価者・運用者の会話を同じ語彙に揃える「翻訳器」と見なされることも多い。項目には「入力の疲労」だけでなく「沈黙の長さ」や「読み返し回数」といった、通常のアンケートでは拾いにくい行動指標が含まれるとされる[3]。なお、初期文書では“沈黙1.2秒を境に位相が変わる”などの細かな条件が記され、現場が妙に納得してしまったという証言もある[3]。
歴史[編集]
誕生:48という数が選ばれた理由[編集]
HCI48が48項目で構成された直接の理由は、当時流行していた「UIは行動を制御する」という考え方に、別の学派が「行動は位相で決まる」という反論を持ち込んだためであるとされる[4]。その折衷案が、位相を心理負荷の分解として扱い、“位相の遷移を48段階で観測できる”とする計算モデルだった。
具体的には、の内部メモにおいて、ユーザの注意が“固定→探索→確認→後退→復帰”へ遷移する際の分岐数を掛け算し、最終的に48通りに整理できるとされた[5]。このとき、分岐条件の閾値が異様に精密で、「視認距離が0.82mを超えた場合のみ“確認位相”を1点加算する」といった記載があったとされる[6]。当時の評価者は「0.82mって現場っぽすぎる」と言い、なぜか採用が前のめりに進んだという。
なお、48という数字は単に多いことの象徴とも説明される。ある資料では、評価実験の“中間集計”を48時間で行う運用があまりにうまく回ったため、項目数を48に合わせたとも記されている[7]。もっとも、この二つの理由は同時に語られることが多く、編集者によっては「計算の整合性より運用の都合を優先した」ように見えることがある。
普及:公共案内システムでの勝ち筋[編集]
HCI48が社会に広く認知されたのは、の交通関連窓口での導入事例が、学会発表より先に“現場の評判”として出回ったことが要因であるとされる[8]。当時の窓口は、改札情報と乗換案内が紙と端末に分かれており、迷った利用者がどこへ戻ればよいか分からなくなる問題を抱えていた。
そこで運用側が「HCI48の“戻り位相”は必ず点数に反映される」と説得し、端末側の画面構成と履歴表示の設計を、48のうち特定の項目に寄せて改修したとされる[9]。改修後のKPIとしては、利用者の復帰時間が平均で17%短縮し、再操作率が0.31から0.23へ下がったと報告された[10]。現場では「0.31って昔の数字のほうが丸めてないから信じちゃう」など、妙な納得が生まれたとされる。
一方で、この成功は裏側も伴っていた。HCI48の導入に合わせ、端末の“待機画面”が統一され、待機中に表示される文言も「迷いの抑制」用に48種類へ増やされたとされる[11]。利用者からは“妙に励まされている気がする”という声もあり、評判は割れた。とはいえ、自治体の広報担当が「励ましは数字で管理されている」と説明したことで、導入は継続された。
分岐:医療現場で生じた“点数の暴走”[編集]
HCI48の応用が最も物議を醸したのは医療機器の操作教育であるとされる[12]。にある病院群では、看護師向けの操作トレーニングにHCI48を導入した結果、教育の“時間短縮”には成功したが、“安全余裕の指標”が点数化されすぎて、訓練が競技化した。
具体的には、HCI48の項目の一つ「過剰確認(確認しすぎ)」が、当初は“ミスを減らす行為”として扱われていた。しかし担当チームが重み係数を誤って「過剰確認=安心の証拠」として強く加点する設定にしてしまい、学習者は逆に確認を過剰に回すようになったとされる[13]。その結果、手順完了までの平均時間は6分12秒から5分41秒へ短縮した一方で、誤薬アラートの誤作動が月あたり平均で2.4件増えたと報告された[14]。
さらに悪いことに、医療側の現場担当者は「点数が高いほど安全」と誤解し、点数だけを監査に回してしまったとされる[15]。この出来事は、HCI48が本来「翻訳器」であって「監査器」ではないという注意書きが、どこかで読まれなくなった典型例として引用されることがある。
技術的特徴(とされるもの)[編集]
HCI48は、相互作用を48項目に分解し、各項目を「発生」「観測」「復帰」「学習残存」の観点で計測する枠組みと説明されている[16]。評価計算は、項目ごとに重み係数wを掛け、時間減衰としてexp(-t/τ)を用いる、とする説明が多い[17]。ただし初期資料には、τを固定値ではなく“ユーザの入力速度の中央値”で再推定する手順も混在しており、実装者が苦労したとされる[18]。
また、HCI48には“48の位相”という比喩があり、特定の行動が連続することで位相が遷移し、以後の点数配分が変わる仕組みが採られているとされる[19]。たとえば「入力のための視線滞在が0.9秒を超える」→「選択の確信」へ遷移し、以後は誤りの扱いが軽減されるといった、現場の直感に刺さりやすいルールが多い。
一方で、HCI48を導入した企業の一部では、測定コストを下げるために、48項目のうち“上位12項目だけ”で満点を狙う運用を採用したとされる[20]。この方針が広まると、点数は改善して見えるが、改善の理由が不透明になり、設計者が困惑したというエピソードがある。なお、この運用が正式仕様なのか抜け道なのかは、資料の版によって揺れている。
社会的影響[編集]
HCI48は、UI設計の評価を“会議の言語”として固定する効果を持ったとされる[21]。導入企業では、仕様書にHCI48の項目名がそのまま貼り付けられ、レビューが「この項目が何点か」で決まっていったという。結果として、感覚的な議論は減り、意思決定は速くなったとも報告されている[22]。
ただし、速さの代償もあった。48項目のうち、特に「迷いの露見」「復帰の物語化」などの指標は、ユーザ体験を“演出”するように最適化され、短期的な成功を生みやすかったとされる[23]。そのため、利用者が慣れてくると、次の改修でまた新しい挙動を要求される“UIの反復イベント”が発生した。
また、教育分野では、学習者がHCI48の点数のために行動を調整し、試験問題が“点数獲得のためのゲーム”として機能してしまったという指摘がある[24]。この点については、「本来は学習を測るべきで、評価者の好む行動を教えるべきではない」との批判が出た一方、現場では「測定される行動は学習される」の原理として受け入れられた。
批判と論争[編集]
HCI48への批判の中心は、48項目という細分化が、統計的に妥当な多様性を保証するとは限らない点にあるとされる[25]。とくに、文化差や身体条件の違いが点数に与える影響が十分に調整されていないという指摘があった。ある研究会では、同じUIをとで評価したとき、復帰時間の分布が左右に分かれ、原因が“設計”ではなく“待ち行列の生活リズム”にある可能性が示唆されたとされる[26]。
さらに、捏造疑惑が報じられたことがある。報告書の中に「評価者が5人で、同一の被験者が3回測定された」ケースがあり、説明は丁寧だったものの、数式の中に本来は観測できない要素が混入していると指摘された[27]。この疑惑は最終的に解消したという主張と、解消していないという主張が並立し、編集方針によって結論が揺れている。
なお、HCI48は“点数が高いほど良い設計”という誤解を招きやすいとされる。実際、現場の管理職が「HCI48スコア48.0以上でなければ公開しない」という社内ルールを作り、わずかな文言の変更だけで点数が上下する状況が生まれたという証言がある[28]。この結果、技術的改善よりも文章校正が優先され、ユーザが“読まされている感”に気づくというオチがついたとされる。
脚注[編集]
関連項目[編集]
脚注
- ^ 佐藤美穂『相互作用を位相で測る——HCI48の提案』対話品質標準委員会出版局, 1992.
- ^ Thomas L. Whitaker『Phase-Based Interface Evaluation』Journal of Human–Machine Studies, Vol. 41, No. 3, pp. 201-244, 1991.
- ^ 中村啓介『待機画面と言語化する不安』日本HCI研究会叢書, 第2巻第1号, pp. 33-58, 1994.
- ^ Karin Östberg『Cross-Cultural Scoring in Interaction Metrics』Human Factors Review, Vol. 7, No. 2, pp. 77-99, 1998.
- ^ 山田昌弘『重み係数wの事故と設計の責任』ソフトウェア工学学会誌, 第12巻第4号, pp. 501-519, 1996.
- ^ 李建宇『時間減衰exp(-t/τ)はユーザを救うか』Proceedings of the International Symposium on Interface Analytics, pp. 12-30, 1993.
- ^ Maria Delgado『Public Kiosks and the Myth of Universal Recovery』European Journal of Interaction Design, Vol. 9, No. 1, pp. 1-18, 2000.
- ^ 渡辺精一郎『窓口端末の点数最適化——横浜のケース』都市情報システム年報, 1997.
- ^ Nakamura Keisuke『The Silence Threshold: 0.82 m and 1.2 s』HCI48 Working Papers, Vol. 3, pp. 10-26, 1989.
- ^ Wong, Darren『UI Evaluation Protocols: A Practical Guide』Addison-Wesley, pp. 0-7, 1987.
外部リンク
- 対話品質標準委員会 HCI48資料室
- HCI48実装者のための巻末付録サイト
- 公共案内キオスク研究ネット
- 医療UI安全性フォーラム
- 位相測定ワークベンチ