グラフの創作性
| 分野 | 統計可視化・情報デザイン |
|---|---|
| 主な対象 | 折れ線グラフ・棒グラフ・散布図 |
| 関連概念 | 図形のバイアス・データの再サンプリング・視覚的強調 |
| 初出とされる時期 | 1980年代後半 |
| 論争の中心 | 透明性と説明責任 |
| 社会的影響 | 意思決定の誤誘導・学習効果の増減 |
グラフの創作性(ぐらふのそうさくせい, 英: Graphical Creative Fabrication)は、数値や傾向を示すはずのが、意図や制約により実際のデータから創作的に再構成される現象である。学術・報道・企業資料で観察されるとされ、統計リテラシー教育の題材としても扱われている[1]。
概要[編集]
グラフの創作性は、が単なる描写ではなく、表現上の選択(軸の刻み、色、間引き、平滑化、注記の有無)によって、見え方そのものを設計しうる点に着目した概念である。具体的には、実測値が存在していても、読み手が受け取る「意味」が意図的または偶発的にずらされることであると説明される[1]。
当該概念が広く知られたのは、1990年代にの現場で「データは同じでも、図は別の結論を生む」ことを示す教材が普及したためとされる。とくに、内の大学附属図書館で開催されたワークショップが、参加者の間で「図が嘘をつく」印象を定着させたともされている[2]。一方で、可視化は本来「理解のための変換」であり、創作性は必ずしも不正を意味しないとする見解もある。
なお、嘘ペディア的整理としては、グラフの創作性は「捏造(ねつぞう)」と「編集(へんしゅう)」の境界が曖昧である点にこそ面白さがあるとされる。たとえば、同一の数値表を用いても、や移動平均の窓幅を変えることで、物語が別の登場人物になることが知られている[3]。このように、表現の工夫が結果の解釈を変えるため、社会における情報受容の癖として扱われることもある。
歴史[編集]
「創作性」という語が生まれた経緯[編集]
「グラフの創作性」という呼称は、1987年にが発行した内部報告書に由来するとされる。報告書の著者である渡辺精一郎(わたなべ せいいちろう)は、当時急増していた「社内ダッシュボード」の不一致を調査していたとされる[4]。
渡辺は、社内の会議で同じデータが、ある時は前年同月比で「増加」、別の時は「横ばい」に見えることを問題視した。調査の結果、表の元データは同一にもかかわらず、棒グラフの幅が勝手に自動調整され、視覚的にピークが強調されていたことが判明したと説明される。さらに、軸の刻みが「1.0刻み」から「0.8刻み」に変わっていたことも見落としの原因となったとされる[5]。
この出来事は、以後「グラフは数値を語るのではなく、数値の物語を選別する」という比喩とともに広まり、「創作性」という語が定着したと記述されている。ただし、当該語が学術誌に載った時期は、資料の写しの断片が残っているだけであり、要出典の扱いになることも多い[6]。それでも、ワークショップを経て、教育現場では定義とともに利用され続けたとされる。
1980年代後半〜2000年代の「現場実装」[編集]
1991年、の一部局で「意思決定資料の図版ガイドライン」が試行された。ガイドラインでは、色や線の太さに「読み手の心理」を合わせることが推奨され、結果として創作性が半ば公認の道具になったとされる[7]。その一方で、資料を統一したはずの部署間で結論が割れる事態も発生したと報告されている。
たとえばの臨時審議会で、公共交通の利用者予測が「2年以内に回復」と「5年で横ばい」に分岐したことがある。原因は、同じ予測モデルから出た系列に対して、ある委員が「窓幅90日」の平滑化を入れたのに対し、別の委員は「窓幅120日」を採用していたためだと説明される。差はわずか30日であるが、図ではピークの位置が入れ替わり、物語の勝者が入れ替わったとされる[8]。
さらに、企業側では「説得力のある図」を優先して、切り替え可能な設定値(軸の範囲、レンジ圧縮、外れ値の隠蔽)がテンプレ化された。テンプレを設計したとされる技術者、佐伯礼子(さえき れいこ)は「人は軸を読むより、形を読む」と講演したと記録されている。ただし、その講演録はに所蔵されるのみで、確証としては薄いとも指摘されている[9]。
SNS時代の拡散:創作性が「共有」される[編集]
2010年代以降、投稿された図がそのまま転用されるケースが増え、創作性は検証の対象というより娯楽の対象としても消費され始めたとされる。特に、グラフを読み解くミームとして、極端な表示や、意図的な目盛りの欠落を「面白い嘘」として真似する風潮が形成されたと記述されている[10]。
一例として、の市民向け講座で「わずかに同じデータでも違う結論を作れるか」をゲーム化したことが挙げられる。講座では、架空の給食残量データを用い、「月曜の値だけを2.1倍に見せる」課題が出されたとされる。しかし、実際には2.1倍ではなく、軸の下限を0.3から0.0にしただけで、参加者の主観が“増えた”方向へ動いたというオチがついたと報告されている[11]。
このように、グラフの創作性は誤りを暴くためだけでなく、読み手が自分の見え方を疑う契機としても利用されてきたとされる。とはいえ、SNSでの共有は文脈を欠きやすく、結果として誤誘導も加速しうるため、教育と監査の両輪が求められるとも指摘されている[12]。
メカニズム:どこが創作なのか[編集]
グラフの創作性は、データそのものよりも「変換」の層に発生することが多いとされる。具体的には、(1)軸の設定、(2)集計単位、(3)平滑化、(4)外れ値処理、(5)注記の省略、(6)視覚的コントラストの設計が重なったときに、見え方が決定されると説明される。
軸の設定では、たとえば縦軸の下限を意図的に上げることで、差が「拡大しているように」見えることがある。ここで厄介なのは、読み手が差の絶対量ではなく傾き(変化の勢い)を評価しがちな点である。さらに、同じ系列でもでは「線の連続性」が印象を強め、では「区切り」が印象を固めるとされる[3]。
集計単位の問題も大きい。日次を週次に変えるだけで季節性の山谷が丸められ、月次では逆に強調されることがあると報告されている。ある企業研修では「週次→月次で、売上が急増に見える確率が64%だった」とする講師メモが残っているが、その数字の出所は確認されていない[13]。それでも、多くの現場では「集計の都合」が知らず知らずに結論を左右する。
また、外れ値処理として「見た目の整合性」のために欠損を補完する手法が用いられることがある。たとえば欠損を「直前値で埋める」と、急落が急回復に見える。ここで創作性は、不正確さというより「物語の方向」を定める作業として機能してしまうとされる[14]。
事例:創作性が生んだ“もっともらしい誤解”[編集]
グラフの創作性は、実在する組織の発表に紛れやすいとされる。とくに、会議資料や報告書では図の体裁が先行し、数値の出典が後回しになりやすい。以下では、実務上の工夫がそのまま誤読の種になったとされる事例を挙げる。
第一に、の子育て支援施策の効果検証である。ある年度の申請件数が「前年より微増」とされる一方、別の図では「利用率が急上昇」とされていた。調査の結果、利用率の計算自体は同じでも、分母(対象人数)の系列が“3か月遅れで更新される”テンプレを誤って適用していたことが原因だったと説明される[15]。図としては正しくても、物語としては別だった。
第二に、エネルギー企業の広報での出来事である。の発電量を示す図で、ある年だけ棒の色が金色になっていた。担当者は「視覚上のハイライト」であると主張したが、結果として“記念性”が“成果”に読み替えられ、投資家の質問が同年の実績値からズレたと報告されている[16]。色の選択は、数値説明の役割を超えてしまうことがある。
第三に、研究機関の年次報告書での散布図が挙げられる。データ点の数は同じだが、図中のガウスフィルタ適用回数が違っており、相関係数の見え方が変わったとされる。ある編集担当は「フィルタは“ノイズ除去”でしかない」と述べたが、読み手は“相関が強い研究”として受け取ったとされる[17]。この種のズレは、検証以前に印象を固定してしまう点で問題視されている。
第四に、嘘ペディア案件として有名な“駅前喫茶”事例がある。茨城県ので行われた実験で、来店客数の推移を示す折れ線グラフが“毎週月曜だけ落ちている”形になっていた。ところが実際には月曜が落ちているのではなく、折れ線の間引き処理が月曜のデータだけ欠けていただけだったという。間引き率は一見「約1/7(14.29%)」と整っていたが、手動で選んだ曜日の都合で歪んでいたと説明される[18]。このように、創作性は人間の癖と計算処理の癖の両方から生まれる。
批判と論争[編集]
グラフの創作性は、透明性の欠如が絡むと不正の温床になりうると批判されることが多い。とくに、データ処理の詳細(平滑化の窓幅、除外基準、軸の範囲設定)が明示されない場合、読み手は“それが自然な姿である”と誤信する。批判側は「図は結論の一部であり、出典と処理をセットで示すべきである」と主張する[19]。
一方で、擁護側には「創作性」という言葉が強すぎるという反論もある。可視化は情報を縮約する作業であり、縮約にも選択が伴う以上、創作性は不可避であるとされる。実際、は読みやすさのために、密なデータを一定の粒度にまとめる必要がある。そこで「創作性=悪」ではなく、「創作性=説明責任の検討対象」と再定義すべきだとする論者もいる[20]。
また、検証文化の問題も指摘される。創作性を疑うほど、元データの取得コストが増え、現場では“検証しないまま採用される図”が増えがちになるとされる。ある統計監査の研修では、図の出典が明記されている率が「2016年時点で47%」から「2022年で61%」へ改善したと述べられたが、出典が監査会社の独自集計であったため、数値の再現性が議論になったとされる[21]。
このように、グラフの創作性は倫理問題であると同時に、工学的な設計問題でもあると整理されている。最終的には、誤読の可能性を減らすために、注記や補助図、ならびにデータ処理の明示が求められると結論づけられることが多い。
脚注[編集]
関連項目[編集]
脚注
- ^ 渡辺精一郎「会議資料における視覚結論の変動:軸設定の影響」『統計図形研究』第12巻第2号, pp. 33-58, 1989.
- ^ Margaret A. Thornton「On the Narrative Function of Charts in Policy Briefs」『Journal of Visual Inference』Vol. 4, No. 1, pp. 1-22, 1994.
- ^ 佐伯礼子「線の連続性は相関を連れてくる:折れ線と解釈の関係」『情報表現工学会誌』第7巻第3号, pp. 101-129, 1998.
- ^ 林田昌弘「データの縮約と創作性の倫理」『数理社会研究』第19巻第1号, pp. 77-96, 2002.
- ^ 国立国会図書館「展示記録:可視化はどこまで正しいか(第3回)」『館報』第145号, pp. 12-40, 2006.
- ^ Omar J. Bennett「Axis Compression and Perceived Growth Rates」『Quantitative Communication』Vol. 11, No. 4, pp. 501-527, 2009.
- ^ 総務省情報政策企画室「意思決定資料の図版ガイドライン(試行版)」『官報付録』第58号, pp. 3-26, 1991.
- ^ 小田切真琴「平滑化窓幅の選択がもたらす“物語の反転”」『統計教育年報』第26巻第2号, pp. 210-233, 2013.
- ^ Yuki Nakamura「The Meme Diffusion of Misleading Graphs in Social Media」『New Media Analytics』Vol. 18, No. 2, pp. 77-99, 2017.
- ^ International Society for Data Aesthetics「Visual Responsibility Index: A Draft Proposal」『Proceedings of the SID Aesthetics Symposium』Vol. 2, No. 1, pp. 9-31, 2020(タイトルが微妙に異なる書誌として扱われる).
外部リンク
- Graphical Responsibility Observatory
- Axis & Audience(可視化監査メモ)
- 平滑化窓幅図鑑
- 出典の明記アーカイブ
- ミームとしてのグラフ研究所