検索していい言葉
| 分野 | 情報倫理/計算言語学/教育工学 |
|---|---|
| 提唱主体 | 自治体連携の実証プロジェクト群(後述) |
| 成立時期(慣用) | 1997年〜2003年 |
| 運用形態 | 検索支援フィルタと教材設計 |
| 代表的な指標 | 理解促進指数(UPI) |
| 関連概念 | 安全語彙/誤解低減辞書/閲覧フラグ |
| 主な論点 | 検閲類似性と学習の遅延 |
(けんさくしていいことば)は、公共性が高いと判定され、検索すると学習・理解が促進されることがある語句の総称として扱われた概念である。主に言語処理・情報倫理・教育工学の交差領域で、1990年代後半から観測されるとされる[1]。
概要[編集]
は、ある語句が検索環境で“許可”される根拠を、言語学的特徴と社会的影響の双方から説明しようとした概念である。形式的には「入力された語句が教育目的の学習導線を形成する確率が高い」とされる語彙群であり、実務では検索結果の提示順序や補助説明(注意書き)の有無として現れるとされる[2]。
語句の選定は、単なる危険語の排除ではなく、誤解を減らし知識の地図を作ることを狙った点に特徴がある。たとえば“健康”という語は一般に許可されやすい一方、“健康被害”に関する語は、文脈次第で扱いが分岐するよう設計されることが多いとされる。なお、この分岐は利用者の学習履歴に依存するため、当初から説明責任が課題として指摘されていた[3]。
歴史[編集]
前史:学習用検索の「誤差」を測る発想[編集]
概念の前史は、1990年代初頭の教育番組で用いられた“調べ学習用の合言葉”に遡るとされる。放送局は、スタジオの生徒が検索しようとして言葉に詰まる事例を統計化し、語句ごとの「立ち止まり率」まで測定したとされる。特に系の教材設計チームと、の教育委員会が共同で試作した「学習導線ログ」は、語句入力から結果閲覧までの平均秒数を、最終的に1語あたり12.4秒という粒度まで記録するに至った[4]。
このログを解析したの研究者群は、“検索していい言葉”を「誤解が少なく、追加の説明が少なくても意味が通る語」と定義し直したとされる。当時の報告書では「危険語を除く」のではなく「理解が成立する語に誘導する」という表現が採用され、のちの評価指標の原型となった[5]。
成立:1999年の「渋谷プロトコル」と指標の誕生[編集]
この概念が言説として広まった転機は、1999年にで行われた“公開検索の安全性実験”であったとされる。関係者は通称で「渋谷プロトコル」と呼び、検索結果の提示に介入する閾値を、数学的に“誤解低減の費用対効果”で決めようとした。実験では、利用者が“知らない語”を入力した場合に補助文が付く設計が採用されたが、補助文を長くしすぎると学習が遅れるため、平均補助文長を「全角換算で39〜47文字」に抑える方針が採られたとされる[6]。
その結果、語彙ごとの理解促進指数(Understanding Promotion Index)が導入されたとされる。UPIは、(1) 検索後の再検索回数の減少、(2) 閲覧ページの平均離脱時刻、(3) 読み替え辞書の使用率、の3要素を重み付けして算出するとされた。なお、この重みの比率は最初期には「0.33:0.41:0.26」と報告され、後に「0.30:0.45:0.25」へ微調整されたとされる。この変更理由は“議事録が一部欠落している”とされるが、実務上は校正の手違いではないかという推測も流布した[7]。
普及と変質:許可の範囲が“教育”から“社会”へ[編集]
2001年頃、の一部自治体が、図書館のレファレンス端末に“検索していい言葉”の補助機能を組み込んだ。ここでは「児童利用」「一般利用」「専門利用」で語句の扱いが変わる設計が導入され、同じ語でも許可レベルが変動するようになったとされる。たとえば“税”は児童向けに許可されやすい一方、“節税”は“誤解が増える可能性がある語”として、平均補助文長が増やされる傾向が観測されたとされる[8]。
一方で、成人の利用者からは「学習という名の誘導が強い」という不満が出た。そこで2002年に、検索許可の理由を閲覧者に“短い注釈”として表示する「透明性スナップ表示」方式が試されたが、注釈の表示頻度を上げるほどUIが重くなり、結果として再検索回数が増えるという皮肉な結果も報告された[9]。この時期から、検索していい言葉は教育支援の道具であると同時に、社会に対する“言葉の統治”になり得ることが論点化した。
運用の仕組み(フィクションとしての実装例)[編集]
運用は概ね、語句をいくつかのタグに分類し、検索結果の提示順序と説明文を変えることで行われたとされる。タグの代表として、、が挙げられる。たとえばのプロトタイプでは、“同音異義語が混ざりやすい語”をへ寄せ、検索窓の直下に「○○と△△のどちらの意味か選んでください」という疑似UIを差し込んだとされる[10]。
また、語句の許可は固定ではなく、検索ログの“揺れ”を観測して更新される設計が導入された。ログ更新は月次では遅いとして、当初は週次での再計算が行われたが、再計算によるランキングの変動が学習者の混乱につながったため、最終的に「隔週更新+週1回の例外手動承認(最大20語)」という折衷案へ落ち着いたとされる[11]。この手動承認の人数は“10名では多すぎ、6名では少なすぎ”という経験則に基づき、最終的に8名体制が採用されたとされるが、当時の記録は「参加者のうち一人だけ苗字の表記が二種類あった」との注記が残る[12]。
このように、検索していい言葉は技術的には辞書管理の問題であると見なされたが、実際には説明責任、地域差、そして利用者の自己決定の度合いを含む政策課題として扱われていったとされる。
具体例:ニュースになった「許可語」論争[編集]
2004年、新聞で話題となったのが、学校の端末で検索しようとしていた児童が「どうして“星座”が許可されないの?」と尋ねたという事例である。関係者は、星座という語自体は許可対象だったものの、“星座×病気”の組み合わせ検索が続いたことで、システムが一時的にへ格上げし、補助文を増やしていたと説明したとされる。ところが補助文が長すぎて児童が“恐い説明”と誤認した可能性があるとして、学習現場では「許可はしたが、許可の出し方が不親切だった」と評価が揺れた[13]。
同年には、逆に「許可すべきではない語が許可されていた」という指摘も生じた。例として、料理番組が作った造語“健康スープ語”が、語彙解析の都合で既存の危険語と誤結合し、結果として短期間だけ許可リストに混入したとされる。この混入は発見が早く、24時間で除外されたというが、24時間という数字が“なぜ端数が出ないのか”と署名者が疑問を呈した。署名者は「除外ログの保存期間が24時間に設定されていたのでは」と推測していたとされる[14]。
これらの騒動は、検索していい言葉が“善意のフィルタ”として導入されながら、運用設計によっては学習と安心を損ね得ることを示したとされる。
批判と論争[編集]
批判の中心は、検索していい言葉が実質的に“言葉の検閲”に近い働きを持ち得る点に置かれている。特に学習者の行動ログを根拠に許可を更新する場合、利用者は理由を理解できないまま探索の自由を制限される可能性があるとされる。また、自治体ごとに許可基準が異なることが、地域差による情報格差を生むのではないかという指摘も出た[15]。
一方で肯定論は、「完全な自由放任は誤解のコストを利用者に押し付けるだけ」であり、検索していい言葉は誤解低減のための“公共の座席”だと主張した。なお肯定論側の研究者は、誤解低減の効果を示すために、大学生の再検索回数が平均で17.2%減少したというデータを提示したとされる。ただしこの17.2%は、計測条件が「再検索を“ブラウザバックを含まないもの”に限定した」と注記されており、再現性に疑いが持たれたとされる[16]。
こうした論争の結果、2006年頃には「許可」よりも「注意」へ重点を移す方針が一部で採られたとされる。もっとも、その注意が結局は選別に見えるという反論も残り、検索していい言葉は“やさしい統治”として語られ続けた。
脚注[編集]
関連項目[編集]
脚注
- ^ 田中悠介『学習者の検索行動と語彙制御』情報教育学会, 2002.
- ^ Margaret A. Thornton『Permissible Terms and Understanding Steering』Journal of Applied Computational Semantics, Vol.12 No.3, pp.114-139, 2005.
- ^ 鈴木真琴『誤解閾値の設計原理:実証ログからの推定』日本言語工学会誌, 第7巻第2号, pp.33-58, 2001.
- ^ 林祐介『渋谷プロトコル:公開検索の安全性実験記録』自治体デジタル政策叢書, pp.1-212, 2000.
- ^ Aiko Rahman『Transparency in Search Mediation Systems』Human-Computer Interaction Review, Vol.8 No.1, pp.77-95, 2006.
- ^ K. Yamane, S. Kobayashi『Updating Cadence for Educational Filters』Proceedings of the International Symposium on Lexical Safety, pp.201-219, 2004.
- ^ 佐伯光『学習導線のコスト最適化:補助文長の制約』教育情報研究, 第19巻第4号, pp.401-426, 2003.
- ^ オフィス渋谷 編『公開検索の設計技法(再校正版)』渋谷区教育委員会, 2002.
- ^ M. Thornton, J. Hsu『Understanding Promotion Index (UPI): A Practical Metric』Computational Literacy Letters, Vol.3 No.2, pp.10-29, 2005.
- ^ 松本礼子『公共性と語の許可:言語倫理の素描』中央大学出版部, 2007.
外部リンク
- Permissible Terms Lab(架空サイト)
- 自治体ログ公開アーカイブ(架空サイト)
- 教育工学用語辞書(架空サイト)
- UPI計算ツール配布ページ(架空サイト)
- 渋谷プロトコル資料室(架空サイト)