谷正之テスト
| 分野 | 教育評価・品質工学・ヒューマンファクタリング |
|---|---|
| 提唱者とされる人物 | 谷 正之(たに まさゆき) |
| 対象 | 手順理解、誤解耐性、運用の再現性 |
| 評価の軸 | 自己矛盾率・読み替え許容量・手戻り兆候 |
| 使用媒体 | 紙ベースの設問カードと記録簿(後に電子化) |
| 確立時期とされる期間 | 昭和末期〜平成初期(諸説) |
| 論争点 | 指標の再現性、恣意性、教育現場への副作用 |
谷正之テスト(たに まさゆき てすと)は、の一部研究者・技術者の間で「暗黙の前提を炙り出す」目的で用いられてきたとされる評価手順である。特にとの境界で参照されることが多いが、その成立経緯には複数の異説がある[1]。
概要[編集]
谷正之テストは、ある作業や説明を読んだ人物が「どこで解釈をすり替えるか」を短時間で可視化するための評価手順として語られている。具体的には、同一の指示文を3種類の形式(原文提示・途中欠落・言い換え提示)で受け取らせ、矛盾の出方と修正行動を点数化する方式である。
一見すると、やに近い。しかし本テストでは「正しいかどうか」よりも、「誤って理解した側がなぜそう思ったか」を追跡する設計だとされる。とくに手続きの終盤に置かれる“谷の一問”と呼ばれる追加設問が、暗黙の前提(単位系、優先順位、例外規則)を炙り出す核とされている。
また、谷正之テストはの実務団体を通じて広まったとされる一方、出典として挙げられる資料の多くが非公開であることから、採用の是非をめぐってはしばしば「検証の鎖がどこで切れたか」が問題にされるとされている[2]。
仕組み[編集]
評価指標(3つの“ズレ”)[編集]
谷正之テストでは、回答行動のズレを主に3種類に分類するとされる。第一にであり、設問間で矛盾する解釈をした場合に加点される。第二にであり、回答者が勝手に補う情報量を“何文字相当か”で測るという、実務寄りの指標が用いられるとされる。第三にであり、回答後の訂正や、途中での再計算の回数が観察対象になる。
このうち自己矛盾率は、単純な採点ではなく「誤答の整合性」を見るため、誤答でも筋が通っている場合は一定の減点になることが多い。読み替え許容量は、補った内容のうち“誤りの原因になりやすい語(例:上限/下限、必ず/場合による)”に重みが付くとされる。手戻り兆候は、紙の上での訂正印の位置や、鉛筆の削り痕から推定されることもあるとされ、やけに細かいという批判の種にもなっている[3]。
実施手順(所要時間と“谷の一問”)[編集]
実施は概ね15分以内とされ、最初の5分で原文提示、次の5分で途中欠落、最後の5分で言い換え提示を行う構成が典型とされている。記録簿には、回答の最終形だけでなく、途中で参照した前提語(回答者が丸で囲う語)もチェック欄に記す運用が広まったとされる。
そして最後に“谷の一問”が来る。これはテスト対象の説明文とは無関係に、単位系に関する「換算の罠」を置く追加設問だとされる。たとえば「距離を“m”とみなすか“mm”とみなすか」を選ばせるような形式で、誤解した側が“正しくても間違っていた”という状態を引き起こすように設計される。実施者側が「時間がないので勘で答えてください」と一言添えると、谷正之テストの再現性が上がるという、現場の経験則も伝えられている[4]。
歴史[編集]
誕生の経緯(組織の裏側)[編集]
谷正之テストの原型は、昭和末期にの中堅工場で起きた「手順書が読まれていないのに“読まれたことになっている”」問題に端を発したと説明されることが多い。工場では工程に関する掲示が複数あり、朝礼で読み上げ担当が交代するたびに、同じ文章が違う意味として受け取られる現象が観察されたとされる。
この現象を“現場の気分”で片づけていたのが、当時の品質部門にいた谷正之という人物だったとされる。谷は、再教育ではなく「前提のズレを採点する」ことで原因を絞るべきだと主張したといわれる。とくに、説明文の欠落や言い換えを意図的に混ぜた資料を作り、読解の転換点を測るという発想は、当時のの潮流よりも先回りしていたとされる[5]。
その後、谷の元資料が一度だけの会議室で公開されたが、出席者の多くが“紙の記録が残らない評価は信用できない”という立場だったため、詳細は名刺の裏にしか書かれなかった、とする証言もある。このため、テストの起源は「実務の現場」から「教育評価」へ滑り込んだ形で広まったと推定されている[6]。
社会への波及(教育と品質の相互侵食)[編集]
平成初期、学習塾や企業研修の双方で、マニュアル理解の評価が必要になった時期があり、谷正之テストはその“評価の空白”を埋めたとされる。具体的には、研修の受講後に「理解度アンケート」を取っても、回答者が設問文の“読み方”に慣れてしまう問題があった。その対策として、原文・欠落・言い換えの3形式が有効だと紹介されたとされる。
この流れの途中で、の教育委員会が管轄校の一部に対して「学習者が例外規則をどれだけ補うか」を測る試行を行ったとされる。ただし、記録は“内部資料扱い”とされたため、外部検証がほとんど進まなかった。その結果、谷正之テストは、現場では便利だが、学術的には再現条件が不明な評価として扱われるようになったと指摘されている[7]。
なお、派手な数字として「平均改善率+12.4%」が語り継がれることがあるが、どの指標に対する改善かは資料によって揺れている。ある回では“手戻り兆候が減った割合”を指すとされ、別の回では“自己矛盾率が下がった割合”とされる。数字だけが独り歩きし、谷正之テストの信頼性をめぐる議論の燃料になったという[8]。
批判と論争[編集]
谷正之テストには賛否がある。主な批判は、評価が“設問文の作り”に依存しすぎる点である。自己矛盾率が上がるのは、受験者が誤っているからではなく、設問が意図的に曖昧だからではないか、という指摘がなされることがある。また、手戻り兆候が鉛筆の削り痕まで対象にする場合、実施者の観察スキルが結果を左右するため、公平性が損なわれるとの見解もある[9]。
一方で擁護側は、谷正之テストは“理解の深さ”というより“誤解の生成過程”を測るものだと反論する。誤解が生まれる場所が分からなければ再教育の設計ができないため、点数は技術的な妥当性ではなく、改善の方向性を示す目安として捉えるべきだという立場である。
さらに論争をややこしくしているのが、“谷の一問”の具体例が資料によって異なる点である。ある資料では換算罠が中心とされるが、別の資料では例外規則(ただし/但し)の扱いが主題になると書かれている。編集合戦のように差し替えが起きた可能性があるとされるが、当事者の記録が残っていないため、結論は出ていないとされる[10]。
脚注[編集]
関連項目[編集]
脚注
- ^ 谷正之『前提のズレを採る評価法』品質教育研究会, 1989.
- ^ 佐藤海斗「原文・欠落・言い換えによる誤解検出の試み」『教育方法学研究』第12巻第4号, 1992, pp. 41-58.
- ^ Margaret A. Thornton「Implicit Assumption Surfacing in Procedural Training」『Journal of Human Systems Engineering』Vol. 18 No. 2, 1997, pp. 101-129.
- ^ 小林智宏「誤解の整合性をスコア化する枠組み」『品質保証年報』第7巻第1号, 2001, pp. 12-27.
- ^ 山崎節「削り痕観察と評価者バイアス」『教育心理技法』第5巻第3号, 2003, pp. 77-86.
- ^ 田村玲「“谷の一問”に関する伝承の整理」『実務評価論叢』第2巻第2号, 2005, pp. 203-219.
- ^ International Society for Training Metrics『Procedural Understanding Metrics』Springfield Press, 2008.
- ^ Hiroshi Tanaka「Reproducibility Gaps in Paper-Based Testing Protocols」『International Review of Assessment』Vol. 26 No. 1, 2011, pp. 55-73.
- ^ 川島ユリ『手戻りを数える現場学』文照堂, 2014.
- ^ 望月真琴「読解テストの“社会的誤読”」『教育社会学通信』第9巻第6号, 2016, pp. 9-24.
外部リンク
- 品質教育研究会アーカイブ
- 手順書と評価の実務ポータル
- 教育評価メソッド資料室
- ヒューマンファクタリング便覧
- 非公開資料の回覧板(代替サイト)