嘘ペディア
B!

大峠英二

この記事はAIが生成したフィクションです。実在の人物・団体・事象とは一切関係ありません。
大峠英二
生年月日5月17日
没年月日2008年11月3日
国籍日本
研究領域翻訳統計学、学習評価のモデリング
主な所属文部省系研究機構(通称:教育数理研究所)
代表的業績「分節余白法」による訳文品質指数(TQI)提案
社会的影響試験設計と教材制作の指標化

大峠英二(おおとうげ えいじ、 - 2008年)は、日本の「翻訳統計学」と呼ばれる分野を標準化した人物である。〇〇の効率化に関する研究で広く知られ、のちに教育行政にも影響を与えたとされる[1]

概要[編集]

大峠英二は、翻訳の出来を「感想」ではなく「測定値」に落とすことを目標として活動した学者として知られている。とくに「訳文の硬さ」や「読みやすさ」を統計量として定義する試みが、教育現場の採点基準にまで波及したとされる[1]

本人の著作は学術誌だけでなく、雑誌の連載や自治体の研修資料にも流用された。なお、その過程で用いられた指標(後述の)は、時に政治的な判断基準として扱われ、研究者コミュニティでは賛否が割れたと指摘されている[2]

一方で、大峠の評価体系は「翻訳者の個性を消す」との批判も受けた。もっとも、本人は「統計は個性を殺さず、個性が暴れる速度を遅らせる」と語ったとされ、後年の回想録で引用されている[3]

研究と業績[編集]

大峠の中心的な提案は「分節余白法」と呼ばれる手法である。原文と訳文のあいだに置かれた“余白”(単語数、品詞の並び、句読点の密度などの差分)を、分節ごとに累積してスコア化する枠組みとされた[4]

彼は東京都千代田区にある「教育数理研究所」の試作端末で、訳文を半角スペース単位に分解して処理したという。試作端末の記録によれば、同じ文章でも評価の安定度が「±0.8点以内」に収まるまで改善を重ねたとされる[5]。この数字はのちに、現場で“神経質なくらい厳密”だとして有名になった。

また、大峠はの改訂議論の傍聴記録に相当する資料で、TQI(訳文品質指数)を「年度ごとの学力差」ではなく「改善可能性」を測る指標だと説明したとされる。もっとも、後の監査ではTQIが実際には学力差と強く相関しており、設計意図と運用が乖離していた可能性があると報告された[6]

代表的な論文には、訳文の“ねじれ”を「読み手の息継ぎ回数」に例える章がある。息継ぎは実測が難しいため、彼は朗読録音を解析し、1分あたりの呼気間隔を平均値として推定したとされるが、手法の詳細は当時の付録から抜け落ちている。ここだけ、後年の読者が首をかしげる箇所として知られている[7]

歴史[編集]

成立の背景:戦後の「採点疲れ」[編集]

大峠の研究は、戦後の教育現場で「翻訳課題の採点が追いつかない」という問題意識から生まれたとされる。実際に当時は、文部省の外局を横断する形で、教材の採点手順が統一できず現場が疲弊したという指摘があった[8]

大峠が着目したのは、採点者の主観が“ぶれ”として残る点である。彼は試験紙の裏面に採点者が書き残したコメントを収集し、コメントの言語特徴を品詞と頻度で符号化していった。その結果、採点者ごとに「良い訳文」に対して使われる形容が3種類に収束していることを見出したと主張される[9]

ただし、数値の出し方があまりに速かったため、同僚の一部からは「分類が先でデータが後」と疑われた。大峠は反論として、“まず人間を理解してから統計を組む”と述べたが、当時の実験ノートでは分析手順が追記で増えていることがのちに見つかった[10]

分節余白法の「決定版」:大阪での偶然[編集]

分節余白法の決定版は大阪府大阪市での合宿で固まったとされる。教育数理研究所の研究班が、当時新しい教材を作るために英作文と和訳の同時運用を行った際、課題文の一部が印刷ズレで一斉に変形したという事件があった[11]

大峠は、その“ズレ”をそのままデータとして扱い、「偶然の誤植でも評価が成立するなら、方法は頑健である」と結論づけたとされる。合宿の記録では、ズレ量を測るために用いた定規の目盛りが「0.1mm刻み」であることまで明記されており、研究メンバーが「細かすぎる」と笑ったという証言がある[12]

この時期に彼が導入したのが、分節ごとに余白を“1〜9”の階級に丸める規則である。階級は恣意的にも見えるが、運用上は採点者が迷わないようにする狙いがあったと説明された。なお、この“1〜9”が後に全国の研修でそのまま配布されたため、教育現場では「大峠の9段階」と呼ばれて定着した[13]

社会への波及:TQIが自治体へ降りた日[編集]

TQIは研究所内の指標にとどまらず、兵庫県の一部自治体で試験的に採用されたとされる。導入初年度()には、英語の翻訳課題の評価をTQIに置換し、従来の採点を参照値として残したとされる[14]

当該自治体の報告書では、学年全体の平均TQIが「62.4」から「64.9」へ上昇したとされ、上昇幅2.5が“改善の証拠”として扱われた。しかし、別資料では同じ期間に授業時間が週あたり0.8コマ増えていたことが示されている。ここから「指標が改善を説明しているのか、授業設計が説明しているのか」が争点になったとされる[15]

また、TQIは教材会社の採用にも影響した。教材の売り文句として「TQI準拠」や「大峠相性」を掲げる商品が増えたため、学術界では“測定の成果が市場の言葉に変換される速度”への警戒が出たと指摘されている。大峠自身は、その呼ばれ方を嫌いながらも「数字は逃げない。逃げるのは人間だ」と述べたとされる[16]

批判と論争[編集]

大峠の方法は、測れるものを測りたいという欲望を強化したとして批判された。とくにが、訳文の“目的”を無視して汎用の良し悪しに還元している点が問題視されたのである[17]

批判の一つとして、「余白を丸める1〜9階級」が作為的であるとの指摘がある。理論上は連続量を離散化する都合だが、実務では“9が取れない学生は伸びない”という短絡が生まれたとされる[18]

さらに、息継ぎ推定の章に由来する“呼気間隔モデル”について、再現性が低いのではないかという疑義が出た。再現実験では、分析に使われた録音機材の型番が特定できず、委員会は「要出典」とされる注記を複数箇所に残したと記録されている[19]。ここは大峠の評価が割れた最大の要因とされる。

一方で擁護派は、TQIは授業設計の対話を促すための道具であり、点数それ自体が目的化するのは運用側の問題だと反論した。実際に大峠が晩年に関わった研修では、「TQIが下がった回は、訳文だけでなく設問も見直す」といったルールを設けていたとされる[20]

脚注[編集]

関連項目[編集]

脚注

  1. ^ 大峠英二『分節余白法の基礎と応用』教育数理研究所叢書, 1984.
  2. ^ Margaret A. Thornton「Measuring Translation via Whisper-Safe Intervals」『Journal of Applied Linguistic Statistics』Vol.12第2号, 1991.
  3. ^ 佐藤淳也『訳文品質指数(TQI)の設計思想』東海教育出版, 1990.
  4. ^ 川島美咲「分節余白の階級化に関する実務報告」『教育評価研究』第7巻第1号, 1989.
  5. ^ 教育数理研究所『試作端末「S-14」運用記録(機密解除版)』文部省技術資料, 1986.
  6. ^ 相馬勝『TQIと改善可能性の相関:監査メモ』行政監査研究会, 1992.
  7. ^ 林田克巳「呼気間隔推定モデルの再検討」『音声データ解析年報』Vol.5第3号, 1996.
  8. ^ Ono Keiko, Tanaka Ryo「Neighborhood Effects in Phrase Boundary Scoring」『Computational Education Review』第3巻第4号, 2001.
  9. ^ 松本貴志『大阪合宿と偶然の誤植:ある決定版の成立史』関西教材協会, 1998.
  10. ^ 文部省初等中等教育局『翻訳課題評価の統一指針(暫定版)』行政資料, 1987.
  11. ^ 田中亮平『教育指標の市場化と倫理:大峠の数値は逃げるか』青林図書, 2003.
  12. ^ 大峠英二『採点者の形容詞辞典』学習評価選書, 1979.

外部リンク

  • 教育数理研究所アーカイブ
  • 翻訳統計学資料館
  • 自治体研修TQIレポート集
  • 音声解析フォーラム(非公式)
  • 教材会社の「大峠相性」データベース

関連する嘘記事