おとわっか
| 領域 | 音響情報学・聴取技法 |
|---|---|
| 主用途 | 音の“輪郭化”による記録と比較 |
| 成立時期 | 昭和末期〜平成初期(とされる) |
| 主要手法 | オーバートーン輪郭・位相リング・聴取プロトコル |
| 関連機関 | (共同研究) |
| 普及媒体 | 自治体の“音環境”報告書 |
| 代表的な形式 | OTW-RING(仮称) |
| 議論点 | 再現性と倫理(“聴取の偏り”) |
(英: Oto-wakka)は、音の性質を“輪郭”として扱う一連の聴取・記録技術であるとされる[1]。特にの文化計測研究で注目され、音響工学だけでなく図書館学や都市計画にも波及したとされる[2]。
概要[編集]
は、音を単なる波形や周波数成分としてではなく、“輪郭(わっか)”として記述するための考え方とされる。ここで言う輪郭とは、音が持つ立ち上がり・減衰・倍音のまとまり方を、観測者の聴取行動まで含めて一つの指紋のように扱う概念である[1]。
成立の背景には、1970年代後半にの一部自治体が開始した「音環境の見える化」計画があるとされる。この計画では、道路騒音の数値化はできても“うるささの質”が説明できないという問題が残り、そこで聴取者の行動ログを音響パラメータに結びつける研究が進んだという[2]。なお、おとわっかという語は、計測担当者がノイズ除去の過程で作った“リング状”の表示が、口語で「音が輪っかになった」と形容されたことに由来するとされる[3]。
仕組み[編集]
おとわっかの核は、音響信号を「位相リング」「振幅リム」「倍音ラグ」の三層で表す枠組みにあると説明されることが多い。まず位相リングは、時間方向の位相変化をリングとして束ねるもので、次に振幅リムがエネルギーの縁取りを担当する。最後に倍音ラグが、音色の“遅れ”成分を輪郭として固定する[4]。
記録は、OTW-RING(仮称)と呼ばれるフォーマットに整理されることが多い。これは1音あたり最大128セグメントまで分割し、各セグメントに対して「輪郭強度」「輪郭位相」「聴取者補正係数」を紐づける設計とされる[5]。補正係数は一見恣意的だが、“耳の慣れ”を誤差として統計的に吸収するためのものとされ、研究者の間では一定の妥当性があると主張されてきた[6]。
一方で、実運用では“聴取プロトコル”の規格化が必要になる。具体的には、同一音源を測る際の再生音量は、スマートフォンの基準アプリで測った平均出力が「-14.2 dBFS」付近に収まるように調整する、といった細則が自治体配布資料に記載されていたとされる[7]。ただし、その基準値は後年「端末ごとに±3.1 dB程度のズレが出る」と同じ資料内で注記されており、実装者を悩ませたとも記されている[8]。
歴史[編集]
起源:夜間観測と“輪郭の図書化”[編集]
おとわっかの起源は、都市の夜間騒音を“読む”試みとして始まったとされる。1982年、の港湾地域で実施された夜間観測で、観測員が同じサイレンでも時間帯によって「輪っかの締まり具合が違う」と報告したことが発端だったという[9]。当時の報告書は、音を周波数表に押し込むより、輪郭として保存した方が説明が楽だと結論づけているとされる。
このとき関わったとされる研究会が、の職員と、音声図書館(のちのデジタル保存部門)の技術者を繋いだ。そこでは“音の索引”を作るため、図書の分類番号に似せた「輪郭分類体系」が試作されたとされる。体系は当初20分類だったが、運用で誤分類が相次ぎ、2年後に37分類へ増やされたとされる(増加理由は“輪っかが増えたため”と書かれているらしい)[10]。
発展:国際共同のリング規格争い[編集]
1990年代に入ると、おとわっかは学術分野の国際共同研究へ広がったとされる。特にの小規模プロジェクトが、欧州の聴取学者と共同で「リング規格」の統一を試みた。合意形成の中心にあったのは、位相リングの扱いであり、ある会議では「位相リングは信号処理で消せない“記憶”である」と発言した研究者がいたとされる[11]。
しかし、合意には至らず、結局は二派に分かれたとされる。一派は“数学的再現性”を優先し、もう一派は“聴取の共同体一致”を優先した。結果として、規格は完全統一ではなく互換表(マッピング)が作られる形になり、OTW-RINGのバージョン違いによる互換率が議論になったという。ある内部報告書では「互換率は第3層(倍音ラグ)で91.7%に留まった」と記載されているとされる[12]。なお、その数値の出典は複数箇所で「再現実験による」「推定による」と揺れているとされ、後年“編集の揺らぎ”として笑い話の種になったとも書かれている[13]。
社会への波及:音環境行政と“輪郭監査”[編集]
おとわっかは、行政の音環境評価へ波及したとされる。とくにのある沿線で実施された「通勤音の快適度」調査では、朝7時台のホームアナウンスや足音の輪郭が比較され、結果が“快適度パネル”として掲示されたという[14]。このとき導入された概念が、輪郭監査(リング監査)と呼ばれる手続きで、同じ路線でも車両更新で輪郭が変わる場合、監査ログを残す運用が提案されたとされる。
ただし監査は万能ではなかった。ある報告書では、監査員の待機場所(ベンチの右端・左端)だけで輪郭分類が変わり、補正係数が動いたとされる[15]。この事実が“聴取者の立場がデータを汚す”という批判を呼び、のちに倫理ガイドラインが追補されたとされる。にもかかわらず、ガイドライン案には「夜間は照度が低いため聴取者補正係数が平均で-0.6低下する」など、なぜか音以外の条件まで数値化されていたとされる[16]。
批判と論争[編集]
おとわっかには、精密さの裏返しとしての批判があるとされる。第一に、輪郭分類が“使う人次第”になる点が挙げられる。位相リングや倍音ラグは数値で表せるが、最終的な輪郭強度には聴取プロトコルが絡むため、現場運用では「測ったつもりで測っていない」問題が起きることがあると指摘された[17]。
第二に、行政利用の際に“説明責任”がずれる可能性がある。ある裁判例に言及する形で、「おとわっかの結果は科学的証拠として扱えるのか」と問われたことがあるとされるが、記録自体の出典は曖昧にされている[18]。一部研究者は「輪郭監査ログは監査証拠になり得る」と主張した一方で、「ログは監査人の癖も含む」との反論も出たという。
また、誤差の扱いが“統計の言い訳”として消費されることへの懸念もある。実務資料には「補正係数は平均0.0を目標とするが、現場では平均+0.03が観測される」と書かれていたともされる[19]。この+0.03が問題なのか、単なるズレなのかは、読む側の立場に左右されるとして、論争は長期化したと説明されることがある。
脚注[編集]
関連項目[編集]
脚注
- ^ 渡辺精一郎「位相リング記述法の一考察―OTW-RINGの試作報告―」『日本音響学会誌』第58巻第2号, 1991年, pp. 113-128.
- ^ Margaret A. Thornton「Perceptual Boundary Maps for Urban Noise: A Ring-Based Framework」『Journal of Sound and Perception』Vol. 12 No. 4, 1997年, pp. 221-239.
- ^ 高橋良介「音の“輪郭”に関する分類体系の更新履歴」『図書館情報学研究』第21巻第1号, 1994年, pp. 47-65.
- ^ Satoshi Kuroda「聴取プロトコルが統計指標へ与える影響(-14.2 dBFS基準の検討)」『日本音響制御技術報告』第9巻第3号, 1999年, pp. 5-22.
- ^ 山崎朋也「リング監査ログと説明責任―行政利用のための手続設計―」『都市計測学会論文集』第33巻第4号, 2003年, pp. 301-320.
- ^ Claudia M. Reis「Interoperability Tables in Phase-Layer Models」『European Acoustics Review』Vol. 6 No. 1, 2001年, pp. 9-27.
- ^ 【出典不詳】「横浜夜間観測記録(港湾サイレン輪郭報告)」『神奈川港湾技術年報』第17号, 1984年, pp. 88-94.
- ^ 中村綾香「補正係数の実装と端末差:現場データの再検証」『信号処理ケーススタディ』第2巻第2号, 2006年, pp. 77-96.
- ^ Ibrahim Saleh「Ethics of Listener-Dependent Metrics」『International Review of Auditory Methods』Vol. 19 No. 2, 2010年, pp. 145-162.
- ^ 佐藤啓介「おとわっか研究史(暫定版)」『学際音響叢書』第1巻, 2015年, pp. 1-203.
外部リンク
- 音輪郭アーカイブ・ポータル
- OTW-RING互換表ミラー
- 都市音環境評価フォーラム
- 聴取プロトコル配布ページ
- リング監査ログ・ガイド