声狼
| 分野 | 音響学・民俗学・音声解析 |
|---|---|
| 発想 | 声の自己相似(反射)の様式化 |
| 対象 | 人声、詠唱、遠距離マイク入力 |
| 指標 | 反復間隔と倍音の位相整合 |
| 関連領域 | |
| 成立 | 昭和末期〜平成初期の学際的実務で定着 |
(こえろう)は、声の反射パターンを「狼の遠吠え」のように記号化して扱う音響概念である。主にとの交点で研究され、作中・作業場・舞台のいずれでも応用されてきたとされる[1]。
概要[編集]
は、人間の発声が周囲の壁・地形・道具の材質に反射される過程で生じる、特徴的な時間構造を「狼」と見なして記述する概念である。具体的には、音声波形のうち反射に由来するとされる反復区間(いわゆる“吠えの間”)と、そこに重なる倍音列の位相が、場所に応じて偏る現象を指すとされる[1]。
言い換えると、声が“逃げる”のではなく、環境に“かえってくる”ように聞こえる条件を分類し、分類結果を比較可能な記号列へ変換することで、話者や出来事の再現に近づけるという思想に基づく。なおでは、山間部で古くから語り継がれる「呼び返し」の風習が、現代の計測で再現されるとされ、はその学術版として整理されたと説明される[2]。
初期の研究は舞台音響や博物館展示の最適化から始まったとされるが、のちにの音声鑑定マニュアル草案に相当する内部資料へ波及したともいわれる。実務家の間では、は「録音の上書き保存」ではなく「環境の上書き保存」に近い、という比喩で定義が補強されてきた[3]。
定義と仕組み[編集]
の理論核は、声の反射由来成分を“反復の型”として切り出す点にある。研究者は、波形の振幅包絡から反復間隔のヒストグラムを作成し、そのピークが一定の範囲に収束することを「狼性」と呼んだ。ある報告では、ピーク収束のための許容誤差を“0.13秒以内”と固定し、その条件を満たす入力だけを狼性ありと分類したとされる[4]。
また、反復間隔だけでは不十分であるため、倍音列の位相整合(phase-lock)を追加指標にしたと説明される。ここで用いられるのが、倍音群をn個のバンドに分割し、それぞれの位相差の分散を“遠吠え散度”と名付けた尺度である。遠吠え散度が低いほど、同じ人の声と推定しやすい、という運用が広まった[5]。
一方で、実装上は機材の癖がに混入しやすいと指摘された。たとえば、現場で多用されたポータブルレコーダの出荷ロットが違うと、反射成分の立ち上がりがわずかに早まるため、狼性の判定がずれる場合があるとされる。実務者のメモでは「ロット差は温度25℃をまたぐと急に見える」と記されていた[6]。
このため研究では、(1) 入力の標準化、(2) 反射環境の同定、(3) 解析結果の記号化、という三段の手順が推奨されるようになったとされる。特に(3)において、狼性の記号列が“短い遠吠え”と“長い唸り”の組み合わせとして表現されるのが特徴である。
歴史[編集]
起源:海底通信と山の歌の交差点[編集]
の起源は、昭和30年代の通信実験にあるとする説がある。海上保安庁系の研究班が、沖で行った簡易ソナーの同期実験で、人声の音節が反射波により“規則化”されることを観測したとされる[7]。ただし当時は音響解析ではなく、単なる同期誤差の説明として処理されていたという。
転機は、同じ頃にの非常勤研究員であったが、山間部の聞き取り調査で「呼び返しの間」が決まっている話を記録したことだとされる。渡辺は、聞き手が叫ぶと、谷に反射して返ってくる“同じ長さの間”があると述べ、それが海底通信の同期誤差と“見た目が同じ”と感じたと伝えられる[8]。
この2系統が合流したのが、昭和末期に設立されたの共同プロジェクトである。プロジェクト名は「反復区間の民族学的検証」とされ、参加者は音響技師と民俗採集員の混成だった。資料では、実験室内に木製の板壁を並べ、なおかつ採集した歌詞の母音だけを入力にするという、やけに細かい手順が残されている[9]。
定着:警察鑑定草案と“声狼採取キット”[編集]
平成初期、の関連部局が、振り込め詐欺の電話音声の鑑定精度を上げる目的で、環境由来成分を“手がかり”として扱う方向に動いたとされる。ここでが注目されたのは、反射由来成分が録音の“消える部分”ではなく“残る部分”として機能する場合があったためである[10]。
同時期、現場向けの「声狼採取キット」が試験配布された。キットの構成は、第一に指向性マイク、第二に反射基準用の薄いアルミ板(50×50cm)、第三に温湿度ログ、第四に解析用の紙カード(狼性記号が印字)であったとされる。配布は全国一斉ではなく、の一部署との一部署に計173セットが先行したという記録がある[11]。
ただし実務は理想通りには進まなかった。現場では騒音が多く、反射が“想定より速い”条件が頻発し、狼性判定が過敏になったと報告された。ある改訂版マニュアルでは、反復間隔の許容誤差を0.13秒から0.21秒へ緩めた上で、遠吠え散度の閾値を再設定したとされる[12]。その結果、鑑定の再現性は上がったが、今度は別人の声が同じ狼性記号列に寄る事例が現れ、議論が長引いた。
民俗化:舞台演出としての“反響狼”[編集]
学術と実務の間で揺れたは、やがて芸術側に“逆輸入”された。演出家は、劇場の客席構造を変えると声の返り方が変わり、観客の感じる緊張が同期することを「反響狼の体験設計」と呼んだとされる[13]。
彼女の作品『返せ、名を』では、役者の台詞にわざと短い母音の連続を混ぜ、狼性記号列が一定の形で観測されるタイミングで照明を落とす演出が行われたと報告されている。ある裏方メモには「上手袖で10回、下手袖で9回、舞台中央で11回、計30回の試し吠え」と記されており、計画性の高さが知られている[14]。
一方で観客の一部には“聞こえ方の差”が不快に作用したという。そこで劇場側は、収音マイクの位置を固定し、空調の風向きが反射を歪めないよう調整した。こうしては、もともとの分析用語から、空間体験の設計パラメータへと変質していったのである。
批判と論争[編集]
は、技術としては魅力的であっても、解釈の飛躍が多いと批判されている。反射環境の同定が前提となるが、現場では壁材や距離が不明なことが多く、推定に依存しやすい。さらに「狼性」の閾値が研究室ごとに異なるため、同じ音声でも別の記号列に分類され得るとされる[15]。
また、鑑定へ応用された際には、統計的裏付けの弱さが問題化した。ある内部検討会では、対象音声が“詐取電話の一部分”であり、母音だけ抽出したケースが多かった点が指摘された。母音抽出は分析を安定させるが、話者の固有情報を落とすため、狼性だけで同一性を論じる危険があると議論されたという[16]。
さらに、民俗音響学側からは、が“自然な呼び返し”を過度に機械化しているという異論も出た。「狼性の記号列は、聞き手が“そう聞きたい”方向へ引っ張る」という批判があり、音響解析が物語を作る可能性があるとする指摘である[17]。
一方で肯定側は、閾値や手順を開示して追試可能にすればよいと主張した。実際、研究者は“公開データセット”として、全国5地点で収集した狼性サンプル(合計約12時間分、サンプル数は1,024)を示し、相互検証を促したとされる[18]。ただし、そのデータが一部の機材ロットに偏っていた疑いが後に出て、論争が収束しなかった。
脚注[編集]
関連項目[編集]
脚注
- ^ 渡辺精一郎『反射が教える母音:声の自己相似の民族記録』北海道出版会, 1981.
- ^ 佐倉礼音『返せ、名を:反響狼の舞台設計論』劇場工学叢書, 1996.
- ^ E. L. Hartwell, “Echo-Pattern Taxonomy for Nonlinear Speech Reflection,” Journal of Applied Acoustics, Vol. 42, No. 3, pp. 201-219, 2004.
- ^ 松井啓太『遠吠え散度の推定と閾値最適化』音環境研究所報, 第7巻第2号, pp. 33-58, 2009.
- ^ 田中美咲『警察鑑定における環境由来成分の扱い:声狼採取キットの記録』法科学技術研究, Vol. 15, No. 1, pp. 1-29, 2011.
- ^ 音環境研究所編『反復区間の民族学的検証:AENR共同プロジェクト報告』音環境研究所, 1989.
- ^ 警察庁情報通信分析課『音声鑑定草案(反射型特徴量の試験運用)』警察庁内部資料, 平成4年, pp. 12-47.
- ^ M. K. Serrano, “Phase-Lock Reliability under Room-Dependent Reverberation,” International Review of Sound, Vol. 9, No. 4, pp. 77-96, 2016.
- ^ 戸田幸雄『声の返りを“証拠”にする手順:再現性の壁とその突破』分析技術年報, 第21巻第1号, pp. 10-34, 2018.
- ^ R. Nakamura, “Koe-rou and the Myth of Deterministic Reflection,” The Journal of Folkloric Interfaces, Vol. 3, No. 2, pp. 55-70, 2020.
外部リンク
- 声狼研究アーカイブ
- 音環境研究所・反復区間データポータル
- 声狼採取キット解説ページ
- 反響狼の劇場実験ログ
- 民俗音響学 入門ノート