中村 悠一
| 職業 | 声域研究者、ナレーション技師、公開講師 |
|---|---|
| 専門分野 | 聴覚認知・音声符号化・朗読音響 |
| 活動地域 | を中心に全国 |
| 所属 | 株式会社ナカムラ・フォノロジー研究所(通称:NFIR) |
| 主要手法 | スペクトル・スキャフォールド補正(SS補正) |
| 受賞歴 | 第12回声域工学賞、など |
| 代表的な理論 | “三層母音”モデル |
| ウェブ活動 | 音声公開実験『耳の実験室』 |
中村 悠一(なかむら ゆういち、 - )は、の声域研究者およびナレーション技師として知られる人物である。業界では「声を“測る”技術」を早期に体系化したことで知られ、の現場にも波及したとされる[1]。
概要[編集]
中村悠一は、声優という語の範囲を意図的に越え、音声を「感情表現」ではなく「認知制御」として扱う技術者として語られることが多い人物である。とくに、朗読収録現場で生じる破綻を、スペクトル形状と呼吸タイミングの2変数に分解して再現する方法が注目されたとされる[1]。
人物像としては、系の研究者と同席することが多い一方で、実務の舞台はなどの民間収録スタジオに寄る傾向があると指摘される。講演では「声は楽器ではなく制御信号」といった表現を用い、視聴者の直感を操作する説明が多いことで知られている[2]。
また、中村悠一は“声域を計測する装置”としてを改造し、収録スタジオに持ち込んだとされる。耳鏡プローブは本来、医療用途の試作に由来するとされるが、中村は同機を「朗読の反射パターン最適化」に転用したという経緯が語られている[3]。なお、この経緯は学会資料として確認できる一方で、一部の関係者からは「数字が綺麗すぎる」との批判も挙がったとされる[4]。
概要(業績と評価のされ方)[編集]
中村の評価は、作品単位の人気ではなく、音声品質の再現性により行われることが多い。たとえば、ある公開収録では、同一原稿を3回読み分けた際の母音スペクトルの偏差を平均0.87 dB以内に抑えたとされる。この“0.87”は、当時の音響エンジニアが偶然メモした値として語られており、後に「SS補正の設計目標」として参照されたとされる[5]。
技術的には、母音の軌跡を「前層・中層・後層」に分けるモデルが中村の説明の中心に据えられた。三層母音は、喉頭の運動だけでなく、口腔内の反射とマイクの位相応答まで含む“複合モデル”として説明されている[6]。そのため、モデルは学術的な論文にも登場したが、現場では「覚えるのが面倒」と敬遠されることもあったという[7]。
一方で社会的影響として、収録現場の品質基準が「滑らかさ」から「聞こえの安定性」に移行したとする見方がある。たとえば、が一時期、朗読教材の品質点検に“聞き返し率”を導入した際、協議会が参照した資料に中村の付録が含まれていたとされる[8]。ただし、当時の議事録の一部は紛失しているとも言われており、因果関係の強さには議論が残るとされる[9]。
歴史[編集]
初期の経緯:偶然ではなく設計だったという説[編集]
中村悠一が声の研究に関わった経緯は、当初は「アルバイトで録った声がうまく通った」程度の逸話として語られていた。しかし後年、彼の関係者の一部は、最初の転機がの小規模収録室にあった“設計された事故”だったと述べている[10]。具体的には、1979年生まれの学生が使っていたマイクの周波数応答が故障しており、その歪みを隠すように読み上げる実験を中村が提案した、という筋書きである。
その実験では、歪みを消すのではなく“歪み込みで聞こえを整える”方針が採用されたとされる。中村は、同じ原稿を録音した際に、聞き返しが発生する音節の位置が読んだ速度と一定の関係を持つことを見出し、これをとしてまとめたという[11]。この相関は、のちにSS補正の基礎になったと推定される。
また、彼は当時のノートに「目標誤差は0.9未満」とだけ書き残したと伝えられているが、残っているのは「0.87」と記されたページだけであり、なぜ値が狭まったのかは不明とされる。ここは編集者の間で、出典不確かな“ロマン”として扱われているとも言われる[12]。
技術の完成:NFIRと公開実験『耳の実験室』[編集]
その後、中村はを設立し、測定と制作の往復を制度化したとされる。NFIRは、企業名の割に研究費が小さく、かわりに“共同録音”の参加者を集める仕組みを取り入れたとされる[13]。参加者は全国の朗読サークルから集められ、収録は月4回、1回あたり18名を上限とする運用が採られたという。
この運用の特徴は、毎回同じ部屋を使う代わりに、音響パネルを微細に入れ替える点にある。中村は、音響パネルの入れ替え順序を0から127までの乱数で決め、回ごとのばらつきを統計的に吸収したとされる。結果として、平均逸脱を0.03 dBにまで抑える目標が掲げられたが、実測では0.031 dBだったと語られることもある[14]。
こうしたデータ公開の場として『耳の実験室』が始まった。『耳の実験室』では、視聴者が配布された波形から「どの層の母音が変わったか」を当てる参加型企画が行われた。もっとも、視聴者が当てられる確率は初回で62.4%だったのに対し、2か月目には41.7%へ低下したとされる。この“低下”が支持を得たのは、挑戦感が増したためであると説明されている[15]。
社会的波及:教材と劇伴の“聞こえ基準”への移行[編集]
中村の手法は、字幕やテロップの整備ではなく、朗読音声そのものの安定に影響を与えたとされる。とくに教育機関では、読み上げ教材に対して「聞き返しが起きない」ことが重視されるようになり、点検プロトコルにSS補正の考え方が混入したという[8]。
一部の資料では、の委託で作られた音声教材のチェック表に、三層母音の項目が記されたとされる。もっとも、当該のチェック表は“作成時の原本が公開されていない”ため、参照した経路は推測の域を出ないともされる[16]。そのため、学会では「現場の体感が先に制度を押し上げた」と解釈される傾向がある。
劇伴領域でも波及があったとされ、で行われた試演会では、歌唱のブレス(息継ぎ)位置を0.12秒刻みで制御する試みが報告されたとされる[17]。ただし、この報告は“楽譜”としては残っていないため、再現性の評価は参加者の記憶に依存していると指摘される。
批判と論争[編集]
中村悠一の手法には、理論の複雑さゆえに現場で扱いにくいという批判がある。SS補正は、機材条件だけでなく口腔内反射も仮定するため、スタジオごとの“癖”を前提にする必要があるとされる。この前提が強すぎると、再現するためのコストが上がるとして反対論が出たとされる[18]。
また、数値の整い方が過剰だという指摘もある。たとえば、ある公開配信では「同条件で偏差0.87 dB」が達成されたとされたが、その配信のアーカイブではメタデータの一部が欠落しており、計測条件が“編集された可能性”があるといった噂が立ったとされる[4]。ここは記事編集の際にも議論の対象になり、出典が弱い記述には“要出典的な扱い”が入ったという。
さらに、三層母音モデルが“感情表現の技術”を置き換えてしまうのではないか、という倫理的懸念が示されたことがある。つまり、声を認知制御とみなすことで、俳優の間にある偶然のニュアンスが削がれるのではないか、という批判である。この論点について中村は「偶然を消すのではなく、偶然が破綻しないよう補助する」と反論したとされるが、反論の文書資料は限定的であると指摘される[19]。
脚注[編集]
関連項目[編集]
脚注
- ^ 中村悠一『朗読の位相が聞こえを決める:三層母音入門』NFIR出版局, 2012.
- ^ Margaret A. Thornton『Cognitive Control in Spoken Audio』Cambridge Acoustics Press, 2016.
- ^ 鈴木理紗『スタジオ品質点検の実務:聞き返し率を指標にする』音響技術協会, 2018.
- ^ A. R. Nakam—(誤植を含む)『Spectral Scaffold for Speech Stability』Vol.12 No.3, Journal of Hearing Engineering, 2020.
- ^ 山田健太郎『声域研究の歴史的整理:計測装置の転用文化』日本音声史研究会, 2015.
- ^ Priya S. Desai『Phase Response and Vowel Layers in Narration』Oxford Speech Lab, 第7巻第2号, 2019.
- ^ 渡辺精一郎『朗読教材の標準化とその副作用』文芸音声研究所, 2021.
- ^ 株式会社ディジタル・スタジオ『公開収録手順書(第18版)』株式会社ディジタル・スタジオ, 2023.
- ^ 全国音声品質協議会『聞こえの安定性ガイドライン:測定と運用』第1版, 2022.
- ^ 国立音楽ホール『試演会報告:息継ぎ制御の試み(0.12秒刻み)』国立音楽ホール資料室, 2017.
外部リンク
- 耳の実験室(配信アーカイブ)
- NFIR公式アーカイブ
- 全国音声品質協議会(ガイドライン)
- 音響技術協会:朗読品質講座
- 国立音楽ホール資料室(公開検索)