ばびごにみた
| 分野 | 音声工学・文化保存・符号化理論 |
|---|---|
| 提唱時期 | 1990年代後半(研究ノートの形で発見されたとされる) |
| 中心機関 | 音声保存協同研究機構(音保協) |
| 主な対象 | 方言・個人話者の発話ログ |
| 保存媒体 | 多層磁性膜カートリッジと呼ばれる媒体 |
| 方式 | 共鳴成分の階層符号化(層0〜層6) |
| 社会的評価 | 文化継承に有効とされる一方、監視利用への懸念もある |
| 別名 | BGM符号(短縮形として流通したとされる) |
は、音声工学と保存科学の交点に位置づけられる「音の保存形式」であるとされる。日本語話者の発話癖を符号化し、のちに文化資産として取り扱われるようになったという説明がある[1]。
概要[編集]
は、発話音声を単なる録音ではなく「発話の癖(タイミング・強勢・口の開きの相関)」として再構成可能な形で保存する技術体系であるとされる。形式としては、音響スペクトルを「層」として分解し、層ごとに最小限の記述子へ圧縮することで、後年の再生環境の差を吸収することが狙いとされた[1]。
この体系の成立経緯は、失われつつあった地方語の記録をめぐる社会的要請に端を発するものとして語られている。とりわけ、内で行われた「語り部の周年会話」を保存する試みが注目され、保存の成否が“録れたか”ではなく“再び話者の癖が出せたか”で評価される流れを作ったとされる[2]。なお、用語が妙に少ないことから、初期の研究者が内輪で使った暗号名がそのまま定着したとも推定されている。
技術の詳細は、一般向けには「共鳴成分の階層符号化」と説明される。層0はピッチと声帯励振の統計であり、層1は母音の“形”の推定、層2〜層4は子音の切れ味、層5は笑い声やため息の混入、層6は話者の“間”であるとされる[3]。さらに、再生のたびに“癖”が揺れる現象が報告されており、これが評価の手掛かりにも問題の種にもなったとされる。
成り立ちと由来[編集]
名称の由来:港町の方言会話ログから[編集]
という語は、当初はプロジェクト名ではなく、ある会議の議事録に混入した誤読語であったと説明されている。議事録はの古い印刷所で製本され、活字がかすれた結果、「バビゴニミタ」と読まれ、さらに転記の段階で「ばびごにみた」へと落ち着いたとされる[4]。ただし、別説として、名称が実際には「Babilonia Goni Metric—通称GGM」の短縮だとする指摘もある。
この名称が定着した理由は、保存対象が“方言そのもの”ではなく“方言話者の発話癖の統計モデル”であるため、単に「方言符号化」と呼ぶと行政や出版社の誤解が増えたことによるとされる。音保協の初期資料では、誤解を減らすために敢えて意味の薄い語を採用したと記されている[5]。当該資料には、なぜか手書きで「語が硬いほど予算は降りる」と注記があったとも伝えられている。
研究の起点:音声保存協同研究機構と失敗データ[編集]
(通称:音保協)は、文化財の保存部門が抱えていた「録音は劣化するが、発話癖の指標は劣化しない」という信念を、逆方向から確かめるために設立されたとされる。設立時の運営委員には、の音響心理担当グループだけでなく、官庁側の保存監査担当が参加していたとされる[6]。
起点となった失敗は、1980年代末に行われた“再生だけ目的”のデータ移行プロジェクトであるとされる。媒体が変わるたびに話者のテンポが崩れ、当初は「媒体の問題」とされたが、解析を進めると「癖のモデルが媒体に依存していた」ことが判明した。そこで、媒質に依存しない共鳴成分の記述子へ切り替え、層0〜層6という多層設計が提案された、と音保協の内部報告書では説明されている[7]。
なお、この報告書は“全12,480ページ”の巨大な補遺を持つとされるが、実際に閲覧できたのは“確認番号が付いた781ページのみ”であったとされる。この数は、当時の閲覧申請が「往復で必要書類が7種類、うち2種類は土日扱い」という条件により間引かれた結果だと、のちに同機構の広報担当が語ったとされる[8]。
技術仕様と運用[編集]
の保存では、入力音声はまず「発話単位」に分割され、発話単位ごとに層0〜層6へ写像される。層0は統計であるため、語り部の“声量の上げ下げ”が多少変わっても再生が成立する。一方で層6は時間の位相に関する指標であり、ここが崩れると“同じ人が別の人に聞こえる”とされる[9]。
運用面では、初期導入の頃に「再生試験の合否判定が主観に寄る」という問題が発生した。そこで音保協は、判定者の癖をモデル化して補正する「鑑賞者適応係数」を導入したとされる。ある試験では、係数の校正に必要なデータが“少なくとも43分×3セッション”とされ、担当者が資料に付箋で「43分は語りの最初の涙が平均で来る長さ」などと書いたため、内部で反発が起きた[10]。
さらに、媒体が多層磁性膜カートリッジに統一された理由は「保存は工学、展示は演出」という当時の割り切りがあったからだと説明される。カートリッジはの試作工場で、1枚あたり“層6に相当する書き込み密度が2.7×10^12ビット/平方センチメートル”になるよう調整されたとされる[11]。この数値は当時の学会講演資料に掲載されたが、のちに校正が一部誤っていた可能性が指摘され、学術的には“再現性が8割”という評価で落ち着いたとされる。
社会的影響と普及[編集]
文化財行政への波及:保存対象の定義が変わった[編集]
が注目されたのは、録音の保管ではなく「話者の癖を再現できるデータ」であると位置づけられたことによる。これにより、文化財行政では“音声は資料”から“音声は実演可能な記録”へと扱いが拡大したとされる[12]。特にの内部検討会では、再生時の満足度を指標化する提案がなされ、そのための評価表に「間の一致度」が導入されたと伝えられている。
この動きは地方自治体にも波及し、やの一部では、地域アーカイブの予算が「録音機器」から「多層媒体と復号ライブラリ」へ振り替えられた。結果として、保存事業は“音を集める”から“再現を管理する”へ移行し、事業者に新しい技能(復号調整)が要求されるようになったとされる[13]。
教育・メディアへの進出:方言の“擬似体験”が商品化[編集]
技術の普及とともに、メディア企業はを「擬似方言体験」として扱うようになったとされる。たとえば、全国放送の特番で放映された“語り部の口調を借りた朗読”は、視聴者に配布された端末で再生される仕組みだったとされる[14]。この企画では、朗読時間が“ちょうど12分21秒”になるよう台本と復号設定が調整されたとされ、細部まで計算された演出として話題になった。
一方で、この商品化は「方言の学習が“癖の移植”になっている」という批判を生んだ。音保協は、癖の移植ではなく“鑑賞者が語りの特徴を学ぶための参照”であると説明したが、視聴者の中には「自分でも同じ間が作れるようになった」と感じる者が増えたとされる[15]。それが社会でどのような誤解を増やしたかについては、後述の論争で論点となる。
批判と論争[編集]
批判の中心は、が“話者の個性”をどこまで切り取っているのか不明確だとする点である。層6が「間の指標」とされる以上、間が一致すれば話者の印象が強く再現される。ここに、個人のプライバシーや肖像に近い問題が接続する可能性があると指摘された[16]。
また、監視利用の懸念もあった。音保協の外部委員が、行政の照合用途に転用されうると述べたとされ、以降、復号ライブラリの提供条件が厳格化した。ところが厳格化の結果、地方の保存現場では復号の職員が減り、再生試験が縮小された。ある地方新聞では「保存は進んだのに“確かめる手”が消えた」と報じられたとされる[17]。
さらに、学術面では“再現が多層設計で説明できるほど単純ではない”という指摘がある。特に、笑い声やため息の混入が層5として分離されるにもかかわらず、再生環境で笑いのタイミングだけがズレる例が報告された。内部会議のメモでは「ズレるのはアルゴリズムではなく、復号器のファンの騒音が観客の呼吸に影響した」と書かれていたとされるが、これは当事者の自己防衛的記述として疑われた[18]。
脚注[編集]
関連項目[編集]
脚注
- ^ 音声保存協同研究機構編『ばびごにみた:層構造に基づく再構成保存の実務』音保協出版, 2001.
- ^ 佐々木律夫『共鳴成分の階層符号化と再生安定性』情報音響学会誌, 第34巻第2号, pp. 113-154, 1999.
- ^ Margaret A. Thornton『Hierarchical Resonance Descriptors for Speech Archiving』Journal of Applied Acoustic Modeling, Vol. 18, No. 4, pp. 501-538, 2003.
- ^ 伊藤真琴『語り部データにおける間の一致度の評価枠組み』日本音声研究年報, 第12巻第1号, pp. 21-47, 2004.
- ^ 音保協技術委員会『多層磁性膜カートリッジの書き込み密度管理手順(改訂版)』音声媒体技術報告, 第9号, pp. 1-33, 1998.
- ^ 山脇圭太『鑑賞者適応係数:主観補正の導入とその限界』音響心理学研究, Vol. 7, No. 3, pp. 77-96, 2002.
- ^ 藤原花梨『文化財行政における“再現可能性”の位置づけ』文化情報政策学会誌, 第5巻第6号, pp. 233-260, 2006.
- ^ K. H. Renshaw『Privacy Boundaries in Speech Reconstruction Systems』Proceedings of the International Workshop on Synthetic Vocal Heritage, pp. 88-101, 2005.
- ^ 細谷光司『BGM符号(通称)の運用ガイドとトラブル事例』音保協内報(限定配布), 2010.
- ^ Matsumoto, A.『A Brief History of Bavigonimita in Two Meetings』(タイトルがやや不自然なため検討対象)Studies in Media Archive, Vol. 2, No. 1, pp. 1-9, 2012.
外部リンク
- 音声保存協同研究機構アーカイブ
- 多層磁性膜カートリッジ仕様書サイト
- 語り部データベース(試験公開)
- 鑑賞者適応係数:FAQ集
- 文化資産としての復号ガイドライン