2021spring

頭外定位音場処理技術「EXOFIELD
(エクソフィールド)」のご紹介

株式会社JVCケンウッド
メディアサービス分野 メディア事業部 ライフスタイルBU 技術部
山口 優美

概要

近年、個人に最適な頭部伝達関数(HRTF)の提供により、より精度の高い頭外定位を可能とする頭外定位音場処理技術が拡がりを見せています。本稿では、その技術の一つとして当社が独自開発した頭外定位音場処理技術「EXOFIELD(エクソフィールド)」についてご紹介します。

ABSTRACT

In recent years, the provision of head-related transfer functions (HRTFs) that are optimal for individuals has led to the spread of out-of-head localization sound field processing technology that enables more accurate out-of-head localization sound fields. In this article, we will introduce “EXOFIELD”, an out-of-head localization reproduction technology that we have independently developed as one of the technologies.

1. はじめに ~ EXOFIELD開発の背景

2020年、私たちの生活スタイルはCOVID-19の影響により、大きく変わりました。緊急事態宣言の発令により外出もままならず、自宅で過ごす時間が多くなりました。結果、エンタテインメントの楽しみ方も大きく変わり、リアル体験の代替え、あるいは「おうち時間」を充実させる一つの手段として有料・無料を問わず動画配信サービスが爆発的な普及とスタンダード化が一気に進んだ年といえます。[参考文献1]

また近年の市況として、技術(商品)開発の現場での高性能プロセッサの普及が一段と進んでおります。より安価に入手が可能で、且つ、より複雑で大容量の演算も高速に処理できるようになりました。さらに市場では、高性能スマートフォンが既に一般的に普及しており、センシングツール化が一層進んでいる状況です。例えばカメラ撮影時における画像情報や位置情報など、多岐に渡る取得情報とディープラーニングなどの機械学習を組み合わせることで、物の自動判別を行ったり、予測をしたり、今まで出来なかったような複雑な処理が可能になりました。

音場処理技術の分野においても、一昔前は代表的な頭部伝達関数(HRTF:Head Related Transfer Function)を使った音場処理が実用上は精一杯でしたが、以上のようなバックボーンを反映し、高度な演算処理による音場処理がより身近な存在になりました。頭や耳の形状・性別など、様々な身体的特徴データの学習により、個人に最適なHRTFを生成する「頭外定位音場処理技術」についても、ここ数年で世界的に注目度が高まっています。

当社においても、2017年3月に独自開発による頭外定位音場処理技術「EXOFIELD」を発表し、同年5月にEXOFIELD技術を初めて搭載した音場特性カスタムサービスである「WiZMUSIC(ウィズミュージック)」を商品化。ヘッドホン環境での頭外定位リスニングの提案は、オーディオファンやメディアから大きな反響をいただきました。

さらに2020年8月には音場をマルチチャンネルに拡張し、加えて独自開発のマッチング抽出技術による「測定の簡素化」と、「パーソナル特性を反映させた最適な音場効果」を両立するワイヤレスシアターシステム「XP-EXT1」の発売など、EXOFIELDは進化を続けています。

今回は当社の独自技術EXOFIELDとは“どのような技術か”、また“どのようなことができるのか”を当該技術搭載の「WiZMUSIC」や「XP-EXT1」の開発背景を交えながら、ご紹介します。

なお、「EXOFIELD」というネーミングの由来は、「EXO(外へ)+ FIELD(フィールド、領域)」を組み合わせた造語で、“今までに無い新しい音場の再現がもたらす、新しい世界への広がり”を意味しています。

2. 頭外定位音場処理技術とは

EXOFIELDは、従来のヘッドホンでは「頭の中に定位していた音場」を、ヘッドホンリスニングでありながら、あたかもスピーカーで聴くような自然な音場と定位を実現した“当社独自方式による「頭外定位音場処理技術」”です。と、言われてもピンと来ないですよね。ですので、まず一般的な頭外定位音場処理の技術概要について、図を交えて説明していきます。

音楽をスピーカーで試聴するスピーカーリスニング(図1左)は、左右のスピーカーの間に音場が形成されます。右チャンネルからギターの音が出力されると、右のスピーカーからユーザーの右耳に届き、少し遅れて左耳に届き、そして部屋の床や壁を反射した音が小さな音量で両耳に次々と届きます。このとき、右耳と左耳には、スピーカーの音質特性、部屋の音響特性、ユーザーの頭や耳の形状による個人特性が全て含まれており、これらの情報によって、人は音場を知覚します。また、正面から聴こえるボーカル音声は、右スピーカーと左スピーカーから同時刻に同じ信号が出力され、直接音が左右の耳にほぼ同時刻に届くことで、左右のスピーカーの中間に音像を知覚します。

一方、ヘッドホンリスニング(図1中央)では、耳のすぐ近くにドライバーユニットが置かれ、耳や頭の近傍に音場が形成されます。右チャンネルからギターの音が出力されると、右のドライバーユニットからヘッドホン内部の空間を反射してユーザーの右耳にのみ届きます。また、音楽のボーカル音声はヘッドホンの左右、各々のドライバーユニットから同時刻に同じ信号が出力されます。右の信号は右耳、左の信号は左耳へ、左右が混ざることなく独立して届くことで、ヘッドホンリスニングでは空間を把握することができず、音像が頭の中に定位してしまいます。

ところが、頭外定位処理を施した音場は、ヘッドホンで再生しているにもかかわらず、スピーカーリスニングと同じ音場を忠実に再現します。例えば、右チャンネルからギターの音が出力されると、音声信号への処理効果により、ユーザーにはきちんと右のスピーカーから再生されているように聞こえます。(図1右)


図1 音場のイメージ
左:スピーカーリスニングの音場、 中央:ヘッドホンリスニングの音場
右:頭外定位処理の音場

この、頭外定位音場処理技術は、以前からサラウンドヘッドホンで親しまれています。
従来のサラウンドヘッドホンでは、信号処理に用いる特性、すなわちスピーカーから耳に届くまでの伝達特性“頭部伝達関数(HRTF)”に、一般的な平均値やある個人の特性を代表値として用いていました。

しかし、頭や耳の形状は、個人によってそれぞれ形が異なることから、特に一定の距離を保って前方へ定位するリアルな音場を再現するためには、リスニングユーザー自身の形状(頭部の形状や大きさ、外耳の形状や大きさ、耳管の形状や長さ等)に合わせた個人に最適なHRTFを提供することがとても重要となります。

では、頭や耳の形状の違いによって、音が耳に届くまでの物理特性すなわち伝達特性がどの程度変わるか見てみましょう。純粋に耳の形状による違いだけを見るため、ヘッドホンのドライバーユニットから耳元までの伝達特性である外耳道伝達関数(ECTF:Ear Canal Transfer Function)を使って比較します。(図2)


図2 被験者A,Bにおける外耳道伝達関数(ECTF)の違い

図2の“ヘッドホンからのインパルス応答”はヘッドホンからパルスを出力した時の耳元マイクにおける応答で、ECTFの時間特性を表し、“ヘッドホンからの周波数応答”は、ECTFの周波数振幅特性を表します。どちらの波形も被験者A・Bでグラフの山(ピーク)や谷(ディップ)が出現する位置や数、形状が異なることが分かります。これは、耳の細かいヒダの形状や耳管の長さが人によって異なることによって、反射や回折の影響、共振する周波数に個人の特徴が現れます。また、同じ被験者の右耳と左耳を比較しても、左右で波形の形状が異なることが分かります。そのため、同じユーザーでも右耳と左耳は同じ特性ではなく、各々について最適なHRTFを提供することが、より精度の高い頭外定位音場を実現する上で重要なポイントとなります。

3. 当社が提案する頭外定位音場処理技術、「EXOFIED」について

では、当社の独自技術である「EXOFIED」と、一般的な頭外定位音場処理技術の違いは、どこにあるのでしょう?

「EXOFIED」の最大の特徴は、頭や耳の形状の違いにより一人ひとり異なるHRTF・ECTFを“個人に合わせて最適化”することにあります。その際、より繊密な最適化を行うために、リスニングユーザーによる測定を最適化プロセスに織り込みます。

最適化のために欠かせない個人特性を得る基本的な方法は、以下の3点です。
①耳元に配置したマイクを使い、リスニングユーザー本人のHRTFとECTFを測定します
②測定したECTFの逆特性を計算し、ヘッドホンの特性をキャンセルします
③リスニングユーザー本人のHRTFとヘッドホン特性の逆特性を入力信号に畳み込むことで、より忠実にスピーカーリスニングの音場を再現します。


図3 「EXOFIELD」個人特性生成アルゴリズムの基本的なイメージ

他方、EXOFIELDの実用化にあたり、最大の課題は「ユーザーの個人特性を取得するための測定方法」にあります。開発当初は、「ユーザー自身によるHRTFの測定は難しすぎる」「ユーザーによる測定環境の違いをどう保障するか」「そもそも汎用的な特性でもいいのでは」という意見もありましたが、それでは従来の技術と変わりありません。「ユーザー本人の特性がBESTである」ことを体験していただきたいという想いから、まずは「究極の頭外定位音場を体現する」ことを目標に掲げ、開発を始めました。これが後に「ビクタースタジオで測定した音場をそのままお持ち帰りいただく」ことをコンセプトに掲げた音場特性カスタムサービス「WiZMUSIC」の実現につながります。

4. 音場特性カスタムサービス「WiZMUSIC(ウィズミュージック)」の概要

WiZMUSICはEXOFIELDを初めて搭載し、商品化した音場特性カスタムサービスです。ユーザーの個人特性を測定・データ化し、最適な頭外定位音場を提供する音場特性カスタムサービスと、音場効果を最大限に引き出すために新開発したハイスペックな専用ヘッドホンやポータブルアンプ等からなるパッケージ商品です。リスニングユーザー本人のHRTFやECTFを実際に測定することで、リスニングルームで聴いたままの音場をリアルに再現することができます。

現在は測定サービスをオプションとしたヘッドホンパッケージのみ扱っています。


図4 音場特性カスタムサービス「WiZMUSIC(ウィズミュージック)」

独自の測定技術

究極の頭外定位音場を実現するために初めに取り組んだことは、測定技術の確立です。できるだけ小さなマイクを探し、試行錯誤の末、耳穴を塞がずに耳元に装着可能な「耳内音響マイク」の開発に成功しました。この超小型のマイクを外耳道の空間に配置することで、頭部や耳の形状だけでなく、外耳道の音場特性までも正確な測定を可能にします。またマイク装着時に、耳の形状の個人差に関わらず、マイクの位置を簡単に理想的な測定位置に固定できるようにすることで、安定した測定と高い測定精度を実現。耳穴を塞がないことで、耳道内の反射も取得できるようになりました。加えて、測定のサンプリングレートを48kHzから96kHzに引き上げたことで、空間表現力が一気に増し、文字通り「世界が変わった!」ことを覚えています。

低域再現の課題に対応

WiZMUSICはリスニングルームで聴いたままの音場をリアルに再現が可能です。ですので、マスター音源の最終チェックにも使われるビクタースタジオ内のリスニングルーム「EX Room」で個人特性の測定を行うことで、EX Roomの”至極の高品位音場”をご家庭で再現いただけます。

EX Roomのスピーカーは口径が大きく、皮膚や骨を伝わって音圧を感じるため、その豊かな低域を再現するのは大変苦労しました。低域の周波数特性だけレベルを上げてしまうと定位が近くなってしまい、よりリアルな定位の維持と豊かな低域の両立は、非常に難しいとされてきました。そこで私たちはスタジオエンジニアの協力を得ながら、スタジオでの試聴と補正処理をはじめとする様々な改善を幾重にも繰り返した結果、ついにスタジオのスピーカーと遜色ない低域の定位と再現性を得ることができたのです。

5. ワイヤレスシアターシステム「XP-EXT1」の概要

XP-EXT1はEXOFIELDの新たな応用として、マルチチャンネルの音場再現に取り組んだ2ndモデルです。WiZMUSICでは「究極の頭外定位を再現」することを命題としていましたが、私たちの技術をより多くのユーザーに体験してもらうためには、測定の簡略化も重要な課題でした。そこで、耳の形状が似ている人同士は伝達特性も似ていることに着目し、「耳介の形状が似ている人同士の伝達特性を用いることで、パーソナル測定時に近い頭外定位効果が得られるのではないか?」という仮説の元、新たにXP-EXT1の開発に取り組みました。

開発の初期段階では、耳元にマイクを装着した状態で、その上からヘッドホンを装着して測定した外耳道伝達関数でマッチングを行っていましたが、さすがにそれでは商品にならないことから、試行錯誤の末にヘッドホン側にマイクを内蔵する構造を採用しました。その結果XP-EXT1は、特に以下の点においてWiZMUSICから大きく進化しました。

1)音場をマルチチャンネルに拡張

WiZMUSICはフロントL/Rチャンネルの2chステレオでしたが、XP-EXT1では、水平面の前後左右だけでなく上方向にも音場を拡張し、上側も含めたマルチチャンネル音場を再現可能にしました。再生コンテンツも、Dolby Atmos®やDTS:X®をはじめとした7.1.4chのマルチチャンネルコンテンツに対応可能です。加えて、従来のステレオコンテンツや5.1ch/7.1chのコンテンツを7.1.4chにアップミックスして楽しむことができます。

2)ヘッドホン内蔵マイクによる「マッチング抽出技術」を新規開発

HRTFの測定を省略し、ヘッドホンに内蔵したマイクで測定したECTFを解析することで、事前に登録したデータベースから耳介の形状が似ている人のHRTFを抽出し、最適なフィルタを生成する抽出アルゴリズムを新規に開発しました。また、抽出アルゴリズムと組み合わせて使用する「個人特性データベースの構築」も新たに行っています。

3)ユーザー自身による測定を可能に。「専用スマートフォンアプリ」を新規開発

WiZMUSICでは、お客様自身が専用の測定ルームまで足を運んでいただく必要がありましたが、XP-EXT1は専用スマートフォンアプリを使ってユーザー自身が自宅で測定することを可能にしました。専用スマートフォンアプリの新規開発と同時に、専用アプリを使ったECTFの測定技術を新たに確立したことで、測定プロセスにおけるユーザーの工数が大幅に改善しました。

4)「専用プロセッサーユニット」を新規開発

スマートフォンから転送された個人特性データをEXOFIELDで再生する専用プロセッサーユニットも、新たに開発しました。4K対応のディスプレイやプロジェクターへの出力に対応したHDMI入出力端子を4系統(入力3系統、出力1系統)装備し、入力は3台までの同時接続が可能です。また、eARC接続にも対応しており、対応する機器を接続することでDolby Atmos®やDTS:X®をそのまま入力することができます。HDMI接続することで、DVDやブルーレイディスク等のメディアコンテンツ以外にも、動画配信サービスのストリーミングコンテンツもEXOFIELDサウンドで楽しむことができます。

ワイヤレスシアターシステム

ワイヤレスシアターシステムは、ワイヤレスヘッドホンとプロセッサーユニットで構成され、2.4GHz/5GHz帯のデュアルバンドワイヤレス伝送で通信します。プロセッサーユニットには、スマートフォンから転送したユーザーデータが最大4件登録できるので、ユーザーデータを切り替えて楽しむことができます。


図5 ワイヤレスシアターシステム「EXOFIELD THEATER XP-EXT1」

専用スマートフォンアプリ

専用スマートフォンアプリから測定メニューを選択すると、ユーザー自身で測定を行うことができます。Bluetooth®でプロセッサーユニットと通信します。


図6 EXOFIELD THEATER専用 スマートフォンアプリ

マッチング抽出技術

マッチング抽出技術*は大きく2種類あります。

HRTFマッチング

ヘッドホンから耳元に配置したマイク位置までの外耳道伝達特性についてクラスタリングを行い、登録したデータベースの中から個人に最適なHRTFを抽出します。

ECTFマッチング

耳元に配置したマイクの位置とヘッドホンに内蔵されたマイクの位置では場所が異なるため、ヘッドホンに内蔵されたマイクで測定したECTFを耳元に配置したマイク位置で測定したECTFに変換するためのマッチング抽出を行います。

*特許取得済


図7 「XP-EXT1」個人特性生成アルゴリズムのイメージ

XP-EXT1アップグレードによる、音場・機能の追加

2021年3月3日にXP-EXT1の専用アプリとファームウェアについて、無償アップグレードを行い、今までの音場「THEATER ROOM 1」に加えて新しい音場「THEATER ROOM 2」を追加しました。THEATER ROOM 2は、低音の出力バランスを最適化するとともに、センターチャンネルの余計な響きを抑えてセリフを明瞭かつ自然に再現し、アクション映画やライブ映像などの視聴をより楽しめるようになりました。音場や機能・アルゴリズムは日々進化しております。アップグレードによってお楽しみ頂けるのも魅力の一つです。

*参考:直近のアップグレードでは、測定する際にRoom1とRoom2のお好きな方を選択可能にしました。ぜひアップグレードによる新しい音場をお楽しみください!

6. まとめ ~ EXOFIELDのさらなる展開

EXOFIELDは、他の技術との組み合わせにより、様々な展開が期待されます。
ヘッドホンだけではなく、イヤホンや他の再生デバイスへの搭載により、様々なデバイスでEXOFIELDのサウンドが楽しめるようになります。また、ノイズキャンセル技術と組み合わせれば、飛行機や電車内など様々なリスニング環境下においても、騒音を気にせずEXOFIELDの音場を持ち運べるようになります。VR技術と組み合わせれば、ゲームや360度収録されたVRコンテンツもリアルな音場再現により、一層の没入感が得られる事でしょう。

EXOFIELDは従来のステレオコンテンツの楽しみ方とは異なる、新しい「音場の楽しみ方」を提案します。最新のコンテンツはもちろん、今まで幾度も視聴したお気に入りのコンテンツも、EXOFIELDによって、新たな魅力を再発見できるかもしれません。
1人でも多くの方々に、この新しい音場の楽しみ方を体験していただき、この「音場を楽しむスタイル」をひとつのスタンダードにするのが密かな野望です。

最後になりますが、本稿をきっかけに、一人でも多くの方がEXOFIELDに興味をお持ちになり、JVCケンウッドが提案する新しい音場を体験していただけたら嬉しく思います。

参考文献

執筆者プロフィール

山口 優美(やまぐち ゆみ)
2006年、株式会社ケンウッド(現JVCケンウッド)入社。2012年から現職にて、頭外定位ヘッドホンの開発を担当。信号処理アルゴリズムの開発に日々邁進中