非可逆圧縮(ロッシー圧縮)

読み方 : ヒカギャクアッシュク(ロッシーアッシュク)

用語解説

非可逆圧縮とは、耳の聴覚特性をもとに音成分を選択的に抽出して圧縮する手法で、ファイルサイズを小さくできますが復元後は圧縮前のデータと同一になりません。MP3やAACなどが代表的な方式です。

詳細な解説を読む

今日非可逆圧縮(ロッシー圧縮)と呼ぶときには、人間の聴覚能力をモデル化した聴覚心理モデル(Psycho Acoustic Model)を利用した高能率符号化方式による圧縮方式を意味することがほとんどです。この技術は、人間の耳では知覚されないとされる音を識別してこれらの成分を取り除くことにより圧縮を行う手法で、音響心理学の研究成果を基にしています。具体的には、人間の耳が周波数特性を持っており周波数ごとに音の検知限(マスキングスレッショルド)が異なること、また、聴きたい音とノイズが混在しているとき、ノイズと聴きたい音とのレベル差、周波数差、ノイズの成分により、聴きたい音の検知限が異なること、等の知見に基づき、検知源を下回る成分を抽出し、”知覚されない”音として取り除きます。どういうモデルを用いるか、また検知限をどう計算するか、などによりいくつもの方式が提案されています。よく知られた方式としては、MP3やAACなどがあります。いずれも、限られた容量の記憶媒体にデータを格納したり、帯域の制限された伝送路で劣化の少ない音響信号を伝送したりするような用途を念頭に開発されました、圧縮率は用途により選択可能で、圧縮率を大きくとれば原信号の1/10以下のサイズにすることも可能ですが、圧縮率と音声品質とは反比例の関係にあります。

一覧に戻る