mp3って何なん?音声フォーマットのいろは [vol.017 難しさ:やさしい]
毎週さまざまな音にまつわる話題をお届けしていますが、今週の話題は音声フォーマットに関する内容です。歌ってみたでも様々な音声フォーマットが扱われますが、なんのこっちゃいという人も少なくないでしょう。
この記事では一般的な音楽制作で使われる音声フォーマットと、どのようなシチュエーションで何を使えば良いのかを初心者さん向けに説明していきます。
こちらの動画と連動した内容です。
<<https://youtu.be/MFp7bXIDf70>>
目次
音声を保存する箱の形 〜ファイル形式〜
音楽制作や歌ってみたをやっていると「wav(ウェブ・ワブ)」や「mp3(エムピースリー)」という単語を目にすることがあるでしょう。これはファイル形式(フォーマット)と呼ばれるもので、音声ファイルの保存方法を示したもの。いわば保存する箱の形のようなものです。
例えば「wav」という箱で録音した場合、「wav」に対応した再生機器でのみ再生することができます。
「mp3」は「wav」とは異なる箱の形です。それぞれ以下のような特徴があります。
wav形式:非圧縮で高音質だが容量が大きい
mp3形式:音声を圧縮したもので、容量が小さいが音質はwavに劣る
ポイントは「圧縮」という言葉。
フォーマットは圧縮と非圧縮に大別できるのです。そして、多くの場合圧縮形式のファイルは非圧縮形式で作られた「マスターファイル」から変換することで生まれます。「wav」から「mp3」のファイルが生まれるということです。
圧縮というとパソコンでよく見るzip形式などを連想するでしょう。しかし大きな違いがひとつ。「wav」から生まれた「mp3」は、「wav」に戻すことが出来ません。これは非可逆圧縮と呼ばれています。

細かいテクノロジーはさておき、覚えるべきはひとつ。mp3はwavより音質が劣り、かつ、mp3はwavに戻せないということです。
高音質で制作したいのであればwav(非圧縮)での録音を行うべきということになります。
記録の細かさを決める 〜ビットレートとサンプリングレート〜
音声を記録する箱の形はwavと決まりましたが、箱の中への詰め方は別の規定が設けられています。ビットレート(ビット深度/解像度)とサンプリングレート(サンプリング周波数)です。それぞれ以下のような設定値があります。
ビットレート(bit):16/24/32 folat(浮動小数点)
サンプリングレート(kHz):44.1/48/88.2/96/176.4/192….
※他にも色々ありますが割愛します
ざっくり説明すると、アナログ信号をデジタル信号に変換する際に、縦横のマス目を切って近似値を拾っていきます。この時のマス目の細かさを決めるのがビットレートとサンプリングレートです。デジタルカメラの解像度と同じようなものだと考えれば良いでしょう。数値が大きいほうが高解像度で記録できますが、データ容量が大きくなります。

どの解像度にするかも好みや経験値が現れますが、迷った時は以下の設定を使ってみてください。
完成作品が動画のみ場合:wav 24bit/48kHz
YouTube投稿用など、動画が完成版となるパターンではwav 24/48という形式がスタンダードであり、ファイルのやり取りにおけるトラブルも少なくなるでしょう。
音声ファイル単体の販売を行う場合:wav 24bit/96kHz
ダウンロード販売や配信など音声ファイル単体での扱いをする場合は24/96がスタンダードになるでしょう。筆者も生演奏を含む楽曲のレコーディングは24/96で行っています。(ジャズやクラシック、パート数の少ない楽曲の場合はさらにハイレートの24/192などを使用することがあります)
解像度の変換は可能ですが、変換によって音質の変化も生じます。変換が少なければ少ない方が好ましいと言えるでしょう。上位から下位への変換(例:24/96→24/48)より、逆の変換(例:24/48→24/96)の方が音質変化が大きくなります。つまり、どのように使うかを最初から想定して録音を始める必要があるのです。
ちなみに、CDのフォーマットはこちら。
CDマスターの場合:wav 16bit/44.1kHz
もはやCDを作成する場合以外は使わないフォーマットになってしまいました。
いずれにせよ、生演奏を含む場合は24/96で制作を進め、最終的に必要な形式に落とす(下位方向に変換)のが良いと思います。
参考:CDフォーマットの44.1kHzは44.1系と呼ばれ、44.1/88.2/176.4kHzを指します。動画の世界は48kHzが主流であり、動画主体の世の中となった今、44.1系を選択する理由はCDマスターを作る場合以外無いと言っていいでしょう。YouTubeでは44.1kHzも96kHz受け付けてくれますが、結局48kHzに変換されています。この変換クオリティがそんなに良くないので、最初から48kHzに合わせた方が高音質化できます。(経験上そう思ってますが定かではありません)
マスターファイルと用途に合わせた変換 〜おすすめ設定〜
ここまでで気づいた人は鋭いです。
録音する時・楽曲制作中の話と、完成後にどうするかという話は全く別の話なのです。それぞれに適切なフォーマットを選択することができます。録音はwav 24/96(またはwav 24/48)が良さそう。では完成品はどのようなフォーマットが良いのでしょう。
録音された素材をミキシングして完成品を作りますが、完成品は「マスターファイル」または単に「マスター」と呼びます。(昔はマスターテープでした)
マスターファイルは録音したフォーマットを維持した最も高音質な状態の完成品であるべきです。24/96で録音したのであれば、24/96以上の高解像度を維持したファイルということになります。
一方で、チェックしてもらうためのファイルや動画作成用に使うファイルは必ずしも24/96を維持している必要がありません。マスターファイルを作成する時にいくつかのフォーマットに変換しておくと良いでしょう。
筆者は以下のような組み合わせ(3種類のフォーマット)をセットにして作ることが多いです。
・マスターファイル:wav 24bit/96kHz
・動画制作用(動画の人に渡します):wav 24bit/48kHz
・再生確認用(メンバーや関係者に渡します):mp3 256kbps & wav 24bit/96kHz
以下の画像は参考ですが、とあるCDアルバムのマスターファイルフォルダです。9曲入のアルバムだったので、フォーマットごとにフォルダを分けそれぞれのフォルダに9つのファイルが入っています。

※DDPというのはCDをプレスする場合の専用のマスターファイル形式です。
mp3 256kbpsの「256kbps」というのはmp3のビットレート(解像度)です。数字が大きいほうが高解像度で音質も向上しますが、データ容量も大きくなります。
参考までに、経験上のmp3オススメビットレートはこちら。
mp3のオススメビットレート(kbps):192/256
192/256以上であれば一般リスナーの方は圧縮されていることに気づかないことが多いです。再生環境が良くないと非圧縮形式と聞き分けが難しいビットレートです。容量を抑えつつ音質を確保するのには上記の設定がお勧めです。
歌ってみたでオフボ音源がmp3の場合はどうする?
歌ってみたの場合、配布されている音源がmp3形式ということがよくあります。特にpiaproでは掲載フォーマットがmp3のみなので、自動的にmp3での配布となります。
先程勉強したようにmp3は非圧縮wavの状態には戻りませんので、気にしても仕方ありません。音質はもともとの音源に劣りますが、mp3のまま進めましょう。
GarageBandやCubaseなど音楽制作ソフトの内部では非圧縮wavで音声処理をしています。オフボ音源を取り込んだ際に問答無用で変換されますので、気にする必要も別途wavに変換する必要もありません。とりあえず音楽制作ソフトに取り込んでしまいましょう。
オフボ音源:mp3
↓
DAW取り込み後
オフボ音源:wav(自動変換)
ボーカル:wav
↓
マスター:wav 24/96
動画用:wav 24/48
その他のフォーマット
代表的なwavとmp3について説明しましたが、他にも様々なフォーマットがあります。仕事で音屋をやらない場合は存在だけ知っていれば十分でしょう。
形式 | 種別 | 特徴 |
MP3 | 圧縮、非可逆 | 圧縮音声フォーマットのはしり。昔はmp3を扱うためにはソフトウェアメーカーがライセンス料を支払う必要があったのですが、その縛りがなくなった(2017年)ため、以降各DAWソフトが標準対応するようになり利便性が向上しました。(筆者の感覚です) |
AAC | 圧縮、非可逆 | 最近の主流。mp3の後継と考えれば良いでしょう。ややmp3よりデータ容量が大きい分音質も優れていると言われていますが、筆者はmp3の方が音が好き、、、(慣れているだけかもしれません。mp3で育っているので、、苦笑) |
FLAC | 圧縮、可逆 | 圧縮ファイルであるものの、元に戻すことができる可逆方式のフォーマット(FLAC=Free Lossless Audio Codec)。ハイレゾ音源の配信でよく使われていますが、TuneCoreやRouter等を通じてハイレゾ配信する場合、FLAC形式のファイルを用意する必要はありません。(wav24/96を用意すればほぼ問題なし) |
ALAC | 圧縮、可逆 | Apple版のFLAC(ALAC=Apple Lossless Audio Codec)。iTunesで使用されている圧縮方式。 |
AIFF | 非圧縮 | 昔Macでよく使われていたリニアPCM(Linear Pulse Code Modulation)形式非圧縮音声フォーマット。wavはWindows、aiffはmacのような不文律があったが、現在はwav一色。もう覚えなくて良いと思います。 |
AIFC | 圧縮、非可逆 | ややこしいのですが、上記AIFFの親戚の圧縮形式です。ほぼ使わないでしょう。 |
WAV (BWF) | 非圧縮 | リニアPCM形式の非圧縮音声フォーマットのスタンダード。WAV形式にBroadcast Waveチャンクという情報を追加するとBWF(Broadcast Wav File)。中身は同じです。 |
DSDIFF DSF | 非圧縮 | DSD(Direct Stream Digital)方式非圧縮音声フォーマット。WAVとは仕組みが違うので互換性はありません。変換も大変です。機会があったら一度聞いてみてください。独特の素晴らしい、柔らかい音がします。 |
このあたりは非常に学術的でもあり、諸説あるので、筆者の説明が的を得ていないと感じる方もいるかもしれません。特に正確に理解するには動画の世界で出てくる「コンテナ」という考え方と仕組みを理解する必要がありますが、音だけいじってるうちはコンテナなどは覚えなくても生きていけます。ここでは、上記のようなフォーマットがあるということだけ知っていれば良いと思います。まずはWAVとMP3を押さえれば大丈夫でしょう。
以下はProToolsとCubaseの書き出し画面。それぞれ選択可能なフォーマットが異なっていることがわかります。


ちなみにmp3の正式名称は「MPEG 1 Audio Layer-3」です。動画でよく見るMPEGのお仲間です。まぁお仲間といえど特に交流は無い訳ですが、、、苦笑。余談でした。
今週の耳トレの音源
今週の耳トレは難易度が高く、動画から再生してもわからないかもしれませんので、以下にファイルを用意しました。ちゃんと聞いてみたい人はこちらから聞いてみてください。
https://drive.google.com/drive/folders/1T0dnwdPlWi9wjFlESgSUnR0HGMrXfNTR?usp=sharing
今週の宿題
今週の宿題はMP3圧縮を体験してみましょう。耳トレと同じ内容です。耳トレでは変換してあるものを聞きましたが、自分で作ってみましょう。
非圧縮形式で1曲、音声ファイルを用意しましょう。ご自分の曲でもOKです。
この音声ファイルを以下の形式に変換して音質の変化を聞いてみてください。できれば短文レポートを書きましょう。
・WAV→MP3 64kbps
・WAV→MP3 192kbps
・WAV→MP3 320kbps
WAVからMP3への変換はiTunes等再生プレイヤーでも可能ですし、DAWに取り込んで書き出し時に指定することも可能です。また、以下のようなオンライン変換サービスもあります。
▼オンラインオーディオコンバーター
https://online-audio-converter.com/ja/
それぞれの設定でかなり音質変化があるはずです。自ずとどのビットレートを使うのが適切か見えてくるでしょうし、ファイルフォーマットを適切に設定することの大切さもわかってくるでしょう。
もし可能であれば、MP3化したファイルを再生しながらスペクトラム・アナライザー(スペアナ)を見てみてください。
MP3では容量を削減するためにLPFを使っています。ビットレートの設定によって異なる設定値のLPFが使われていることが多く、スペアナで見てみると高域がバッサリとなくなっていることが見て取れるはずです。これは最初に知ったときは衝撃的でした。かなりバッサリ切られているんですよ〜。
今週の耳トレの解答
今週の問題は、原音を聞いてから3つの音源を聞き、元の音源と同じものを当てるという内容でした。
解答はAです!
原音は非圧縮WAV形式。マスターファイルからの複製品です。他の3つはMP3に変換したファイルですが、それぞれ以下のビットレート設定です。
音源A:WAV 24bit/96kHz
音源B:MP3 128kbps
音源C:MP3 64kbps
音源D:MP3 192kbps
どう思います?正直なところ192kbpsと原音の判別は難しいと思いませんか?
筆者は、一般リスナーさんにおいては192kbps以上になると再生環境が良くなければ原音との判別はできないと考えています。また、自分の作った曲は判別しやすいのですが、人の曲だと判別しにくいでしょう。このように判別が難しいため「MP3でも、いっか!」となってしまいがちですが、大きい音で、いい環境で再生すれば一目瞭然。特にシンバルを中心に高域のきらびやかさはMP3では保てません。
リスナーさんが全員イヤホンで聞くとは限りません。すんごいオーディオシステムを持っているかもしれません。できるだけ良い音でマスターファイルを作っておきたいものです。
※今週の耳トレについては、動画内においては動画へのエンコード・YouTubeへのアップロードにおいても圧縮の影響を受けていますので、厳密にはWAV→MP3変換の比較にはなりません。原音と同じファイルを当てるゲームだと思ってご了承ください。