← H/MIX TOOLS
AUDIO COMPARATOR オーディオ比較ツール
LIVE · WEB

H/MIX Audio Comparator

MP3(元) vs ハイレゾWAV(処理後) の精密比較ツール
■ A — Original
音源をドロップ または クリックして選択
■ B — Hi-Res
音源をドロップ または クリックして選択
Space: 再生/停止   X: A/B 切替
0:00 0:00

平均スペクトル比較 (全体のFFT平均)

高域のカットオフ位置と、エキサイターで再構築された帯域が見えます
Original (A) Hi-Res (B)

リアルタイム・スペクトログラム

上: A / 下: B — 再生中の周波数分布を時間軸で表示

波形 / ダイナミクス比較

上: A / 下: B — ダイナミクスの圧縮度合いが視覚的に分かります

数値統計

客観指標による比較
サンプルレート / ビット深度?1秒間を何サンプルで表すか、1サンプルを何ビットで表すか
44100Hz/16bit=CD品質、96000Hz/24bit=ハイレゾ標準。
サンプルレートの半分までの周波数を記録可能(ナイキスト定理)。
目安: B側が A側より高いのが理想(例: 44100→96000)。
数値はファイルヘッダから直接読み取った真の値を表示します。
⚠ マークが付く場合:ブラウザのWebAudioが内部で別のSRにリサンプリングしていますが、ファイル自体のSRは正しい値です。再生・スペクトル分析は内部SRで行われます。
/
チャンネル?モノラル(1ch)かステレオ(2ch)か。ステレオは左右独立の空間表現ができる。音源そのものの性質なので、AとBで一致すべき値。
/
再生時間?曲の長さ。AとBで必ず一致すべき。ズレている場合はそもそも別の曲を比較している可能性がある。
/
RMS (dB)?Root Mean Square — 平均的な音圧
数値が大きい(0に近い)ほど「全体として音が大きい/太い/圧縮されている」。
高い=良い、ではない:高いほど音は派手に聞こえるが、ダイナミクス(抑揚)は犠牲になる。映画音楽なら低い方が、ポップスなら高い方が適切。
A vs B: 通常ほぼ同じ値になる。大きく違う場合はラウドネス処理が異なっている。
/
ピーク (dBFS)?最大音圧 — デジタル上の最大値からの距離
0 dBFS = デジタル最大(クリップ寸前)。-6 dBFS はピークが最大の半分。
大事:低い方が "安全"
MP3は往々にして 0.0 dBFS まで詰められている(クリップ紙一重)のに対し、本ツールは意図的に-0.5 dBFS のヘッドルームを確保して書き出します。
これは後段のマスタリング・音量調整で歪まないためのプロの作法。B側が-0.5〜-1.0 dBFS 程度低いのはむしろ正しい動作で、音質劣化ではありません。
/
クレストファクター?ピーク − RMS。音の "躍動感" の指標。
高いほど ダイナミックレンジが広い=パンチがある。
低いほど 圧縮されている(現代のポップスは6〜10dB、オーケストラは18dB以上)。
エクスパンダーを ON にすると B 側のクレストファクターが少し上がるのが理想的な動作。
/
高域エネルギー >16kHz?16kHz より上の帯域にどれだけ音のエネルギーがあるか(dB単位)。
MP3は16kHz付近でばっさり切り捨てるので、元MP3は通常 -30〜-50 dB の低い値。
B側が A側より高い(= 0に近い)方が理想。ハーモニック・エキサイターが効いていれば +3〜+10 dB 程度の上昇が期待される。
B の方が低い場合:エキサイター処理が弱すぎるか、アップコンバート自体が未実行。
/
周波数ロールオフ?全エネルギーの85%が収まる周波数の上限
この値が高いほど「高域までコンテンツが豊富」。
明るい曲・楽器(シンバル・バイオリン)は高く(5〜10kHz以上)、暗い曲(チェロ・和太鼓)は低い(1〜3kHz)。
A と B で大きく変わらないのが普通。B が A より若干高いのが理想。
※ 曲そのものの性質(アレンジ・楽器構成)に大きく依存するので、絶対値の良し悪しは論じにくい。
/
 各指標の読み方 — 「数値が高ければ良い」とは限らない

■ 基本的な考え方

これらの数値は「A と B の違いを見るため」のもので、絶対値の優劣を論じるものではありません。曲のジャンル・アレンジ・楽器構成で理想値は大きく変わります。

■ 項目別・読み方ガイド

指標高い意味低い意味B(変換後)の理想
サンプルレート広帯域記録可能帯域制限高い(96kHz 以上)
RMS音が太い・派手繊細・ダイナミックA と同程度
ピーク (dBFS)音量限界まで詰まっているヘッドルームあり(安全-0.5〜-1.0 dBFS(ヘッドルーム確保)
クレストファクターダイナミック(躍動感)圧縮されているA と同じか 少し高い
>16kHz エネルギー高域豊富MP3カット後A より +3〜+10 dB 高い
周波数ロールオフ明るい/華やか暗い/落ち着いたA と同程度 or 少し高い

■ よくある疑問

Q. なぜ変換後のピーク値が下がるの?
A. 本ツールは意図的に -0.5 dBFS のヘッドルーム を確保して書き出すためです。MP3 は配信効率のため 0.0 dBFS ギリギリまで詰められていることが多く、そのままだと DAW での追加処理・EQ・リバーブでデジタルクリップ(歪み)が起きます。-0.5 dB ほど余裕を持たせるのがプロの作法で、これは音質劣化ではなく品質向上です。

Q. 数値は高いほど良いの?
A. 指標によります。サンプルレートや高域エネルギーは高い方が良い(情報量が多い)。一方で RMS が高すぎるのは圧縮されすぎ、ピークが高すぎる(=0 dBFS)のはクリップ寸前で危険。クレストファクターは高い方がダイナミックですが、ポップスでは低い方が「売れる音」になることもあります。

Q. AとBの数値がほぼ同じ。変換の意味あった?
A. 音の質感に関する数値(RMS・クレスト)は、処理を最小限にした場合ほぼ変わりません。ハイレゾ化の本質的な価値は「サンプルレート・ビット深度・ヘッドルーム」という技術規格面と、「>16kHz エネルギー」の微増にあります。耳で分かる違いが出るかどうかは、元音源の特性と再生環境次第です。

Q. >16kHz エネルギーが変換後に下がってしまった!
A. バグではなく、現在のDSP設計上の制約です。ハーモニック・エキサイターは元のサンプルレート(44.1kHz)で適用されるため、ナイキスト周波数 22.05kHz までしか倍音を合成できません。より劇的な高域復元には、アップサンプリング後にエキサイターをかけ直すか、AI ベースのスペクトル超解像(AudioSR など)の導入が必要です。

■ 比較の "ベストプラクティス"

1. まずブラインドテストでヘッドフォン装着、ラウドネス補正 ON。
2. 耳だけで判別できるか確認(多くの場合できません — これは正常)。
3. スペクトル / スペクトログラムで視覚的な差を確認。
4. 数値統計で客観指標として記録。
5. 判別できなくても、技術仕様(24bit/96kHz・ヘッドルーム確保)は客観的に事実です。