平均スペクトル比較 (全体のFFT平均)
高域のカットオフ位置と、エキサイターで再構築された帯域が見えますリアルタイム・スペクトログラム
上: A / 下: B — 再生中の周波数分布を時間軸で表示波形 / ダイナミクス比較
上: A / 下: B — ダイナミクスの圧縮度合いが視覚的に分かります数値統計
客観指標による比較44100Hz/16bit=CD品質、96000Hz/24bit=ハイレゾ標準。
サンプルレートの半分までの周波数を記録可能(ナイキスト定理)。
目安: B側が A側より高いのが理想(例: 44100→96000)。
数値はファイルヘッダから直接読み取った真の値を表示します。
⚠ マークが付く場合:ブラウザのWebAudioが内部で別のSRにリサンプリングしていますが、ファイル自体のSRは正しい値です。再生・スペクトル分析は内部SRで行われます。
数値が大きい(0に近い)ほど「全体として音が大きい/太い/圧縮されている」。
高い=良い、ではない:高いほど音は派手に聞こえるが、ダイナミクス(抑揚)は犠牲になる。映画音楽なら低い方が、ポップスなら高い方が適切。
A vs B: 通常ほぼ同じ値になる。大きく違う場合はラウドネス処理が異なっている。
0 dBFS = デジタル最大(クリップ寸前)。-6 dBFS はピークが最大の半分。
大事:低い方が "安全"。
MP3は往々にして 0.0 dBFS まで詰められている(クリップ紙一重)のに対し、本ツールは意図的に-0.5 dBFS のヘッドルームを確保して書き出します。
これは後段のマスタリング・音量調整で歪まないためのプロの作法。B側が-0.5〜-1.0 dBFS 程度低いのはむしろ正しい動作で、音質劣化ではありません。
高いほど ダイナミックレンジが広い=パンチがある。
低いほど 圧縮されている(現代のポップスは6〜10dB、オーケストラは18dB以上)。
エクスパンダーを ON にすると B 側のクレストファクターが少し上がるのが理想的な動作。
MP3は16kHz付近でばっさり切り捨てるので、元MP3は通常 -30〜-50 dB の低い値。
B側が A側より高い(= 0に近い)方が理想。ハーモニック・エキサイターが効いていれば +3〜+10 dB 程度の上昇が期待される。
B の方が低い場合:エキサイター処理が弱すぎるか、アップコンバート自体が未実行。
この値が高いほど「高域までコンテンツが豊富」。
明るい曲・楽器(シンバル・バイオリン)は高く(5〜10kHz以上)、暗い曲(チェロ・和太鼓)は低い(1〜3kHz)。
A と B で大きく変わらないのが普通。B が A より若干高いのが理想。
※ 曲そのものの性質(アレンジ・楽器構成)に大きく依存するので、絶対値の良し悪しは論じにくい。
各指標の読み方 — 「数値が高ければ良い」とは限らない
■ 基本的な考え方
これらの数値は「A と B の違いを見るため」のもので、絶対値の優劣を論じるものではありません。曲のジャンル・アレンジ・楽器構成で理想値は大きく変わります。
■ 項目別・読み方ガイド
| 指標 | 高い意味 | 低い意味 | B(変換後)の理想 |
|---|---|---|---|
| サンプルレート | 広帯域記録可能 | 帯域制限 | 高い(96kHz 以上) |
| RMS | 音が太い・派手 | 繊細・ダイナミック | A と同程度 |
| ピーク (dBFS) | 音量限界まで詰まっている | ヘッドルームあり(安全) | -0.5〜-1.0 dBFS(ヘッドルーム確保) |
| クレストファクター | ダイナミック(躍動感) | 圧縮されている | A と同じか 少し高い |
| >16kHz エネルギー | 高域豊富 | MP3カット後 | A より +3〜+10 dB 高い |
| 周波数ロールオフ | 明るい/華やか | 暗い/落ち着いた | A と同程度 or 少し高い |
■ よくある疑問
Q. なぜ変換後のピーク値が下がるの?
A. 本ツールは意図的に -0.5 dBFS のヘッドルーム を確保して書き出すためです。MP3 は配信効率のため 0.0 dBFS ギリギリまで詰められていることが多く、そのままだと DAW での追加処理・EQ・リバーブでデジタルクリップ(歪み)が起きます。-0.5 dB ほど余裕を持たせるのがプロの作法で、これは音質劣化ではなく品質向上です。
Q. 数値は高いほど良いの?
A. 指標によります。サンプルレートや高域エネルギーは高い方が良い(情報量が多い)。一方で RMS が高すぎるのは圧縮されすぎ、ピークが高すぎる(=0 dBFS)のはクリップ寸前で危険。クレストファクターは高い方がダイナミックですが、ポップスでは低い方が「売れる音」になることもあります。
Q. AとBの数値がほぼ同じ。変換の意味あった?
A. 音の質感に関する数値(RMS・クレスト)は、処理を最小限にした場合ほぼ変わりません。ハイレゾ化の本質的な価値は「サンプルレート・ビット深度・ヘッドルーム」という技術規格面と、「>16kHz エネルギー」の微増にあります。耳で分かる違いが出るかどうかは、元音源の特性と再生環境次第です。
Q. >16kHz エネルギーが変換後に下がってしまった!
A. バグではなく、現在のDSP設計上の制約です。ハーモニック・エキサイターは元のサンプルレート(44.1kHz)で適用されるため、ナイキスト周波数 22.05kHz までしか倍音を合成できません。より劇的な高域復元には、アップサンプリング後にエキサイターをかけ直すか、AI ベースのスペクトル超解像(AudioSR など)の導入が必要です。
■ 比較の "ベストプラクティス"
1. まずブラインドテストでヘッドフォン装着、ラウドネス補正 ON。
2. 耳だけで判別できるか確認(多くの場合できません — これは正常)。
3. スペクトル / スペクトログラムで視覚的な差を確認。
4. 数値統計で客観指標として記録。
5. 判別できなくても、技術仕様(24bit/96kHz・ヘッドルーム確保)は客観的に事実です。