音声の基礎知識

音声波形の見方と意味|オシロスコープとスペクトラムの違い

2026-04-03

音声波形は音を視覚化したものです。音声処理を行う上で波形を理解することは、EQの効果や音量の変化を目で確認できる重要なスキルです。VideoAudioTuneにはリアルタイム波形表示(オシロスコープ)機能があります。この記事では音声波形の基本的な見方と解釈の方法を解説します。

時間領域波形(オシロスコープ)とは

時間領域波形は、横軸に時間、縦軸に音の振幅(音圧の大きさ)を表したグラフです。オシロスコープはこの時間領域波形をリアルタイムで表示する装置またはソフトウェアです。音が大きいほど波形の縦幅(振れ幅)が大きく、音が小さいほど縦幅が小さくなります。無音部分は波形が中心線(ゼロライン)に収束します。

高い音(高周波数)は波形の波が細かく(高密度で)描かれ、低い音(低周波数)は波形の波が粗く(低密度で)描かれます。複数の音が重なった音楽や会話は、これらが複雑に合成されたより複雑な波形として表示されます。VideoAudioTuneのライブ波形表示はオシロスコープ形式で、再生中の音声をリアルタイムで波形として確認できます。

VideoAudioTuneの波形表示機能

VideoAudioTuneのライブ波形(オシロスコープ)表示は、Web Audio APIのAnalyserNodeを使って実装されています。AnalyserNodeは音声バッファの時間領域データ(TimeDomainData)をリアルタイムで提供し、それをCanvas要素に描画することで波形表示を実現しています。

動画を再生しながらEQプリセットや強さを変更すると、波形の形が変化します。例えばBass Boostを適用すると低音域の成分が増加するため波形の振れ幅の変化が観察できます。プリセット変更の効果を視覚的に確認できる有用な機能で、EQの学習にも役立ちます。拡大ボタンで波形表示エリアを拡大することで、より詳細な波形の変化を観察できます。

周波数領域表示(スペクトラム分析)とは

周波数領域表示(スペクトラム分析)は、横軸に周波数(Hz)、縦軸に各周波数の音量(dB)を表したグラフです。FFT(高速フーリエ変換)によって時間領域データを周波数領域データに変換して表示します。「どの周波数の音がどの程度含まれているか」を視覚的に確認できます。

例えば低音が多い音楽は低周波数(左側)のバーが高く、高音が多い音楽は高周波数(右側)のバーが高くなります。EQで特定の周波数を増幅・減衰させると、その周波数帯のバーの高さが変化します。スペクトラムアナライザーはプロの音楽制作・放送現場で広く使われており、EQの効果を客観的に確認する重要なツールです。VideoAudioTuneの波形表示は時間領域(オシロスコープ形式)ですが、AnalyserNodeを使えばスペクトラム分析も実装可能です。

波形から読み取れる音声の特性

オシロスコープ波形から読み取れる情報をまとめます。音量(振幅):波形の縦の振れ幅。大きいほど音量が大きい。クリッピング(音割れ):デジタルの最大値(±1.0)を超えると波形が「頭打ち」になります。音割れが発生している場合は波形の上下が平坦になります。

DCオフセット:波形が中心線からずれている場合、直流成分(DC成分)が含まれています。これは特定のマイクや機器で発生し、音質に悪影響を及ぼすことがあります。ノイズ:無音のはずの部分(静寂のシーン)に小さな波形が常に存在する場合、背景ノイズが含まれています。ダイナミクス:波形が時間によって振れ幅が大きく変化する場合、ダイナミックレンジが広い(音量の起伏が大きい)音声です。コンプレッサーをかけると波形の振れ幅が均一化されます。

EQ処理と波形変化の関係

EQプリセットを適用すると、音声の周波数バランスが変化し、結果として時間領域の波形の形も変化します。例えば低音を増幅すると波形の「粗い周期」(ゆっくりした振動)の成分が増加するため、波形の全体的な振れ幅が大きくなることがあります。逆に高音域を増幅すると「細かい周期」の成分が増加し、波形のディテールが増します。

VideoAudioTuneの波形表示でプリセットを変えながら波形の変化を観察することで、EQ処理が音声にどう影響しているかを直感的に理解できます。音楽教育・音声処理の学習ツールとしても、リアルタイム波形表示は有用です。この機能を積極的に活用して、EQの効果を耳だけでなく目でも確認する習慣をつけましょう。

まとめ

音声波形は音を視覚化したもので、音量・クリッピング・ノイズ・ダイナミクスなどの音声特性を目で確認できます。VideoAudioTuneのライブ波形表示(オシロスコープ)機能を使って、EQプリセット変更の効果を視覚的に確認しながら音声処理を行うことで、より直感的な音声最適化が可能になります。