動画・音声処理用語集|VideoAudioTune用語を完全解説
2026-04-03
動画・音声処理には多くの専門用語があり、初めて学ぶ方には難しく感じられることがあります。VideoAudioTuneを使いこなすために必要な基本的な用語を、わかりやすく解説する用語集です。
音声処理の基本用語(A〜E)
AAC(Advanced Audio Coding):MPEGグループが開発した非可逆圧縮音声コーデック。MP3の後継で同ビットレートでより高音質。YouTube・iPhoneでの標準音声フォーマット。Audio Codec(オーディオコーデック):音声データをエンコード・デコードするためのアルゴリズム。AAC・MP3・Opusなどが代表例。
Bitrate(ビットレート):1秒間に処理される音声データの量(kbps:キロビット毎秒)。高いほど高品質・ファイルサイズ大。Clipping(クリッピング):音声信号が最大レベル(0dBFS)を超えて発生するデジタル歪み。波形が「クリップされた(切り取られた)」状態になりノイズが生じる。Compressor(コンプレッサー):音声のダイナミクス(最大音量と最小音量の差)を圧縮して音量を均一化するエフェクト。大きすぎる音を自動的に抑える。dBFS(デシベル フルスケール):デジタル音声の音量レベルの単位。0dBFSが最大値で、それ以下はマイナス値(例:-18dBFS)。EQ(Equalizer:イコライザー):音声の周波数特性を調整するエフェクト。特定の周波数帯域を増幅(ブースト)または減衰(カット)する。
音声処理の基本用語(F〜L)
FFmpeg:動画・音声の録画・変換・ストリーミングのためのオープンソースツール。コマンドラインで使用。VideoAudioTuneの内部処理に使用されているffmpeg.wasm(WebAssembly版)のベースとなるツール。FLAC(Free Lossless Audio Codec):可逆圧縮のオープンソース音声コーデック。WAVと同等の音質でファイルサイズを削減。Frequency(周波数):音の高さを表すHz(ヘルツ)単位の値。人間の可聴域は約20Hz〜20,000Hz(20kHz)。
Gain(ゲイン):信号の増幅量。マイクゲインを上げると録音音量が大きくなる。高すぎるとノイズ増加・クリッピングの原因。Headphone(ヘッドフォン):耳を覆うオーバーイヤー型から耳に乗せるオンイヤー型・耳に挿入するインイヤー(イヤホン)型まで多様な種類がある音声再生機器。Hz(ヘルツ):周波数の単位。音声処理ではEQの調整周波数・サンプルレートの表現に使用。kHz(キロヘルツ):1000Hz。サンプルレートは44.1kHz・48kHzなどで表現。LUFS(Loudness Units relative to Full Scale):ラウドネス(知覚的な音量)の単位。YouTube・Spotifyは-14 LUFSを目標値として採用。Latency(レイテンシー):音声処理・伝送における遅延。リアルタイム処理では低遅延が求められる。
音声処理の基本用語(M〜R)
Masking(マスキング):強い音が近隣の周波数の弱い音を「隠す」聴覚現象。MP3・AACの圧縮アルゴリズムに活用。Mono(モノラル):1チャンネルの音声。すべての音が同じ信号で再生される。Noise(ノイズ):不要な音声信号。白色雑音・電気的なハム音・環境音など様々な種類がある。Normalization(正規化):音声ファイルの最大音量を特定のレベルに合わせる処理。
PCM(Pulse Code Modulation):アナログ音声をデジタルに変換する基本方式。WAVはPCMでデータを格納。Peak(ピーク):音声信号の瞬間最大値。Psychoacoustics(心理音響):人間の音の知覚を研究する学問。MP3・AACのコーデック開発に活用。Reverb(リバーブ):音の残響。室内の反射音が重なって生まれる「空間感」。Sample Rate(サンプルレート):1秒間に音声を記録するサンプル(標本)数。Hz単位。44.1kHz(CD品質)・48kHz(動画標準)が一般的。
動画・映像関連用語
Codec(コーデック):データを圧縮・展開(エンコード・デコード)するアルゴリズム。H.264・H.265(映像)・AAC・MP3(音声)などがある。Container(コンテナ):映像・音声・字幕等の複数のストリームをまとめるファイル形式。MP4・MOV・MKV・WebM等がある。Bitrate(映像ビットレート):映像の1秒あたりのデータ量(Mbps)。高いほど高画質・ファイルサイズ大。
Frame Rate(フレームレート):1秒間のフレーム数(fps:frames per second)。30fps(標準)・60fps(滑らか・ゲーム向き)・24fps(映画的)。H.264(AVC):最も広く使われる映像コーデック。YouTube・Netflix・モバイル等ほぼすべてのプラットフォームで対応。H.265(HEVC):H.264の後継で同品質で約50%ファイルサイズを削減。エンコード処理負荷が高い。Resolution(解像度):映像の画素数(横×縦)。720p(1280×720)・1080p(1920×1080)・4K(3840×2160)等。Stream Copy(ストリームコピー):ffmpegの機能で映像・音声を再エンコードせずそのままコピー。高速で品質劣化なし。VideoAudioTuneはffmpegのStream Copyで映像を処理し、音声のみEQ処理する。
VideoAudioTune固有の用語
EQプリセット:VideoAudioTuneが提供するあらかじめ設定されたEQ(イコライザー)設定のセット。Bass Boost・Bass Heavy・Flat・Treble Boost・Voice Clarity・Conferenceの6種類。Bass Boost:低音域(〜250Hz)を強調するEQプリセット。音楽・ゲーム動画の迫力アップに向く。Bass Heavy:Bass Boostよりも強く低音を強調するプリセット。Hip-Hop・EDM向き。
Flat:全周波数を変化させないフラットなEQプリセット。オリジナルの音に忠実な書き出しをしたい場合に使用。Treble Boost:高音域(8kHz〜)を強調するプリセット。アコースティック音楽・映像の空気感向上に。Voice Clarity:声の明瞭さを高めるプリセット。中音域を強調して声が前に出るようにする。解説動画・ナレーション向き。Conference:会議・ウェビナー向けのプリセット。複数の声が混在する環境での明瞭さを最適化。ffmpeg.wasm:WebAssemblyで実装されたffmpegのブラウザ版。VideoAudioTuneはこれを使ってブラウザ上で動画処理を行う。ファイルがサーバーにアップロードされないためプライバシーが守られる。
まとめ
動画・音声処理の用語を理解することで、VideoAudioTuneをより効果的に活用できます。EQ・コンプレッサー・ビットレート・サンプルレートなどの基本概念を押さえた上で、コンテンツの目的に合ったプリセットを選択してください。わからない用語が出てきた際はこの用語集を参照してください。