最新のオーディオ録音フォーマット。 最高品質のサウンドフォーマット

19.08.2019 ウィンドウズ

最近、次のような手紙を受け取りました。

こんにちは。MP3 は最も人気のあるオーディオ形式ですが、AAC、FLAC、OGG、WMA など他にもたくさんあるため、どれを使用すればよいのかわかりません。 それらの違いは何ですか?音楽を保存するにはどちらを使用する必要がありますか?

この質問は非常に人気があるので、簡単に、しかし明確に答えてみます。

ロスレスとロッシーの違いについてはすでに説明しましたが、要するに、オーディオ品質には 2 つのタイプがあります。

  • ロスレス: FLAC、ALAC、WAV。
  • 非可逆: MP3、AAC、OGG、WMA。

ロスレス形式は、ほとんどの場合 CD レベルの完全なオーディオ品質を維持しますが、非可逆形式はスペースを節約するためにファイルを圧縮します (もちろん、オーディオ品質は低下します)。

非圧縮データ保存形式: FLAC、ALAC、WAV など

  • WAVとAIFF: WAV と AIFF はどちらもオーディオを非圧縮で保存します。つまり、元のオーディオの正確なコピーです。 2 つの形式は本質的に同じ品質です。 データの保存方法が少し異なるだけです。 AIFF は Apple によって作成されているため、以下でよく見かけるかもしれません。 アップル製品、WAV はほぼ普遍的です。 ただし、非圧縮であるため、不必要なスペースを多く占有します。 オーディオを編集しない場合は、オーディオをこれらの形式で保存する必要はありません。
  • FLAC: Free Lossless Audio Codec (FLAC) は最も人気のあるロスレス オーディオ ストレージ形式であり、適切な選択肢です。 WAV や AIFF とは異なり、データがわずかに圧縮されるため、使用するスペースが少なくなります。 ただし、ロスレスオーディオを保存する形式とみなされ、音楽の品質は元のソースと同じままであるため、WAV や AIFF よりも効率的に使用できます。 無料でオープンソースです。
  • アップルロスレス: ALAC とも呼ばれる Apple Lossless は FLAC に似ています。 これは軽く圧縮された形式ですが、音楽は品質を損なうことなく保存されます。 圧縮は FLAC ほど効率的ではないため、ファイルは少し大きくなる可能性がありますが、iTunes と iOS では完全にサポートされています (FLAC はサポートされていません)。 したがって、iTunesとiOSをメインとして使用している場合は、 ソフトウェア音楽を聴くには、この形式を使用する必要があります。
  • エイペー: APE - ロスレス音楽ストレージのための最も積極的な圧縮アルゴリズムを備えています。 最大限の節約場所。 音質はFLAC、ALACと同じですが、互換性の問題がよくあります。 さらに、この形式を再生すると、データが高度に圧縮されているため、デコードするためにプロセッサに非常に高い負荷がかかります。 一般に、使用可能なメモリに制限があり、ソフトウェアの互換性に問題がある場合を除き、この形式の使用はお勧めしません。

圧縮オーディオ保存形式: MP3、AAC、OGG など


今ここで音楽を聴きたいだけの場合は、非可逆形式を使用している可能性があります。 大量のメモリを節約し、より多くの曲を保存できるスペースを確保します。 ポータブルプレーヤー、十分に高い場合は、元のソースと区別できなくなります。 遭遇する可能性が高い形式は次のとおりです。

  • MP3: MPEG Audio Layer III (MP3) は、最も一般的な非可逆オーディオ ストレージ形式です。 あまりにもそれは、ダウンロード可能な音楽の代名詞になっています。 MP3 はすべての形式の中で最も効率的というわけではありませんが、最もよくサポートされているのは間違いなく、圧縮オーディオ ストレージとしては最適な選択肢です。
  • A.A.C.: AAC とも呼ばれるアドバンスト オーディオ コーディングは MP3 に似ていますが、MP3 の方がわずかに効率的です。 これは、MP3 と同じ音質でありながら、より少ないスペースを使用するファイルを作成できることを意味します。 現在、この形式の最も優れた伝道者は Apple の iTunes であり、AAC の人気が高まり、MP3 とほぼ同じくらい広く知られるようになりました。 AAC を再生できないデバイスはここ数年で 1 台だけでした。それは数年前のことなので、この形式を安全に使用して音楽を保存できます。
  • オッグ・ヴォルビス: Ogg コンテナを使用するため Ogg Vorbis として知られる Vorbis 形式は、MP3 および AAC の無料の代替手段です。 その最大の特徴は、特許に限定されるものではなく、あなた自身を対象としたものであることです。 エンドユーザー、これはまったく効果がありません。 実際、そのオープン性と同様の品質にもかかわらず、MP3 や AAC よりも人気が低く、これをサポートするプログラムが少ないことを意味します。 したがって、ソフトウェアの互換性の問題を回避するためにこれを使用することはお勧めしません。
  • WMA: Windows Media オーディオは、MP3 や AAC に似た Microsoft 独自の形式です。 他の形式に比べて利点はなく、Windows プラットフォーム以外ではあまりサポートされていません。 すべての音楽が Windows プラットフォームまたはこの形式と互換性のあるプレーヤーで再生されることが確実でない限り、CD をこの形式にリッピングすることはお勧めしません。

それで、何を使えばいいのでしょうか?

各形式の違いを理解したところで、音楽のリッピングまたはダウンロードにはどちらを使用すべきでしょうか? 一般に、MP3 または AAC の使用をお勧めします。 これらはほぼすべてのプレーヤーと互換性があり、どちらもオリジナルと区別できません。 特別なニーズがない限り、MP3 と AAC が最適です。

ただし、FLAC のようなロスレス形式で音楽を保存する場合には、言うべきことがあります。 おそらくもう気付かないだろうが 高品質非可逆形式を別の非可逆形式 (AAC から MP3 など) に変換すると、ファイルの品質が著しく低下するため、後で他の形式に変換する予定がある場合は、ロスレス形式で音楽を保存するのに最適です。 したがって、アーカイブ目的には FLAC をお勧めします。。 ただし、ファイルの品質を変更せずにロスレス形式間で変換できるため、任意のロスレス形式を使用できます。

さまざまなオーディオ ファイル形式を見ていきます。

ウェーブ (.wav)- 最も普及している サウンドフォーマット。 Windows OS でサウンド ファイルを保存するために使用されます。 これは RIFF (Resource Interchange File Format) 形式に基づいており、任意のデータを構造化された形式で保存できます。 音声ファイルは大きいため、音声の録音にはさまざまな圧縮方法が使用されます。 最も単純な圧縮方法はパルス符号変調 (PCM) ですが、これでは十分な圧縮が得られません。

AU (.au、.snd)- Sun ワークステーション (.au) および NeXT オペレーティング システム (.snd) で使用されるオーディオ ファイル形式。 インターネット上で普及し、開発の初期段階で標準フォーマットの役割を果たしました。 音声情報.

MPEG-3 (.mp3)- オーディオ ファイル形式。現在最も人気のある形式の 1 つです。 人間の音声以外の音を保存するように設計されています。 音楽録音をデジタル化するために使用されます。 以前のバージョンの形式: MP1 および MP2。 エンコード時には、人間の耳に知覚しにくい音がメロディーから除去される音響心理圧縮が使用されます。 初期のバージョンでは圧縮率は劣りますが、再生時のコンピュータ リソースへの要求は低くなります。 プロセッサーの特性は音質に直接影響します。プロセッサーが弱いほど、音の歪みが大きくなります。

MIDI (.mid)- 楽器のデジタルインターフェース (Musical Instrument Digital Interface)。 この規格は、80 年代初頭に電子楽器とコンピューターのために開発されました。 MIDI は、音楽とサウンド シンセサイザー間のデータ交換を定義します。 さまざまなメーカー。 MIDIインターフェースは伝送プロトコルです 音符そしてメロディー。 しかし、MIDI データはデジタル オーディオではなく、音楽を数値形式で記録する短縮形です。 MIDI ファイルは、ピアノの鍵盤を押す、ノブを回すなどのアクションを記録する一連のコマンドです。 MIDI ファイル再生デバイスに送信されるこれらのコマンドはサウンドを制御します。小さな MIDI メッセージによって、楽器やシンセサイザーでサウンドまたはサウンドのシーケンスが再生されるため、MIDI ファイルが占有するスペース (単位) が少なくなります。 音の音 1 秒あたり) は、同等のデジタル化されたオーディオ ファイルよりも優れています。

MOD (.mod)- 音楽形式。デジタル化されたサウンドのサンプルが保存され、個々の音符のテンプレートとして使用できます。 この形式のファイルは一連のサウンド サンプルで始まり、その後に音符と長さの情報が続きます。 各ノートは、最初に示したサウンドパターンのいずれかを使用して演奏されます。 このファイルは比較的小さく、メモベースの構造になっています。 これにより、従来の音楽録音をシミュレートするプログラムを使用した編集が容易になります。 MIDI ファイルとは異なり、サウンドを完全に定義するため、どのコンピューター プラットフォームでも再生できます。



IFF (.iff)- Interchange File Format – もともと Amiga コンピュータ プラットフォーム用に開発された形式。 現在では CD-I の形式のコンパクト ディスクでも使用されています。 その構造は RIFF 形式の構造と非常によく似ています。

AIFF (.aiff ) - オーディオ交換ファイル形式 - オーディオ データを交換するための形式。Silicon Graphics および Mac コンピュータ プラットフォームで使用されます。 多くの点で Wave 形式に似ていますが、デジタル化されたオーディオとテンプレートを使用できる点が異なります。 多くのプログラムはこの形式のファイルを開くことができます。

リアルオーディオ (.ra、.ram)- インターネット上でサウンドをリアルタイムで再生するために開発された形式。 Real Networks (www.real.com) によって開発されました。 結果として得られる品質は、 最良のシナリオ平凡なオーディオカセットに相当しますが、音楽作品を高品質に録音するには、mp3 フォーマットの使用がより好ましいです。

4.3. MIDI とデジタル オーディオ: 長所と短所

WAVE 形式は数多くある形式のうちの 1 つですが、デジタル オーディオを録音するための唯一の形式というわけではありません。 MIDI データとは異なり、デジタル オーディオ データは実際にはサンプルと呼ばれる数千の単位で記録されたサウンドを表します。 デジタル データは、離散的な時点での音の振幅 (または音量) を表します。 デジタルデータの音は再生機器に依存しないため、常に同じ音になります。 ただし、大容量のサウンド ファイルを使用するには、その代償を支払う必要があります。

MIDI データとデジタル データの関係は、ベクター グラフィックスと同じです。 ラスター画像。 つまり、MIDI データはオーディオ再生デバイスに依存しますが、デジタル データは依存しません。 ベクター グラフィックスの外観がプリンターやモニターの画面に依存するのと同様に、MIDI ファイルのサウンドは、ファイルの再生に使用される MIDI デバイスに依存します。 同様に、コンサートピアノで演奏されるメロディーのサウンドは、通常のピアノで演奏される同じメロディーのサウンドとは異なります。 一方、デジタル データは同一であり、再生システムから独立しています。 この意味で MIDI 標準は PostScript 標準に似ており、明確な言語で楽器を制御できるようになります。

デジタル オーディオと比較して、MIDI には次の利点があります。

§ MIDI ファイルはメモリ使用量が少なく、ファイルのサイズは音質に影響しません。 平均して、MIDI ファイルはデジタル ファイルよりも 200 ~ 1000 倍小さいため、占有するスペースはわずかです。 ランダム・アクセス・メモリ、ディスク上にあり、大量の CPU リソースを必要としません。

§ 場合によっては、MIDI ファイルの方がデジタル オーディオ ファイルよりも優れたサウンドが得られます。 この場合、MIDIファイルの音源は高品質である必要があります。

§ MIDI ファイルの長さを変更して、音質と音量を維持したままサウンドのテンポを変更できます。 MIDI データは、個々のノートレベルでも簡単に編集できます。 デジタル オーディオでは不可能な、MIDI ソングの小さなセグメントを (ミリ秒の精度で) 操作できます。

MIDI ファイルの主な欠点は、その利点から生じます。 MIDI データ自体はサウンドではないため、再生は、元のファイルの作成に使用されたデバイスと同一の MIDI データ再生デバイスでのみ正確になります。 General MIDI 規格に従った MIDI 楽器のサウンドであっても、電子再生デバイスと使用する方法によって異なります。 MIDI オーディオは音声の再生には使用されません。

MIDI オーディオに対するデジタル オーディオの主な利点は、デジタル オーディオ再生の品質が常に一定であることですが、これが MIDI オーディオがデジタル オーディオより劣る点です。 デジタル オーディオを使用する必要がある理由は 2 つあります。

§ デジタル オーディオをサポートするプログラムとシステムの幅広い選択肢。

§ デジタルサウンド要素を準備して作成するには、音楽理論の知識は必要ありませんが、MIDI データについては同様です。

音楽の世界には、 大量の電子世界で広く認知されている音楽業界の巨人や中小企業によって作成された音楽フォーマット、その修正およびバージョン。

これらの目的のために、オーディオ データを保存するためのさまざまな物理的方法が開発されてきました。たとえば、ビニール レコード、磁気テープ、CD、DAT、MD (ミニディスク)、DVD、またはメモを音楽形式 (MIDI) に変換するなど、さまざまな方法が挙げられます。コンピューターによるオーディオ データの保存方法、つまりデジタル: OGG、Mp3、Flac、Wav 形式が登場しました。

すべてのサウンド形式、コーデック、その長所と短所を検討して議論することは不可能なので、この記事では、最も一般的なオーディオ ファイル拡張子について説明したいと思います。

ユニバーサルオーディオファイルエンコーディング形式を使用できないのはなぜですか? 実装のためなので、 さまざまな機能独自の形式が必要です。 例: CD ドライブでの CD の再生、ビデオ ゲームの音楽や効果音の録音、映画トラックやビデオ クリップの録音、携帯電話での再生やインターネット経由でのファイル転送など、他にもさまざまな用途があります。世界で最も普及しているオペレーティング システム。 これらには、Amiga、Macintosh、NEXT、および Windows オペレーティング システムを搭載したパーソナル コンピュータが含まれます。

さらに、DJ、サウンドエンジニア、CJ、ビデオエンジニア、または単なる音楽愛好家の仕事は、性質がまったく異なります。 これには、オーディオ データを独自の方法で保存することが必要になる場合があります。 たとえば、CD のオーディオは 16 ビットおよび 44.1 kHz のサンプリング レートを使用して保存する必要があります。 ただし、インターネット経由でオーディオをダウンロードするには、異なるビット深度とサンプリング レートを使用する方が良いでしょう。16 ビット、44 キロヘルツのオーディオは 1 分あたり約 10 MB を占有するためです。 5 分間続く平均的なトラックは 50「メートル」になります。これは平均的なユーザーにとっては多すぎるデータです。 この記事で紹介するのは 簡単な情報最も人気のある音楽形式について。

A.A.(Audibleオーディオブックファイル) – この形式はクローズドであり、Audible によって開発されました。 Audible や iTunes を通じて販売されるオーディオブックを録音するために使用されます。 ファイルを聴く速度を遅くしたり速くしたりすることが可能です - デジタルピッチ、オーディオブックを聴くときにブックマークを残す機能、インターネット経由でサウンドレコーディングを配信するときのファイル保護。

A.A.C.(高度なオーディオコーディング) – エンコード時の品質損失が Mp3 よりも少ないオーディオ ファイル形式 同じサイズ。 ALAC プロファイルを使用して、元の品質を損なうことなく音楽をエンコードします。 AAC は、MPEG4 オーディオ コーディング アルゴリズムのファミリーです。 ハイブリッド MP3 フィルター バンクとは異なり、AAC は MDST テクノロジー (修正コサイン変換) を使用します。これは、リスナーが同じまたはそれより低いビットレートで MP3 エンコードするよりも優れた音質を受信できることを意味します。 可能な拡張 AAC ファイル: [.m4a]、[ .m4b ]、[ .m4p ]。

AAC は、2 つの基本的なコーディング原理を使用して、高品質のデジタル オーディオの送信に必要なデータ量を大幅に削減する広帯域オーディオ コーディング アルゴリズムでもあります。 この形式は非可逆圧縮を使用する最高品質の形式の 1 つであり、ポータブル機器を含むほとんどの最新の機器でサポートされています。

2009 年の時点では、MP3 や他の代替ソリューションに比べてあまり普及していません。 AAC (Advanced Audiocoding) は、もともとエンコード品質を向上させた MP3 の後継として作成されました。 AAC 形式は正式には ISO/IEC 13818-7 として知られ、MPEG-2 ファミリーの 7 番目の新しいメンバーとして 1997 年にリリースされました。 MPEG-4 Part 3 として知られる AAC 形式もあります。

MP3 に対する AAC の利点:

– 最大 48 のオーディオ チャンネル。

– 固定ビットレートと可変ビットレートの両方でのコーディング効率の向上。

– サンプリング周波数は 8 Hz ~ 96 kHz (MP3: 8 Hz ~ 48 kHz)。

– より柔軟なジョイントステレオモード。

ADXは、ビデオ ゲームでの使用に特化して CRI ミドルウェアによって開発された、ADPCM ベースの独自の非可逆オーディオ圧縮およびストレージ形式です。 最大の特徴はサウンドをループ録音できることで、ゲームのBGMとして使用するのに便利な形式です。 いろいろなゲームこのメディアコンテナをサポートするもの。 多くの SEGA Dreamcast ゲームと一部の PlayStation 2 および GameCube ゲームでサポートされています。

MP3 とは異なり、サウンド データの量を減らす (複雑さを軽減する) という心理音響モデルは使用されません。 代わりに、ADPCM モデルは相対予測誤差データ レコードを使用してサンプルを保存します。これは、エンコード後の元の信号の保存が強化されることを意味します。 基本的に、ADPCM 圧縮では、オーディオ録音の完全にサイズ変更されたサンプルを使用するのではなく、サイズがはるかに小さい (通常は 4 ビット)、以前の値からの信号の偏差のサンプルが提供されます。 人間の耳には、この偏差はノイズレベルであり、品質の低下はほとんど目立ちません。

AIFF- これ 標準フォーマットファイルを使用して Macintosh プラットフォームにオーディオ データを保存します。 パーソナル コンピュータと Macintosh コンピュータ間でオーディオ ファイルを転送する必要がある場合は、この形式を使用してください。 8 ビットおよび 16 ビットのモノラルおよびステレオのオーディオ データをサポートします。 この形式のファイルには Mac-Binary ヘッダーが含まれる場合と含まれない場合があります。 ファイルの場合 このタイプの Mac-Binary ヘッダーは含まれていませんが、おそらく aif 拡張子が付いています。 このタイプのファイルに Mac-Binary ヘッダーが含まれている場合、Sound Forge はそのファイルを開きますが、Macintosh リソース ファイルとして識別します (次のセクションを参照)。 この場合、ファイルの拡張子はおそらく snd です。 注 ファイルを Macintosh コンピュータに保存すると、いわゆる Mac-Binary ヘッダーがファイルに追加されます。 これは、オペレーティング システムのファイル タイプを識別する、ファイルの先頭に書き込まれる小さな情報です。 Mac システム OSやその他のアプリケーション。 これは、Macintosh コンピュータがファイルに含まれる内容 (テキスト、グラフィックス、オーディオ データなど) を通知する方法です。

AMR(アダプティブマルチレート) [ . アムル] - 可変レート適応エンコーディング。 音声周波数範囲での信号圧縮用に特別に設計されたオーディオ ファイルのエンコード規格。 ETSI (欧州電気通信標準化協会) によって標準化されています。 AMR を使用すると、高品質の音声伝送と同時に高いネットワーク容量を提供することが可能になります。 AMR は幅広い音声エンコード/デコード速度を備えており、環境条件やネットワーク負荷に応じてさまざまなモードに柔軟に切り替えることができるため、どんな状況でもクリアな音声伝送を保証します。

エイペー– (Monkey's Audio) [ . ] – 開発者 Matthew T. Ashland – ロスレス デジタル オーディオ フォーマット (無損失の )。 Monkey's Audio コーデックはプラットフォーム専用にリリースされています マイクロソフトウィンドウズただし、MacOS、Linux、BeOS 用の非公式コーデックは多数あります。 Monkey のオーディオ ファイルでは、オーディオの保存には .ape、メタデータの保存には .apl という拡張子が使用されます。 この形式は無料ではありません。 そのライセンスは配布を厳しく制限しています。

りんご無損失の[. メートル4 ある]は、データを損失することなくデジタル音楽を圧縮するために Apple Inc によって開発されたオーディオ コーデックで、Apple Lossless データは .m4a 拡張子の付いた MP4 コンテナに保存されます。 Apple Lossless のファイル拡張子は AAC と同じですが、AAC ではありません。コーデックは FLAC などの他の Lossless コーデックと似ています。Dock コネクタ (シャッフルではない) と最新のファームウェアを備えた iPod では、ファイルを再生できます。 アップルフォーマット無損失の。 デジタル著作権管理 (DRM) は使用しませんが、コンテナーの性質を考慮すると、DRM が ALAC に適用される可能性があると考えられています。

テストの結果、ALAC 圧縮ファイルは、他のロスレス形式と同様に、音楽の種類に応じて、オリジナルのサイズの約 40% ~ 60% になることが示されています。 さらに、デコード速度が速いため、iPod などのパフォーマンスに制約のあるデバイスに役立ちます。

Apple Lossless Encoder は、2004 年 4 月 28 日に QuickTime 6.5.1 のコンポーネントとして、また iTunes 4.5 の機能として導入されました。 このコーデックは、AirTunes 実装の AirMac Express でも使用されます。

Apple Lossless 形式のデコーダがオープンソースの libavcodec ライブラリで利用できるようになりました。 これは、VLC メディアや MPlayer メディアを含む、このライブラリに基づくあらゆるメディア プレーヤーで Apple Lossless ファイルを再生できることを意味します。

CDDA(CDデジタルオーディオ) - オーディオ CD は、フィリップスとソニーによって導入された、デジタル化されたオーディオを CD に保存するための国際標準です。 オーディオ情報は、サンプリング周波数 44.1 kHz、ビット レート 1411.2 kbit/s、16 ビット ステレオのパルス コード変調で表示されます。

レッドブックのオーディオ仕様:

– すべての録音の最大時間は 79.8 分です。

– 最小トラック時間 - 4 秒 (2 秒の一時停止を含む)。

最高額トラック - 99;

– 参照ポイント(トラックセクション)の最大数 - 時間制限なしで 99。

– 存在する必要があります 国際標準録音コード (ISRC)。

DTS– (デジタル シアター システム)、本質的にはドルビー デジタルです 、というかその競合相手です。 フォーマット DTS よりも最小限の圧縮レベルを使用しますドルビー 、実際、そのほうが音が良くなることが実際に証明されています。 DVD トラックが記録されているディスク DTS または DD 形式。

DTS これは、デジタル シアター システムです。レンタル フィルムのコピーと同期して映画館でデジタル サウンドトラックをデモンストレーションするために、Digital Theater System 社によって作成されたデジタル マルチチャンネル サウンド録音システムのファミリーです。 付属のフィルムフィルムのコピーに加えて、両方のシステム ( DTSとドルビーデジタル ) は、家庭で視聴するための光ビデオ ディスクで簡略化された形式で使用されます。 DTS より少ない圧縮を使用しますドルビー , しかし、どのシステムにも絶対的な優位性はありません。 利益に関する議論 DTSまたはドルビーデジタル 今日まで止まらない。 フォーマット DTSステレオ ほぼ同じドルビーサラウンド。 DTS 5.1 チャンネルと 7.1 チャンネルの両方のオーディオ オプションをサポートします。 DTS ホームシアターではフルビットレート (1509.75 kbps) が可能です。

FLAC(Ogg プロジェクトの無料コーデック)[.flac] – (英語 Free Lossless Audio Codec - フリー ロスレス オーディオ コーデック) - オーディオ圧縮用の人気のある無料コーデック。 不可逆コーデックの Ogg Vorbis、MP3、AAC とは異なり、FLAC はオーディオ ストリームから情報を削除しないため、高品質のサウンド再生機器で音楽を聴く場合と、オーディオ コレクションをアーカイブする場合の両方に適しています。 現在、FLAC 形式は多くのオーディオ アプリケーションでサポートされています。 基本的なタイプのメタデータを保存するために、基本的なデコーダはタグを使用します ID 3 v 1 および ID 3 v 2なので自由に追加・編集できます。

ミディ(楽器デジタルインターフェース) – 楽器のデジタルインターフェース。 電子楽器間でデータをやり取りするためのデジタルオーディオ録音規格です。

このインターフェイスを使用すると、キーストローク、音量やその他の音響パラメータの調整、音色、テンポ、調性などの選択などのデータを、正確なタイミングでデジタル形式で均一にエンコードできます。 エンコード システムには、メーカー、プログラマ、ユーザーが自由に使用できる多くの無料コマンドが含まれています。 したがって、MIDI インターフェースを使用すると、音楽の再生に加えて、照明や花火などの他の機器の制御を同期することができます。

一連の MIDI コマンドは、ファイルの形式で任意のデジタル メディアに記録でき、任意の通信チャネルを介して送信できます。 再生装置またはプログラムは MIDI シンセサイザー (シーケンサー) と呼ばれ、実際には自動楽器です。

MP2 (MPEG-1 Audio Layer II または Musicam) [ . MP2 ] – MPEG-1 標準で定義されている非可逆オーディオ圧縮の 3 つの形式 (レベル 2) の 1 つ。 DAB デジタル放送と、90 年代に映画を配布するために使用されていたレガシー ビデオ CD 規格で使用されています。 光学コンパクトディスク DVD が普及する前から存在していました。

MPEG-1 オーディオ レイヤ 2 エンコーダは、1989 年に CCETT、フィリップス、および IRT によってデジタル ラジオ放送システムに関する 147 の欧州政府間開発に関する EUREKA 研究の一環として開発された MUSICAM (マスキング パターンに適応したユニバーサル サブバンド統合コーディングおよび多重化) オーディオ コーデックから進化しました。固定、携帯、モバイルの受信デバイス向け。 MPEG-1 Audio の主要なパラメータ (フィルタ バンク、タイム ドメイン処理、オーディオ フレーム サイズなど) は MUSICAM から継承されています。 ただし、さらなる改良の後、MUSICAM アルゴリズムは MPEG-1 Layer II 標準の最終バージョンでは使用されませんでした。

MP3 (MPEG レイヤー 3) [ . MP3 ] 3 番目のオーディオ トラック エンコード形式である MPEG は、オーディオ情報を保存するためのライセンスされたファイル形式です。現時点では、MP3 はオーディオ情報の一般的な非可逆デジタル エンコード形式の中で最も有名で人気があります。 ファイル共有ネットワークで音楽の評価に広く使用されています。 この形式は、ほとんどすべての一般的なオペレーティング システム、ほぼすべてのポータブル オーディオ プレーヤーで再生でき、すべてのデバイスでサポートされています。 現代のモデルミュージックセンターやDVDプレーヤーなど。

MP3 形式は、録音の再生に必要なデータのサイズを大幅に削減し、(ほとんどのリスナーによると)オリジナルに非常に近い再生品質を提供するように設計された非可逆圧縮アルゴリズムを使用していますが、オーディオファンは顕著な違いを報告しています。 平均ビットレート 128 kbps の MP3 を作成すると、作成されるファイルのサイズは約 1/10 になります。 元のファイルオーディオ CD から。 MP3 ファイルは高ビットレートまたは低ビットレートで作成でき、それが結果のファイルの品質に影響します。 圧縮の原理は、オーディオ ストリームの特定の部分の精度を下げ、ほとんどの人の聴覚では事実上聞こえないようにすることです。 この方法知覚符号化と呼ばれます。 この場合、最初の段階では、一連の短い時間の形でサウンドダイアグラムが構築され、次に人間の耳には認識できない情報がそこから削除され、残りの情報がコンパクトなファイルに保存されます。形状。 このアプローチは、画像を圧縮するために使用される圧縮方法に似ています。 JPEG形式。 多くの音楽グルメは、最高の品質で音楽を圧縮することを好みます – 320 kbps 、または他の形式に切り替えます。たとえば、 FLAC 、平均ビットレートは ~1000 kbps。

ミューズパック[. mpc]オーディオ情報を保存するためのライセンスのないファイル形式。 GNU 一般公衆利用許諾書。

Musepack は周波数バンディングを使用するため、いわゆるサブバンド コーデックに属します。 主な機能は、純粋な VBR エンコーディング (可変ビットレート エンコーディング) での作業を可能にする音響心理学の正確なチューニングです。 Musepack の主な目標は、エンコードされた音楽のサウンドの透明性です。

MP3、Vorbis、AAC、AC3、WMA などの最新の形式では、2 番目の DCT 変換が実行され、中ビットレートおよび低ビットレートではより良い品質を実現できますが、 高い結果より高いものでは。 MusePack は 2 回目の DCT 変換を実行しないため、180 を超えるビットレートで卓越した品質を実現できます。

AAC やその他の最新形式と同様に、Musepack は周波数帯域ごとにチャンネルをペアリングします。これにより、品質にはわずかな影響がありますが、サイズは大幅に節約できます。 MP3 では、チャネルは周波数帯域ではなく帯域全体でペアリングされ、信号を周波数サブバンドに分割し、信号を一連のコサインに分解し (MDCT - フーリエ変換の特殊なケース)、丸められた (量子化された) 信号を記録します。 ) 変換後に得られた係数の値 (量子化は実行された心理音響分析に従って行われます)。 MPC は、信号を周波数サブバンドに分割した後、各サブバンドの振幅信号を (音響心理学に基づいて) 再量子化し、結果として得られる丸められた (量子化された) 値を出力ストリームに書き込みます。 これと同じ事実が説明します 高速 MPC の圧縮と解凍。

モッド– Amiga プラットフォーム用に開発された形式。 各 MOD ファイルには、MIDI 構造にある程度似た、楽器の実際のサウンド、いわゆるサンプルのデジタル化された録音が含まれています。 Cjまたは作曲家が書いています MOD形式は、トラッカーと呼ばれるプログラムを使用します。このプログラムでは、どの楽器を、いつ、どの音符とオクターブで鳴らすべきかを示します。この音のシーケンスはリストに記録されます。つまり、トラックと呼ばれる、いくつかの並行して鳴るトラックがブロックを形成します。パターン。 パターンのセットはモジュール、つまり .mod 拡張子が付いた MOD 形式のファイルを形成します。 1 つのトラッカー ラインは 1 つのトラッカー ラインに対応します リアルチャンネル、cj は番号付きノートを再生または編集できます。 ノートにはさまざまな「装飾」を割り当てることができます - 例: トレモロ、グリッサンドなど。

OGG [.ogv], [.oga], [.ogx], [.ogg] – オープン標準のマルチメディア コンテナ形式。Xiph.Org Foundation のマルチメディア コーデックのメイン ファイルおよびストリーミング形式であり、この形式およびそのコーデックを開発しているプロジェクトの名前でもあります。 Xiph.Org の後援の下で開発されたすべてのテクノロジーと同様、Ogg フォーマットは特許やライセンスの制限のないオープンで無料の標準です。

Ogg は単なるコンテナです。 音楽やビデオはコーデックによって圧縮され、処理結果は同様のコンテナに保存されます。 Ogg コンテナーは、複数のコーデックでエンコードされたストリームを保存できます。 たとえば、ビデオとオーディオを含むファイルには、オーディオ コーデックとビデオ コーデックでエンコードされたデータが含まれる場合があります。

Ogg コンテナは、オーディオとビデオをさまざまな形式 (MPEG-4、Dirac、MP3 など) で保存できます。

リアルオーディオ[. ],[. ラム]" が所有するストリーミングおよびメディア ファイル形式の Prop 標準 RealNetworks の製品とサービス。」 リアルオーディオ 最初はパッケージの一部として導入されましたリアルオーディオ 10、品質を損なうことなくオーディオを圧縮するためのコーデック。

このコーデックの利点の 1 つはサポートです。 ストリーミング、非常に高速なデコード。 欠点としては、クローズド コードとマルチチャネル機能の欠如が挙げられます。 以下のために利用可能 Microsoft Windows、Macintosh、GNU/Linux。

RKAU[.rka]すべてのオーディオ コーデックの中で、RKAU は非常に特別な位置を占めています。 まず、これは最小 (わずか 25kB!) かつ最速のエンコーダーです。 第 2 に、これは可逆オーディオ圧縮プログラムであるという事実に加えて、既知のすべての可逆アルゴリズムよりも高度な圧縮を提供する非可逆圧縮モードを提供します。 ただし、rkau の基礎となるアルゴリズムの特殊性により、コーデックによって導入される歪みは (MP3、MP+、AAC およびその他のエンコーダの心理音響モデルの場合のように) スペクトル領域ではなく、実領域にあります。 つまり、大まかに言えば、ほとんどのパスの歪みと同様に、それらは非線形の性質を持っています。 この場合、レコードの細部やマイクロプレーンが失われることはありません。 ただし、この点で「やりすぎる」と、サウンドが完全に消化不能になる可能性があります。ハードノイズのようなアーティファクトがサウンドに現れ、サウンド自体が顕著な色付けを獲得します。

オーディオ コーデックの階層において、rkau プログラムは完全に独立しています。 これは非常に独創的であるため、他のオーディオ データ圧縮アルゴリズムに類似するものはありません。 エンコーダ プログラムのサイズが小さく (25kB)、他のロスレス アルゴリズムと同様の圧縮率による高速動作により、rkau は議論の余地のないリーダーとなっています。 また、記事の前の部分で説明した OptimFROG は最も効果的なロスレス エンコーダと考えられますが、rkau は効率の点でそれにわずかに劣るのみです。 ただし、「非可逆」圧縮モードが有効になっている場合、rkau は最高品質モードであっても、すべての可逆アルゴリズムを大幅に後回しにし、心理音響モデル (MP3、MP+、AAC、VQF など) に基づく効率プログラムに近づきます。 この場合、MPEG のようなアルゴリズムの特徴である、元のオーディオ素材のマイクロプレーンやニュアンスの損失は発生せず、必然的に発生するアーティファクトは、非常に高品質の機器で比較試聴を繰り返した場合にのみ気づくことができます。

短くする[.shn] – オーディオ データの圧縮に使用される形式です。 この形式のファイル圧縮は CD 品質の圧縮に使用されます。 TP ジントム オーディオ ファイル (44.1 kHz、16 ビット、ステレオ PCM )。 この形式は、次のようにエンコードされたコンサート録音を販売することが合法であるため、一部の人が今でも使用しています。ファイルを短くします。

スペックス [. スプックス] は、Voice-over-Internet アプリケーションで使用できる無料の音声圧縮コーデックです ( VoIP )。 特許制限がなく、最新バージョンのライセンスに基づいてライセンスされている可能性が高くなります。 BSD (3番目の記事は除く)。 コーデック圧縮スペックス データはオーディオ データ ストレージ形式のいずれかで保存できます。オッグ 、またはパケットを使用して直接送信します UDP/RTP。

開発者は、自分たちの開発を他のオープン コーデック (たとえば、コーデック) と比較します。ヴォルビス 、それがコーデックであると主張しますスペックス データ パケット配信の信頼性が低いネットワーク上の音声に最適です。 同時に、開発者らは、このコーデックがパケット伝送の信頼性が低い、つまりパケットが到着したかどうかが不安定なネットワークでの使用に適していることを特に強調しています。

スペックス いわゆるクラスに属しますコード励起線形予測 (CELP) )-コーデック、つまり、いわゆる線形予測コーディング LPK に基づいて構築されたコーデック。 LPK は、フィードバック接続のみを備えたデジタル フィルター (いわゆる「自己回帰フィルター」) を使用して、音声信号のセグメントを近似します。 このフィルターの係数は、レビンソン手順 (西洋の文献では、レビンソン-ダービン) を使用して信号セグメントに「調整」されます。セルプ - LPK の変更により、いわゆるものの存在が提供されます。 「コードブック」には、LPC フィルターを励起する単一パルスの事前定義されたセットが含まれています。

コーデック内の音声信号スペックス は、20 ms の持続時間の重複しないセグメント (8 KHz で 160 サンプル) に分割されます。 この場合、興奮性セットを評価するために、上記のセグメントはそれぞれ 5 ミリ秒の継続時間の 4 つのサブセグメントに分割されます。 各サブセグメント上で、(コード ブックからの) 現在のサブセグメントと前の 2 つのサブセグメントの両方について、刺激的なインパルスのセットが検索されます。 他のコーデックとは異なり、特許制限を回避するために、スペックス 代数コーディングは使用せず、ベクトルコーディングのみを使用します。 前の 2 つのサブセクションの励振は、可変の時間位置を使用する他の多くのコーデックとは対照的に、可変の重みを付けて追加されます。

開発者によると、スペックス 低速での高品質な音声向けに最適化されています。 コーデックスペックス 可変信号圧縮も可能で、超広帯域 (32 kHz サンプリング レート)、広帯域 (16 kHz)、狭帯域 (8 kHz) など、さまざまな帯域幅の信号をサポートします。

それで(Tom のロスレス オーディオ コンプレッサー) [ . それで]オーディオ コーデックとロスレス デジタル オーディオ圧縮形式。 高い圧縮率とエンコードとデコードの速度が特徴で、エンコードと再生用のソフトウェア一式、Winamp、foobar2000 などのプラグインも無料で配布されています。開発者はドイツの Thomas Becker です。 新しいコーデック。 初め 最終版 1.0 は 2007 年 1 月 26 日に公開されました。

この形式は現在も積極的に開発されており (最新バージョン 1.1.1)、Hydroidaudio.org フォーラムの調査によると、現在 (FLAC と WavPack に次ぐ) 最も人気のある 3 つのロスレス オーディオ圧縮形式の 1 つです。

TTA(トゥルーオーディオ) – 圧縮を実行する無料のオーディオ コーデック 音楽ファイルリアルタイムでロスなく。 このコーデックは適応予測フィルターに基づいており、最新のエンコーダーと同様にすべての改善された特性を備えています。 圧縮されたファイルのサイズは、元の音楽ファイルより 30% ~ 70% 小さくなります。 TTA 形式は ID3v1 タグと ID3v2 タグをサポートします。 True Audio コーデックを使用すると、1 枚の DVD-R ディスクに最大 20 枚のオーディオ CD を配置できます。

ツインVQ(変換 – ドメイン加重インターリーブ ベクトル量子化) - 変換ドメインと重み付けインターリービングによるベクトル量子化)、日本の研究室で開発 NTTヒューマンインターフェース研究所

VQF ファイルは、同じ音質の MP3 よりも約 30 ~ 35% 小さくなります。 MP3 ファイルの 128 Kbps ストリームは、VQF ファイルの 80 Kbps ストリームに対応します。 これらの利点には欠点もあります。 デコードでは、MP3 デコードよりも 30% 多くの CPU を使用します。 これにより、そのようなファイルを再生するコンピュータに対する要件の増加が決まります。

テストでは、低周波数ではあらゆる点で VQF が優れており、高周波数では波形歪みが大幅に少ないことが示されています。 ダイナミックレンジ(本物の音楽)。 しかし、瓦礫によると 高音 音のスペクトル VQF は、15 kHz を超える周波数では MP3 より 2 ~ 3 dB 劣ります。 ただし、これはプレーヤーのイコライザーを調整することで簡単に補正でき、客観的に見て VQF の音質は MP3 に比べて 1 段階高くなります。

VQF(インターリーブベクトル量子化)– 日本で開発され、TwinVQ テクノロジーに基づいています。 VQF と MP3 を比較すると、最初の形式は同じ音質で 30 ~ 50% コンパクトになります。 これにより、VQF は MP3 フォーマットよりも大きな利点を得ることができます。 ただし、VQF のエンコード、デコード (デコーダー) のプロセスには、Mp3 オーディオよりも約 30% 多くの PC プロセッサ リソースが必要です。

テストでは、TwinVQ が低周波数であらゆる点で優れており、波形歪みが大幅に少なく、ダイナミック レンジが広い (実際の音楽) ことが示されています。 ただし、サウンド スペクトルの高周波のロールオフに関しては、15 kHz を超える周波数では、TwinVQ は MP3 より 2 ~ 3 dB 劣ります。 ただし、これはプレーヤーのイコライザーを調整することで簡単に補正でき、客観的に見て MP3 に比べて TwinVQ の音質が 1 段階高くなります。

ヴォルビス [. ああ] は、2002 年の夏に正式に登場したフリーの非可逆オーディオ圧縮形式です。 機能と品質の点では、MP3 よりも優れた AAC、AC3、VQF などのコーデックに似ています。 Vorbis で使用される心理音響モデルは、MP3 などと動作原理は似ていますが、このモデルの数学的処理と実際の実装は大きく異なり、そのため、作成者はそのフォーマットがすべての先行モデルから完全に独立していると宣言することができました。

Ogg Vorbis はデフォルトで可変ビットレートを使用しますが、後者は固定値に限定されず、1 kbps 単位で変化する場合もあります。 最大ビットレートは形式によって厳密に制限されず、最大エンコード設定では 500 ~ 1000 kbps まで変化する可能性があることに注意してください。 サンプリング レートも同様の柔軟性を備えており、ユーザーは 2 ~ 192 kHz から選択できます。

Vorbis は、すべての有料の独自オーディオ形式を置き換えるために、Xiphophorus コミュニティによって開発されました。 Ogg Vorbis はすべての MP3 競合他社の中で最も新しい形式であるにもかかわらず、すべての一般的なプラットフォーム (Microsoft Windows、Linux、 アップルマック OS、PocketPC、Palm、Symbian、DOS、FreeBSD、BeOS など)、および たくさんのハードウェアの実装。 ただし、競合他社に比べてさまざまな利点があるにもかかわらず、この形式の人気はまだ低いです。

WAV(波形音声フォーマット) [ . ウェーブ], [. 』 – と共同開発 IBM 。 非圧縮オーディオ録音フォーマット (ステレオまたはモノラル)。 したがって、CD 品質 (サンプリング周波数 44.1 KHz) で作成されたわずか 1 分間のステレオ サウンド録音には、60 秒 x 44100 Hz x 2 チャンネル = 5,292,000 のサンプルが含まれます。 各サンプルには 8 ビットまたは 16 ビットを含めることができます。 したがって、サンプルあたり 8 ビットのバージョンでは、1 分間のサウンドには 42,336,000 ビット = 5,292,000 バイト (約 5 MB) のメモリが必要になります。

WavPack[.wv], [.wvс] – 品質を損なうことなくオーディオを圧縮できる、無料のオープンソース オーディオ コーデック。 デビッド・ブライアントによってデザインされました。

WavPack 形式を使用すると、8、16、24、および 32 ビットのオーディオ ファイルを .WAV 形式で圧縮 (および解凍) できます。 サラウンド サウンド ストリーミングと高サンプリング レートもサポートします。 他の可逆圧縮方法と同様、圧縮効率はソース データによって異なりますが、一般的なポピュラー音楽では通常 30% ~ 70% の範囲であり、クラシック音楽やその他のダイナミック レンジが広いソースではわずかに高くなります。

WavPack には、可逆圧縮のすべての利点と追加のボーナスを提供する独自の「ハイブリッド」モードも含まれています。このモードでは、単一のファイルを作成する代わりに、比較的小さな高品質 (より正確には、エンコード時に指定された) 非可逆品質 (. WV) ファイルは単独で再生できますが、「修正」ファイル (.WVC) も含まれており、(以前の .WV と組み合わせることで) オリジナルを完全に復元できます。 一部のユーザーにとって、これは、可逆圧縮と非可逆圧縮のどちらかを選択する必要がないことを意味します。

WMA(Windows Media オーディオ) [ . wma]によって開発されたライセンスされたファイル形式 マイクロソフト社製オーディオ情報を保存およびブロードキャストするため。当初は WMA形式は MP3 の代替として位置づけられていましたが、現在 Microsoft は AAC 形式 (人気のオンライン音楽ストア iTunes で使用されている) に反対しています。

名目上、WMA 形式は優れた圧縮機能を備えているため、MP3 形式を「バイパス」し、パラメータの点で Ogg Vorbis および AAC 形式と競合できます。 しかし、独立したテストや主観的な評価によって示されているように、フォーマットの品質は依然として明らかに同等ではなく、マイクロソフトが主張しているように、MP3 よりも優れていることは明らかです。 特に注目に値するのは、フォーマットの初期バージョン (またはその実装) には、低ビット レートで問題があったということです。 また、多くの音楽愛好家やデジタル プレーヤーの所有者は、エラー耐性が低い WMA 形式を好みません。 WMA ファイルのエンコード/転送中にファイルの一部が破損すると、破損箇所から数十秒前まで、ファイルの再生が不可能になります。 (比較のために、MP3 ファイルが破損している場合でも、最初から破損箇所まで再生し、その後数秒スキップして最後まで再生できます。MP3 ファイルには数バイトのエラーが発生する場合があります。ただし、この形式は常に進化しているため、品質は最適化されると考えられます。

ほとんどのポータブル オーディオ プレーヤーは、MP3 とともに WMA 形式をサポートしています。 この形式は、次の場所ではあまりサポートされていません。 代替プラットフォーム(閉鎖的な性質のため)。

Microsoft は、WMA にデジタル著作権管理 (DRM) (保護システム) のサポートを組み込みました。 その主な結果は、音楽ストアから楽曲をダウンロードしたコンピュータ以外のコンピュータでは、保護された楽曲を聴くことができなくなることです。

最新バージョン Windows Media Audio 9.1 以降では、英語の品質を損なうことなくエンコードが提供されます。 ロスレス、マルチチャンネル サラウンド サウンド エンコーディングおよび音声エンコーディング。

今日「オーディオ」という用語は、何らかの形で音に関連するすべてのものを指します。 これには、オーディオ録音の処理、再生、ミキシング、および単純なリスニングが含まれます。 すべての一般的なオーディオ形式が、その存在の間に、良い方向にも、時には悪い方向にも、大きな変化があったことを知っている人はほとんどいません。


問題は、クリエイターが新しいフォーマットを使用して録音の品質を向上させようとすると、結果として得られる結果のサイズが大幅に増加することです。 最終的なファイルのサイズを小さくすると、品質が大幅に低下します。 しかし、物事は常にこうだったわけではありません。

コンピュータゲームで使用される最初のオーディオ形式

コンピューター サウンドについて最初に言及したのは、さまざまな原始的なビデオ ゲームの作成に関連しています。 その後、システムスピーカーを使用してサウンドが再生されました。 当時のソフトウェア開発者がどんなに努力しても、カセットテープレコーダーやオープンリールテープレコーダーに匹敵する品質を達成することは不可能でした。 これにより、多くの開発者は、サウンドがより自然で自然になるようにオーディオ形式を変更する方法を検討するようになりました。 この問題が今日のオーディオ機器市場における競争の原因となっています。 その結果、使用されるフォーマットは、再生される素材の品質と主要な再生パラメータの設定に大きな影響を与えます。

WAV形式

この形式には、最初の完全な品質のオーディオ形式が関連付けられています。 WAV 拡張子の名称は、英語の「wave」という単語に由来しており、ロシア語では波を意味します。 この形式は、高度に専門的なレベルでコンピュータ プログラムを使用して処理された最初のオーディオ形式になりました。 WAV 拡張子を持つファイルには次の特徴があります。

— 音の深さ。
- サンプリング周波数;
— ビットレートなど

この形式は、イコライザーやその他のツールを使用してオーディオ CD を処理した後に得られるサウンドとさえ互換性がありました。 ただし、この場合のファイル サイズは完全に不当でした。 たとえば、3 分間続く最も一般的なトラックの場合、最大 50 メガバイトかかる可能性があります。

CD

オーディオ CD、より正確には .cda 拡張子は、wav 形式とほぼ同時期に登場しました。 ただし、拡張子が wav のファイルとは異なり、.cda は編集できません。 ただし、任意のオーディオ処理プログラムで開き、トランスコードしてフォーマットし、ハード ドライブに保存することができます。 もちろん、変更を CD に保存することはできません。

MP3コーデック

音楽業界に LAME MP3 Encoder コーデックが登場してから、オーディオの世界で真の革命が起こりました。 現在、オーディオ ファイルの「重さ」は数十分の 1 になり始めています。 圧縮を最大にすると、5 分間の作品のサイズが 7 MB を超えることはほとんどありません。 これは大きな進歩でした。 さらに、 この拡張子最後に、いくつかの特性を調整し、ID3 タグなどの追加パラメータを設定する機能が実装されました。 これらには、トラックのタイトル、アーティスト、アルバム、リリース日に関する情報が含まれる場合があります。

もちろん、この形式はすぐに普及しました。 インターネット コミュニティのほぼ全体がこの普遍的な形式を使用しています。 したがって、MP3 フォーマットはコンピュータ オーディオの分野に真の革命をもたらしたと言えます。 現在、これは最も人気があり、人気のあるオーディオ形式の 1 つです。 ただし、今日ではすでに他のオーディオ形式に置き換えられています。 ただし、これについては少し後で説明します。

AIFFファイル

別の種類の音声ファイルもあります。 これはいわゆる aiff 形式です。 この形式は、もともと Macintosh コンピュータで使用するために作成されました。 少し後に変革が起こり、その結果、さまざまなオーディオ形式の互換性が実現され、さまざまなプラットフォームやオペレーティング システムでそれらを使用できるようになりました。

OGG形式

このオーディオ形式も非常に一般的です。 Vorbis のスペシャリストによって開発されました。 この形式には多くの欠点があることに注意してください。 まず、ファイル サイズが小さいにもかかわらず、この形式を使用すると、 高負荷の上 システムリソースコンピューター。

また、このオーディオ形式を使用するには、独自のデコーダとコーデックを使用する必要があります。これらのデコーダおよびコーデックは、 自動モード。 たとえば、FL Studio プロデューサー エディション プログラムを使用する場合、この形式で作業するには、.inf 形式のインストール ファイルを手動でアクティブ化する必要がありました。 それ以外の場合、OGG 形式のファイルはこのアプリケーションで再生されません。 これらすべての欠点にもかかわらず、OGG 形式のオーディオ ファイルは現在非常に一般的であり、そのサウンドは悪くありません。

別のオーディオ ファイル形式である AMR について説明しましょう。 これは簡単に低品質のオーディオ形式として分類されます。 このフォーマットは原始時代に生まれました 携帯電話.mp3 ファイルを着信音として設定できませんでした。 AMR は自然なサウンドを置き換えるために開発されましたが、この形式を使用すると品質が大幅に低下します。 この形式で保存されたオーディオ ファイルの品質は、最新の「高度な」オーディオ形式と比較することさえできません。

MIDIフォーマット

奇妙に思われる方もいるかもしれませんが、MIDI フォーマットはオーディオ フォーマットも指します。 今日では、MIDI システムは単純なコマンドのセットであることが一般に受け入れられています。 ただし、これはかなり物議を醸す発言です。 MIDI の略語は、Musical Instrument Digital Interface の略です。

このシステムは、キーを押したり、テンポ、キー、ピッチを変更したり、追加したりすることにより、オーディオ ファイルを編集および録音するために設計されています。 さまざまな効果。 拡張子 .midi または .mid を持つファイルは、最新のオーディオ録音プログラムやシーケンサーで簡単に再生できます。 この場合、GS、GM、または XG 形式の標準サウンド セットが使用されます。 最初の 2 つのフォーマットはローランドによって開発され、最後のフォーマットはヤマハによって開発されました。 GS および GM フォーマットには 128 の標準サウンドのセットがあり、XG フォーマットにはほぼ 3 倍以上のサウンドがあります。

ここでは、これまでで最もユニークなオーディオ形式の 1 つを紹介します。 FLAC 形式の楽曲は現在広く使用されています。 まず第一に、これは音質によるものであり、真の音楽愛好家はこれに注目します。 この形式の作成の歴史を調べてみると、MP3 をベースにして作成されたことがわかります。 以前は、オーディオ作品を別々のトラックに分割することが使用されていました。 FLAC 形式にはそのようなものはありません。

FLAC オーディオ ファイル構造には 1 つまたは 2 つのファイルがあります。 そのうちの 1 つは情報です。 この形式を再生するには、特別なオーディオ プレーヤーを使用する必要があります。 これらのプレーヤーの 1 人は、 AIMPプログラム。 メイン ファイルを起動すると、コンテナに含まれる音楽トラックのリスト全体がプレーヤー ウィンドウに表示されます。 このプレーヤーでの曲の切り替えは、他のプレーヤーと同じ原理に従って実行されます。 この形式の利点は、トラックを誤って削除する可能性がなくなることです (前述したように、すべてのトラックが 1 つのファイルに含まれます)。

さまざまな音声フォーマットの互換性

現在、多くのオーディオ形式が相互に互換性があります。 最新の DVD プレーヤーとソフトウェア プレーヤーは、どれも簡単に再生できます。 プロのサウンド編集者にも同じことが当てはまります。 今日の処理プログラムは、既知のほぼすべてのプログラムを認識します。 現在オペレーティング システムのいくつかの特有の特性にもかかわらず、オーディオ形式。 シーケンサー、オーディオエディター、 追加モジュールクロスプラットフォーム モードでさまざまなオーディオ形式を処理できます。

オーディオ形式の変換

オーディオ ファイルを変更するにはいくつかの方法があります。 たとえば、ファイルを「ネイティブ」形式で開き、別の形式で保存できます。 さらにシンプルにすることもできます。 オーディオ形式を変換するには、コンバーターという特別なプログラムが使用されます。 オーディオ ファイルを変換するには、最初の形式でこのプログラムにロードし、最終形式を選択して変換するだけです。 それだけです、簡単でシンプルです!

音声処理

特殊な処理プログラムでは状況が異なります。 必要に応じて周波数特性を変更します ソースファイルプロフェッショナルなソフトウェアパッケージなしでは何もできません。 このようなアプリケーションを使用すると、オーディオ ファイルの品質を変更できます。 また、変更できるのは基準サンプリング周波数だけではありません。 このようなソフトウェア アプリケーションを使用すると、深度設定を 16 ビットから 24 ビット、さらには 32 ビットに変更できます。

再生帯域幅、つまりビットレートを調整することもできます。 標準のビットレートは 128 kbps ですが、最高の音質は 320 kbps で実現できます。 誰もが音と音の違いを区別できるわけではありません 標準パラメータその特性を最大限に活かしたサウンド。

ただし、同じトラックを異なる特性で一度、良いオーディオ機器で再生してみることをお勧めします。 違いはすぐにわかります。 オーディオ処理プログラムでは、上記のパラメータを編集できるだけでなく、 パワフルに ソフトウェアパッケージサウンド処理には、通常、多数のモジュールがあります。 これらには、リミッター、ソフトウェア イコライザー、クロスオーバー、コンプレッサー、ノーマライザーなどが含まれます。 各モジュールを使用することで、楽曲のサウンドを好みにカスタマイズすることができます。 このようなプログラムを使用すると、あらゆる形式のオーディオ ファイルを処理できます。

比較

最後に、この記事で説明したすべてのオーディオ形式について簡単に分析してみましょう。 WAV 形式は「重い」にもかかわらず、その後の変換の中間形式として使用できます。 ほとんどの場合、このタイプのファイルは、ライブ オーディオを録音するとき、または開いているプロジェクトを保存するときに見つかります。 .cda 形式は現在ではその関連性を失いました。 OGG および AIFF 形式は、仮想スタジオでの使用に最適です。 AMR 形式は現在では時代遅れであると考えられます。

MIDI オーディオ ファイルは主にミュージシャンによって使用されます。 現在の最良のオーディオ形式は FLAC です。 多くの専門家によると、最も進歩しているのは彼です。 しかし、すでに誰もが使い慣れている MP3 を廃止するのは時期尚早です。 ビデオとサウンド業界は立ち止まっていません。近い将来、膨大な数の新しいオーディオ形式が登場するでしょう。

多くの場合、トラックの品質の尺度になります。 何が最適な音楽形式であるかについては多くの議論があります。 先日、私も同様の争いを目撃しました。 仮想ではなく現実の音声フォーマットについての記事を書き、どの音声フォーマットが最適なのかを人間の言葉で説明してみようと思いました。 読者の脳を再び傷つけないよう、難解な用語や特徴の説明は避けるようにします。

私は「誰かを貶める」つもりはないのと同じように、特定のオーディオ形式を称賛するつもりはないことをすぐに認めます。 みんな自分で決めましょう。 ここでは雑草には立ち入らず、最もよく知られている高品質の音楽フォーマットについて説明します。

これらの議論は、控えめに言っても、このテーマについて知識のない人々によって行われていると思います。 なぜなら、専門家(つまり、自分が何をしているのか、なぜそれをしているのかを知っている人)はこのようなことはしないからです。 現在はオーディオ形式が豊富に存在するため、必要とする人は誰でも必要なものを見つけることができます。 確かに、トラクターと車のどちらが優れているかについて、トラクターの運転手と運転手の間で議論するのは愚かに見えるでしょう。 ある目的ではトラクター、他の目的では車。 ここでも同じです。

WAV- は最高品質の音楽形式と当然考えられています。 このオーディオ形式は非圧縮でロスレスです。 サウンドを録音および処理するときに使用されます。WAV での録音は圧縮されずに行われるため、最高品質のサウンドが得られます。 他のオーディオ形式にエンコードされます。 まあ、結果としてかなりの「重量」になるので、主に録音に使用されます。

非可逆オーディオ圧縮

まず、よく知られ、広く使用されている (必ずしも愛されているわけではない) 形式から始めます。 MP3。このオーディオ形式は、必要な場所でも、必要でない場所でも、どこでも積極的に使用されています。 しかしこれは、彼が自分の専門分野で占める地位にふさわしくないという意味ではありません。 本当に価値があります。 彼は約20年間、自分のニッチな分野に「座って」いたが、まだ誰も彼をそこから「追い出して」いない。 そして、何かを言いたい人もたくさんいました。 そして彼らの一番のお気に入りは WMA(Windows Media)、MP3 の代替として Microsoft によって考案されました。 開発者の努力にもかかわらず、結果として、それは代替手段となりました。 次の文字 - OGG。 より大きなチャンスがあるにも関わらず、 MP3たとえば、決して広く認識されることはありませんでした。 ただし、多くのオペレーティング システムでサポートされています。 おそらく、AAC オーディオ形式について言及する価値があるでしょう。これは、置き換えられるはずでした。 . エンコード品質が向上し、圧縮損失が減少しました。 しかし悲しいかな。

これらの形式の主な利点は、サイズが小さいことです。 欠点は品質の低下です。

ロスレスオーディオ圧縮

FLAC- おそらく、品質を損なうことなく最も一般的なエンコード コーデックとオーディオ形式です。 音楽愛好家は徐々にこの形式に切り替えています。 WavPack彼は競争に値するが、人気はそれほど高くない。 それと同じ話だよ アップルロスレス、サイズが 60% に圧縮されます。

ここでの話はまったく逆です。品質は向上し、サイズは大きくなります。

懐疑論者は耳で区別するのはほぼ不可能だと主張する MP3(320kビット/秒)から ロスレス。 「違いがないなら、なぜもっと支払う必要があるのでしょうか?」 確かに、音楽愛好家であっても、従来の機器を使用してオーディオフォーマットの違いを感じることは非常に困難です。 しかし、この違いをすぐに感じる人もいます(私は個人的に実験に立ち会いました)。 しかし、優れたデバイスで聴くと、その違いは非常に大きくなります。 問題はそれです 良いデバイス誰もがそれを買う余裕があるわけではありません。