Форматы аудиофайлов и их характеристика. Форматы звуковых файлов

19.08.2019 Социальные сети

В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.

Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных – digital: OGG, Mp3, Flac, Wav форматов.

Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье постараюсь рассказать о наиболее популярных расширениях audio files, с которыми Вы сталкиваетесь.

Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов? Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows.

Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки – достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 “метров” – это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.

AA (Audible Audio Book File) – формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов – digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.

AAC (Advanced Audio Coding) – формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC – семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) – это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: [.m4a ], [ .m4b ], [ .m4p ] .

Также AAC - это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

На 2009 год распространён значительно меньше, чем MP3 и другие альтернативные решения. AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Преимущества AAC перед MP3:

– до 48 звуковых каналов;

– большая эффективность кодирования как при постоянном, так и при переменном битрейте;

– частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);

– более гибкий режим Joint stereo.

ADX – основанный на АДИКМ проприетарный формат сжатия с потерями и хранения звукозаписи, разработанный CRI Middleware специально для использования в видеоиграх. Наиболее характерная особенность - возможность зациклить звукозапись, что делает применение формата удобным для использования в качестве фоновой музыки в различных играх, поддерживающих этот медиаконтейнер. Его поддерживают множество игр для SEGA Dreamcast некоторые игры для PlayStation 2 и GameCube.

В отличие MP3, в нём не применяется психоакустическая модель уменьшения объёма данных о звуке (уменьшения его сложности). Вместо этого модель ADPCM использует для сохранения образцов запись данных относительной ошибки функции предсказания, что означает бо́льшую сохранность исходного сигнала после кодирования; по существу, сжатие ADPCM, вместо использования полных переразмерянных образцов звукозаписи, предоставляет образцы отклонения сигнала от предыдущего значения, которые имеют гораздо меньший размер, обычно - 4 бита. Для человеческого уха такое отклонение находится на уровне шума, что делает потерю качества едва заметной.

AIFF – это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Если вам когда-нибудь потребуется пересылать аудиофайлы между персональным компьютером и компьютером Macintosh, используйте именно этот формат. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. Файлы этого формата могут содержать заголовок Mac-Binary, а могут и не иметь его. Если файл данного типа не содержит заголовка Mac-Binary, он, скорее всего, имеет расширение aif. Если файл данного типа содержит заголовок Mac-Binary, то Sound Forge откроет его, но идентифицирует как файл формата Macintosh Resource (см. следующий раздел). В этом случае файл, скорее всего, имеет расширение snd. Замечание При сохранении файлов на компьютерах Macintosh к ним добавляется так называемый заголовок Mac-Binary. Это маленький фрагмент информации, записываемый в начале файла, идентифицирующий тип файла для операционной системы Mac OS и других приложений. Таким способом компьютеры Macintosh сообщают, что содержит файл: текст, графику или, например, аудиоданные.

AMR (Adaptive multi rate) [. amr ] - адаптивное кодирование с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую ёмкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети, в любых условиях обеспечивая кристально чистую передачу голоса.

APE – (Monkey ‘ s Audio ) [. ape ] – разработчик Мэтью Т. Эшланд – формат цифрового звука без потерь качества (lossless ). Кодек Monkey’s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey’s Audio используют следующие расширения: .ape – для хранения аудио и.apl – для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.

Apple Lossless [. m 4 a ]это аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных.Apple Lossless данные хранятся в контейнере MP4 с расширением.m4a. Хотя Apple Lossless имеет такое же расширение файла, как AAC, это не AAC, кодек схож с другими Lossless кодеками, такими как FLAC и др. Плеер iPod с док разъемом (не shuffle) и последней прошивкой может проигрывать файлы в формате Apple Lossless. Он не использует какие-либо управления цифровыми правами (DRM), но, с учётом характера контейнера, считается, что DRM может применяться к ALAC.

Тесты показали, что сжатые в ALAC файлы получаются примерно от 40 % до 60 % размера оригиналов в зависимости от вида музыки, подобно другим Lossless форматам. Кроме того, скорость, с которой он может быть декодирован, делает его полезным для устройств с ограниченной производительностью, такие как iPod.

Apple Lossless Encoder был представлен в качестве одного из компонентов QuickTime 6.5.1 28 апреля 2004 года и как функция iTunes 4.5. Кодек используется также в AirPort Express в AirTunes осуществления.

Декодер для Apple Lossless формата теперь есть в открытых источниках библиотеки libavcodec. Это означает, что любой мультимедийный проигрыватель на основе этой библиотеки, включая мультимедиа VLC и MPlayer, может иметь возможность играть Apple Lossless файлы.

CDDA (Compact Disc Digital Audio ) - звуковой компакт-диск, международный стандарт хранения оцифрованного звука на компакт-дисках, представленный фирмами Philips и Sony. Звуковая информация представлена в импульсно-кодовой модуляции с частотой дискретизации 44,1 кГц и битрейтом 1411,2 кбит/с, 16 бит стерео.

С пецификация аудио в стандарте Red Book:

– максимальное время всех записей составляет 79,8 минут;

– минимальное время трека - 4 секунды (включая 2-секундную паузу);

– максимальное количество треков - 99;

– максимальное число точек отсчёта (разделов трека) - 99 без ограничений по времени;

– должен присутствовать International Standard Recording Code (ISRC).

DTS – (Digital Theater System ) , по сути – это Dolby Digital , а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby , так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате.

DTS это цифровая театральная система - семейство систем цифровой многоканальной звукозаписи, созданное компанией «Диджитал Тиэтер Систем» для демонстрации цифровых фонограмм в кинотеатрах синхронно с прокатными фильмокопиями. Кроме сопровождения плёночных фильмокопий, обе системы (DTS и Dolby Digital ) в упрощённом виде используются на оптических видеодисках для домашнего просмотра. DTS использует меньший уровень сжатия, чем Dolby , но абсолютного превосходства нет ни у одной из систем. Споры о преимуществах DTS или Dolby Digital не прекращаются по сей день. Формат DTS Stereo практически идентичен Dolby Surround . DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. DTS в домашних театрах допускает полный битрейт (1509,75 кбит/с).

FLAC (свободный кодек из проекта Ogg) [.flac ] – (англ. Free Lossless Audio Codec - свободный аудио-кодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, FLAC не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высокачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID 3 v 1 и ID 3 v 2, поэтому их можно свободно добавлять и редактировать.

MIDI (Musical Instrument Digital Interface ) – цифровой интерфейс музыкальных инструментов. Это стандарт цифровой звукозаписи на формат обмена данными между электронными музыкальными инструментами.

Интерфейс позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т.п.

Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

MP 2 (MPEG -1 Audio Layer II или Musicam) [. mp 2 ] – один из трёх форматов (уровень 2) сжатия звука с потерями, определённых в стандарте MPEG-1. Применяется в цифровом радиовещании DAB и устаревшем стандарте Video CD, который в 90-е годы использовался для распространения фильмов на оптических компакт-дисках и существовал до широкого распространения DVD.

Кодер MPEG-1 Audio Layer 2 развился из аудиокодека MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing - универсальное полосное кодирование и мультиплексирование с адаптацией к шаблону маскировки), разработанного CCETT, Philips и IRT в 1989 как часть исследований EUREKA 147 европейских межправительственных разработок для систем цифрового радиовещания для стационарных, портативных и мобильных приёмных устройств. Основные параметры MPEG-1 Audio были унаследованы из MUSICAM, включая банк фильтров, обработку во временной области, размер аудиокадра и т.д. Однако, после дополнительного усовершенствования, алгоритм MUSICAM не был использован в финальной версии стандарта MPEG-1 Layer II.

MP 3 (MPEG Layer 3) [. mp 3 ] третий формат кодирования звуковой дорожки MPEG - лицензируемый формат файла для хранения аудио-информации.На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. Многие музыкальные гурманы, предпочитают сжимать музыку с максимальным качеством – 320 kbps , либо переходить на другие форматы, например FLAC , где битрейт в среднем ~1000 kbps .

MusePack [. mpc ]нелицензируемый формат файла для хранения аудиоинформации, распространяемый по GNU General Public License .

В Musepack’е применяется разбиение на полосы частот, поэтому он относится к так называемым subband-кодекам. Основная особенность - точная настройка психоакустики, что позволяет работать с чистым VBR-кодированием (кодирование с переменным битрейтом). Основной задачей Musepack является прозрачность звучания закодированной музыки.

В современных форматах, таких как: MP3, Vorbis, AAC, AC3, WMA производится второе dct-преобразование, что позволяет им добиться лучшего качества на средних и низких битрейтах, но не позволяет добиться высоких результатов на более высоких. MusePack не производит второго dct-преобразования, что позволяет достичь непревзойденного качества на битрейтах выше 180.

Так же как в AAC и некоторых других современных форматах, в Musepack производится спаривание каналов по полосам частот, что незначительно отражается на качестве, но позволяет сильно сэкономить на размере. В MP3 спаривание каналов производится не по полосам частот, а для всей полосы целиком, разбивая сигнал на частотные подполосы, затем производит разложение сигнала в ряд косинусов (MDCT - частный случай преобразования Фурье) и записывает округленные (квантованные) значения полученных после преобразования коэффициентов (квантование происходит в соответствии с проводимым психоакустическим анализом). MPC же после разбиения сигнала на частотные подполосы просто производит переквантование (опираясь на психоакустику) амплитудного сигнала в каждой подполосе и полученные округленные (квантованные) значения записывает в выходной поток. Этим же фактом объясняется и большая скорость компрессии и декомпрессии MPC.

MOD – формат разработан для платформы Amiga. Каждый файл MOD содержит оцифрованные записи real звучания инструментов, так называемые сэмплы, чем-то похож на структуру MIDI. Cj или композитор, пишущий в формате MOD, применяет программу, называемую трэкером, в которой указывает, какой именно инструмент, в какое время, какой нотой и октавой должен прозвучать – эта последовательность нот записывается в список – трек, а несколько параллельно звучащих треков образуют блок, называемый паттерном. Совокупность паттернов образует модуль – файл в формате MOD, с расширением.mod. Одна линейка трекера соответствует одному реальному каналу, в котором cj может проиграть или отредактировать пронумерованные ноты. Нотам могут назначаться различные “орнаментами” – например: тремоло, глиссандо и т.д.

OGG [.ogv ], [.oga ], [.ogx ], [.ogg ] – открытый стандарт формата мультимедиа контейнера, являющийся основным файловым и потоковым форматом для мультимедиа кодеков фонда Xiph.Org, а также название проекта, занимающегося разработкой этого формата и кодеков для него. Как и все технологии, разрабатываемые под эгидой Xiph.Org, формат Ogg является открытым и свободным стандартом, не имеющим патентных или лицензионных ограничений.

Ogg является всего лишь контейнером. Музыка или видео сжимаются кодеками, а результат обработки хранится в подобных контейнерах. Контейнеры Ogg могут хранить потоки, закодированные несколькими кодеками. Например, файл с видео и звуком может содержать данные, закодированные аудио и видео кодеками.

В контейнере Ogg можно хранить звук и видео в различных форматах (таких как MPEG-4, Dirac, MP3 и другие).

RealAudio [. ra ],[. ram ]Пропиарный стандарт на потоковое вещание и на формат медиафайлов, принадлежащий фирме « RealNetworks Products and Services ». RealAudio впервые представленный в составе пакета RealAudio 10, кодек для сжатия звука без потери качества.

Среди плюсов данного кодека - поддержка потокового вещания, очень быстрое декодирование. К минусам относят закрытость кода и отсутствие многоканальности. Доступен для Microsoft Windows , Macintosh и GNU / Linux .

RKAU [.rka ]Среди всех аудиокодеков RKAU занимает совершенно особое место. Во-первых это – самый маленький (всего 25kB!) и самый быстрый кодер. Во-вторых помимо того, что он является программой сжатия звука без потерь (lossless), в нём предусмотрены режимы сжатия с потерями, обеспечивающие большую, нежели все известные lossless-алгоритмы, степень сжатия. Однако благодаря особенностям алгоритма, лежащего в основе rkau искажения, вносимые кодеком лежат не в спектральной (как в случае психоакустических моделей кодеров MP3, MP+, AAC и других), а в реальной области. То есть имеют, грубо говоря, нелинейную природу, как и искажения большинства трактов. При этом не происходит потери мелких деталей и микропланов фонограммы. Однако если “переусердствовать” в этом отношении, то звук может стать совершенно неудобоваримым: в звучании появятся жёсткие шумоподобные артефакты, а само звучание приобретёт ярко выраженное окрашивание.

В иерархии аудиокодеков программа rkau стоит стовершенно особняком. Она настолько оригинальна, что не имеет аналогов среди прочих алгоритмов сжатия аудиоданных. Малый размер программы-кодера (25kB) и высокая скорость работы при сходных с остальными lossless-алгритмами степенями сжатия выводят rkau в безусловные лидеры. И хотя самым эффективным lossless-кодером можно считать OptimFROG, рассмотренный в прдыдущей части статьи, rkau лишь ненамного отстаёт от него по эффективности. Однако при активации режима сжатия “с потерями”, rkau даже в режиме наивысшего качества оставляет далеко позади все lossless-алгоритмы, приближаясь по эффективности к программ, основанным на психоакустической модели (MP3, MP+, AAC, VQF и другие). При этом не происходит характерной для MPEG-подобных алгоритмов потери микропланов и нюансов исходного аудиоматериала, а неизбежно возникающие при этом артефакты можно заметить только на очень качественной аппаратуре при многократном сравнительном прослушивании.

Shorten [.shn ] – представляет собой формат, используемый для сжатия аудиоданных. Это форма сжатия файлов используется для сжатия CD-качества, tp gjnthm аудио файлов (44,1 кГц, 16 бит, стерео PCM ). Этот формат до сих пор используется некоторыми людьми, потому что по закону продаются концертные записи в, которые кодируются как Shorten файлы.

Speex [. spx ] – это свободный кодек для сжатия речевого сигнала, который может использоваться в приложениях «голос-через-интернет» (VoIP ). С высокой вероятностью он не имеет никаких патентных ограничений и лицензирован под последней версией лицензии BSD (без третьей статьи). Сжатые кодеком Speex данные можно хранить либо в формате хранения звуковых данных Ogg , либо передавать напрямую с помощью пакетов UDP / RTP .

Разработчики противопоставляют свою разработку другим открытым кодекам, например, кодеку Vorbis , утверждая, что именно кодек Speex лучше всего подходит для передачи голоса по сети с ненадёжной доставкой пакетов данных. При этом авторы разработки специально подчёркивают, что кодек подходит для использования в сетях с ненадёжной передачей пакетов, то есть либо пакет пришёл, либо нет.

Speex относится к классу так называемых Code Excited Linear Prediction (CELP )-кодеков, то есть кодеков, построенных на основе так называемого Линейного Предсказательного кодирования ЛПК. ЛПК использует для аппроксимации отрезка речевого сигнала цифровой фильтр только с обратными связями (т. н. «авторегрессионный фильтр»). Коэффициенты этого фильтра «подгоняются» под отрезок сигнала с помощью процедуры Левинсона (в западной литературе - Левинсона-Дурбина). CELP -модификация ЛПК предусматривает наличие т. н. «кодовой книги», которая содержит предопределённые наборы возбуждающих ЛПК-фильтр единичных импульсов.

Речевой сигнал в кодеке Speex разбивается на неперекрывающиеся отрезки длительностью 20 мс (160 отсчётов при 8 КГц). При этом, для оценки возбуждающего набора вышеуказанный отрезок разбивается на четыре подотрезка длительностью 5 мс соответственно. На каждом из подотрезков отыскиваются возбуждающие наборы импульсов как текущего подотрезка (из кодовой книги), так и двух предыдущих подотрезков. В отличие от других кодеков, с целью избежать патентных ограничений, Speex не использует алгебраическое кодирование, а только векторное. Возбуждения двух предыдущих подотрезков складываются с переменными весами, в отличие от ряда других кодеков, где используются переменные положения по времени.

По заявлению разработчиков, Speex оптимизирован для получения высококачественного речевого сигнала при низких скоростях. Кодек Speex также позволяет использовать переменную степень сжатия сигнала и поддерживает сигналы с различной шириной полосы: сверхширокополосный (частота дискретизации 32 кГц), широкополосный (16 кГц) и узкополосный (8 кГц).

TAK (Tom ‘ s lossless Audio Kompressor ) [. tak ]Аудиокодек и формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования.Распространяется бесплатно вместе c набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам: Winamp, foobar2000 и др.Разработчик - Thomas Becker, Германия.Относительно новый кодек. Первая финальная версия 1.0 была опубликована 26 января 2007 года.

Формат продолжает активно развиваться (последняя версия 1.1.1) и в настоящее время, согласно проводимому опросу на форуме hydrogenaudio.org, входит в число трёх наиболее популярных форматов аудиосжатия без потерь (после FLAC и WavPack)

TTA (True Audio) – бесплатный, аудио кодек, осуществляющий сжатие музыкальных файлов без потерь в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает всеми улучшенными характеристиками, как и большинство современных кодеров. Сжатый размер файлов будет на 30 % – 70 % меньше, чем original music file. TTA формат поддерживает тэги ID3v1 и ID3v2. Используя True Audio кодек, можно разместить до 20 audio CD на одном DVD-R диске.

TwinVQ (Transform – domain Weighted Interleave Vector Quanization ) - векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Labolatories .

VQF-файлы примерно на 30-35 % меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также на 30 % выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы.

Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3.

VQF (Interleave Vector Quanization) – разработан в Японии и основывается на технологии TwinVQ. Если сравнить VQF и MP3, то первый формат на 30-50% будет “компактнее”, при одинаковом качестве звука. Это дает VQF – значительное преимущество перед MP3 форматом. Но процесс при кодировании, декодировании (decoder) VQF, занимает примерно на 30% больше ресурсов процессора PC, чем Mp3 аудио.

Тесты показывают превосходство TwinVQ по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра TwinVQ на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит TwinVQ на ступень выше по качеству звука по сравнению с MP3.

Vorbis [. ogg ] – свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам как AAC, AC3 и VQF, превосходящим MP3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 500 до 1000 кбит/с. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов MP3, Ogg Vorbis имеет полную поддержку на всех популярных платформах (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Однако несмотря на все свои преимущества перед конкурентами, популярность данного формата пока невелика.

WAV (Waveform audio format ) [. wav ], [. wave ] – разработан совместно с IBM . Формат записи (стерео- или моно-) звука без сжатия. Так всего одна минута стереозаписи звука сделанная с CD-качеством (частота дискретизации 44,1 КГц) содержит 60 с х 44100Гц х 2 канала = 5 292 000 отсчетов. На каждый отсчет может приходиться 8 или 16 бит. Таким образом, в варианте 8 бит на отсчет, одна минута звука займет в памяти 42 336 000 бит = 5 292 000 байт (около 5 Мб).

WavPack [.wv ], [.wvс ] – Бесплатный аудиокодек c открытым исходным кодом для сжатия аудио без потери качества. Разработан Дэвидом Бриантом.

WavPack формат позволяет сжимать (и восстанавливать) 8-, 16-, 24- и 32-битные аудиофайлы в.WAV формате. Он также поддерживает потоки звук вокруг и высокие частоты дискретизации (sampling rate). Как у других способов компрессии без потери качества, эффективность сжатия зависит от исходных данных, но обычно она лежит в диапазоне между 30 % и 70 % для обычной популярной музыки, немного выше для классической музыки и других источников с более широким динамическим диапазоном.

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого (точнее, указанного при кодировании) качества с потерей (.WV), который может проигрываться сам по себе, а также файл «коррекции» (.WVC), который (в комбинации с предыдущим.WV) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

WMA (Windows Media Audio ) [. wma ]лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.Изначально формат WMA позиционировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC (используется в популярном онлайновом музыкальном магазине iTunes).

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. Особенно стоит отметить что ранние версии формата (или его реализации) имели проблемы на низких скоростях потока. Также многие меломаны и владельцы цифровых плееров недолюбливают формат WMA за низкую стойкость к ошибкам. Если при кодировании/передаче файла WMA некоторая часть его повреждается, то воспроизведение файла становится невозможным, как после места повреждения, так и за несколько десятков секунд до него. (Для сравнения: при повреждении файла формата MP3, его всё ещё можно воспроизвести от начала до самого места повреждения, затем пропустить несколько секунд и воспроизвести дальше до конца; иногда же ошибки в несколько байт в файле MP3 бывают на слух малозаметны или не заметны вообще.) Однако данный формат постоянно развивается, так что можно предполагать, качество будет оптимизироваться.

Большинство портативных аудиоплейеров поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах (вследствие его закрытости).

Microsoft включила в WMA поддержку цифровой системы управления авторскими правами (DRM) (система защиты). Основным следствием ее является невозможность прослушивать защищенные композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина.

В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества англ. lossless, многоканальное кодирование объемного звука и кодирование голоса.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.



IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Звук — это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.

Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Для того чтобы Вам было совсем понятно, скажу, что запись файла на жесткий диск подобна тому, как Вы набиваете таблицы в Microsoft Excel. Естественно данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко(я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали — это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga — одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря прошитый в синтезатор сэмпл.

AIF или AIFF

Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFС или AIFF-С

Тот же AIFF, только с заданными параметрами сжатия(компрессии ).

Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало«весят », за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц — моно. Но есть и 16-ти битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициэнт сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для«обычных немузыкальных» людей потери не ощутимы явно.

Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF — процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук(не музыкальных).

НСОМ

То же самое, что и VOC(восемь бит, моно), но только для Apple Macintosh.

Стандартный формат U-Law. 8 кГц, 8 бит, моно.

Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость пердачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Бывает двух видов. Один — это тот же AU для SUN и NeXT. Другой — это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существует множество различных аудио-форматов. Вы даже не можете себе представить, насколько много аудио-форматов существует. Сейчас мы рассмотрим только наиболее популярные из них, а если вам нужна исчерпывающая информация, то ее вы можете найти в Википедии.

Аудио форматы

Звук - само по себе явление аналоговое. Чтобы его можно было записать в компьютер, его нужно оцифровать. Оцифрованный звук занимает очень и очень много пространства. Поэтому используют специальные алгоритмы кодирования и сжатия данных - кодеки. Кодеки обеспечивают кодирование/декодирование аудио-/видеоданных, а также сжатие/распаковку таких данных. Скачать набор кодеков для Windows:

Тип формата медиафайла (аудио или видео - без разницы) определяется его расширением. Например, у файлов в формате MP3 расширение.mp3. Кодек для этого формата всегда одинаковый - MPEG Layer-З. А вот для формата MP4 кодеки могут быть разными.

Некоторые форматы, например MP4 и FLV, могут содержать в себе как видео-, так и аудиопотоки. Поэтому если вы видите файл с расширением.mp4, то однозначно нельзя сказать, что в нем - только музыка или только видео, или же фильм - аудио и видео. Ведь изначально в таких форматах заложена возможность передачи как аудио, так и видео.

Все мы знаем, что раз информация сжимается, то возможны ее потери. Поэтому все кодеки можно разделить на две группы: с потерей качества и без потери качества. Пусть вас не пугает слово «с потерей» - как правило, кодеки отсекают «лишнюю» информацию, которая не различима для нашего глаза и уха (практически не различима).

К кодекам, обеспечивающим сжатие без потери качества, относят:

  • FLAC (Free Lossless Audio Codec);
  • APE (Monkey’s Audio);
  • ALAC (Apple Lossless Audio Codec).

А вот кодеки с потерей качества:

Если вы - фанат звука, то есть смысл поискать музыку в формате FLAG. Для обычного же бытового прослушивания вполне хватит самого распространенного формата MP3. К тому же, чтобы ощутить всю разницу между форматами MP3 и FLAC, нужно профессиональное оборудование для воспроизведения звука, к сожалению, планшет к такому оборудованию не относится. Поэтому не вижу смысла загружать музыку в формате FLAC на планшет.

Теперь вкратце рассмотрим сами аудио форматы:

  • WAV - самый первый (или один из первых) аудиоформатов. Используется для хранения несжатых аудиозаписей. Одна минута записи в формате WAV занимает 10 Мб. Обычно в этот формат копируют Audio CD, а потом получившиеся WAV-файлы сжимают МРЗ-кодеком для экономии пространства.
  • MP3 (MPEG Layer-3) - самый распространенный звуковой формат. Он урезает звук с потерей качества, но вырезается лишь звук, который не слышится человеческим ухом. В результате человек не слышит разницы, а места звук занимает меньше. Основная характеристика этого формата - битрейт (bitrate). Чем выше битрейт, тем лучше качество звука. Несжатый Audio CD имеет битрейт 1411,2 Кбит/с. Максимальное качество звучания в случае с форматом MP3 достигается при битрейте 320 Кбит/с. Все, что ниже 320 Кбит/с, -хуже качеством. Разница между 128 Кбит/с и 320 Кбит/с уже ощущается на слух, поэтому, если есть возможность скачать записи с более высоким битрейтом, сделайте это.
  • WMA (Windows Media Audio) - формат, разработанный компанией Microsoft для ОС Windows. Компания Microsoft пыталась создать замену для MP3, но, как показало время, у нее ничего не вышло.
  • OGG - открытый формат, поддерживающий кодирование аудио различными кодеками. Наиболее часто в OGG используется кодек Vorbis. По качеству сжатия формат сопоставим с MP3, но при этом менее распространен с точки зрения поддержки в аудиопроигрывателях и плеерах. Если есть возможность скачать музыку в формате MP3 и OGG, следует выбрать MP3, потому что ваш аудио-проигрыватель может не поддерживать формат OGG.
  • ААС - запатентованный аудиоформат, обеспечивающий лучшее качество звучания, чем MP3. На данный момент это лучший алгоритм кодирования звука с потерями. Файл этого формата может иметь расширения аас, mp4, m4a, m4b, т4р, т4г.
  • FLAC - формат сжатия без потерь. Он не вносит изменений в аудиопоток, поэтому закодированный с его помощью звук идентичен оригиналу. Используется для прослушивания звука на звуковых системах высокого уровня.

Видео форматы

Всевозможных форматов и стандартов видеоконтента не меньше, чем аудиоформатов. Начнем с международных стандартов, определяющих кодирование и формат хранения данных медиафайла:

  • MPEG-1 (Moving Picture Experts Group 1) - это стандарт сжатия видео и аудио. Для видео используется формат Video CD, а для аудио формат MPEG audio layer 3, или сокращенно всем известный формат MP3.
  • MPEG-2 (Moving Picture Experts Group 2) - этот стандарт используется в DVD и цифровом телевидении DBV. В этом формате снимают видео в различных устройствах для съемки видео.
  • MPEG-3 (Moving Picture Experts Group 3) - этот стандарт был разработан для телевидения высокой четкости HDTV, теперь стал частью стандарта MPEG-2.
  • MPEG-4 (Moving Picture Experts Group 4) - этот стандарт используется для сжатия цифрового видео и аудио. Состоит из нескольких стандартов, включает в себя многие возможности MPEG-1 и MPEG-2. В этом стандарте используются различные кодеки: DivX, Xvid, Н.264 (AVC) и другие. Формат MP4 является одной из спецификаций этого стандарта.

Медиафайл (правильнее именно медиафайл, а не видеофайл, поскольку в файле, который мы привыкли считать видеофайлом, есть потоки аудио и видео) имеет две ключевые характеристики: кодек и тип контейнера. Кодек, как мы уже знаем, определяет алгоритм кодирования и сжатия данных. Тип контейнера определяет формат записи с использованием различной информации: видео- и аудиоданные, субтитры и прочая информация, помещенная в контейнер. Примеры кодеков видео - DivX, Xvid, Н.264, Theora. Примеры контейнеров - AVI, QuickTime, 3GP, Ogg, MKV (Matroska).

Наиболее популярные форматы медиафайлов:

  • 3GP - разработан для использования на мобильных телефонах, в ЗС-сетях. Гарантирует мощное сжатие, что позволяет использовать формат на слабых мобильных телефонах.
  • AVI (Audio/Video Interleaved) - разработка Microsoft, один из самых распространенных в мире форматов. В этом формате можно использовать разные кодеки.
  • FLV (Flash Video) - создан для передачи видео через Интернет. Самый распространенный формат в Интернете, часто используется на разных видеохостингах, предназначенных для хранения видео. Обеспечивает хорошее качество картинки при низком битрейте.
  • M2TS - видеофайл формата Blu-Ray.
  • MKV (Matroska) - контейнер, который может содержать видео, аудио, субтитры и прочее. Этот формат может содержать различные типы субтитров и поддерживает добавление нескольких звуковых дорожек в видео файл.
  • OGG - бесплатный, открытый формат, разработанный для хранения медиаконтента, закодированного разными кодеками.
  • ReadMedia - формат, созданный компанией RealNetworks. Используется в основном для трансляции телевидения и потокового видео в Интернете. Низкий битрейт и низкое качество картинки.
  • MOV - контейнер, разработанный корпорацией Apple для QuickTime. Это формат операционной системы Mac OS X.
  • MP4 - формат одной из спецификаций стандарта MPEG-4. Может содержать несколько видео- и аудиопотоков, субтитры, анимацию, панорамные изображения.
  • SWF (Shockwave Flash или Small Web Format) - видеоформат для флеш-анимации, векторной графики, видео и аудио в сети Интернет.
  • WMV (Windows Media Video) - разработка Microsoft. Попытка создать аналог MP4, которая тоже не увенчалась успехом.
  • WebM - открытый формат, предложенный корпорацией Google в качестве замены стандарта H.264/MPEG4.

Зачастую является мерилом качества трека. Много споров ведется о том, какой же самый лучший формат музыки. Вот и я на днях стал свидетелем подобного спора. Не виртуального, а реального.В общем, решил я написать статью про аудиоформаты и человеческим языком попытаться объяснить какой самый лучший формат аудио. Постараюсь избежать заумных терминов и описания характеристик, чтобы лишний раз не травмировать мозг читающих.

Сразу же признаюсь, что не буду петь дифирамбы в честь какого-то конкретного аудиоформата, равно как и «опускать» никого не собираюсь. Пускай каждый сам решает. Не буду залезать в «дебри» и пробегусь по наиболее известным форматам музыки высокого качества.

Я считаю, что споры эти ведут люди, мягко говоря, не сведущие в этой теме. Так как профессионалы (то есть люди, которые знают, что они делают и зачем они это делают) не будут заниматься подобным. При нынешнем изобилии аудио форматов любой нуждающийся найдет то, что ему нужно. Согласитесь, глупо будет выглядеть спор тракториста и шофера, на тему что лучше — трактор или машина. Для одних целей — трактор, для других — машина. Вот и здесь так же.

WAV — справедливо считается самым качественным форматом музыки. Этот формат аудио без сжатия и без потери качества. Используется при записи и обработке звука, это самый качественный звук, так как запись в WAV происходит без сжатия. Кодируется в любой другой аудиоформат. Ну и как результат — довольно много «весит», поэтому используется преимущественно при звукозаписи.

Сжатие звука с потерями

Начну со всем известного и всеми применяемого (хоть и не всегда любимого) формата MP3. Этот аудиоформат активно используется везде и всюду, где надо и где не надо. Но это не значит, что он недостоин места, которое занимает в своей нише. Очень даже достоин. Хоть «сидит» он в своей нише уже около двух десятков лет, никто его пока оттуда не «вышиб». А желающих было много надо сказать. И главный фаворит из них WMA (Windows Media ), который задуман был Microsoft, как альтернативаMP3. В итоге он альтернативой и является, не смотря на старания разработчиков. Следующий персонаж — OGG . Несмотря на более широкие возможности, чем MP3 , например, так и не получил массового признания. Хоть и поддерживается многими операционными системами. Пожалуй, стоит упомянуть еще аудиоформат AAC, который должен был в эстафете сменить . В нем улучшено качество кодирования и уменьшены потери при сжатии. Но… увы.

Главным преимуществом этих форматов является небольшой размер. Из минусов — потеря качества.

Сжатие звука без потерь

FLAC — пожалуй, самый популярный кодек кодирования и формат звука без потери качества. Меломаны постепенно переходят на этот формат. WavPack составляет ему достойную конкуренцию, но не так популярен. Такая же история и с Apple Lossless , в котором размер сжимается до 60%.

Здесь история с точностью до наоборот: качество лучше, а размер больше.

Скептики утверждают, что на слух практически невозможно отличить MP3 (320 кбит/c) от Losless . «А если разницы нет, зачем платить больше?». Действительно, на обычной аппаратуре почувствовать разницу аудиоформатов достаточно сложно, даже меломанам. Но есть и такие, которые эту разницу сразу чувствуют (лично присутствовал на эксперименте). А вот при прослушивании на хорошем аппарате разница огромная. Вся беда в том, что хороший аппарат далеко не все себе могут позволить.