Цифровой звук представляет собой не что иное, как комбинацию цифр. При помощи определенного алгоритма звук как давление воздуха преобразуется в потоки данных и кодируется для последующей обработки и воспроизведения. В зависимости от использованного алгоритма, музыкальный файл имеет тот или иной формат, то или иное расширение.
Напомним, что наряду с цифровым звуком существует аналоговый звук, который представляется непрерывным электрическим сигналом, отображающим изменение звуковой волны. Перевод аналогового звука в цифровой представляет собой фиксацию числового значения амплитуды в тот или иной момент с заданной плотностью значений. Соответственно, чем больше значений зафиксировано, тем более достоверно и точно воссоздается картина оцифровываемого звукового фрагмента. При подобной оцифровке возникают весьма объемные массивы данных, которые, в зависимости от используемого формата, отличаются по соотношению качества звука/объема конечного файла.
Пожалуй, главным преимуществом цифрового звука перед аналоговым можно считать возможность хранить и копировать данные бесконечно долго без потери исходного качества (в то время как при копировании с одного аналогового носителя на другой достаточно заметно снижение качества записи).
Наиболее распространенным и популярным форматом цифрового звука на сегодняшний день является MP3 (MPEG Layer 3). Он был разработан, после ряда промежуточных форматов и исследований, начавшихся в 1987 году, институтом Фраунхофера в Германии.
Разработчики формата стояли перед задачей упростить и удешевить пересылку длинных музыкальных фрагментов. Как известно, одна минута стереосигнала с компакт-диска (разрядность 16 бит, частота дискретизации 44,1 кГц) занимает порядка десяти мегабайт памяти. При этом, в отличие от текстовых или графических файлов, аудиосигнал невозможно сжимать без потери качества. Таким образом, передача через модем одной несжатой композиции с Audio CD продолжительностью 3 минуты при передаче данных со скоростью, скажем, 24 кбит/с займет несколько часов. Ученым института Фраунхофера удалось достичь многократного сжатия объема файла: в среднем одна минута аудиосигнала, сжатого в формате МР3, занимает порядка 1 мегабайта. Принцип сжатия основан на устранении из музыкального файла «лишних» звуков, к которым человеческое ухо невосприимчиво, либо дублирующих друг-друга.
Основным фактором, определяющим соотношение объема файла и качества звучания в рамках заданного формата, является битрейт. Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Наиболее распространенными в интернете являются композиции с битрейтами 128 и192 Кбит/с. Максимальный битрейт, поддерживаемый программами и устройствами, работающими с MP3, — 320 Кбит/с. Отличия МР3-файлас битрейтом 320 на практике способен заметить исключительно эксперт или профессионал, работающий со звуком.
Для оптимизации размера музыкальных MP3-файлов при сохранении достойного качества применяется переменный битрейт (аббревиатура VBR — variable bit rate). В этом случае программа-кодер разделяет файл на фрагменты разной спектральной насыщенности и кодирует их с подходящим битрейтом. Большинство современных MP3-плеееров поддерживают воспроизведение файлов с переменным битрейтом. Значительный плюс MP3-файлов заключается в том, что они могут содержать имя исполнителя, название трека и альбома, год его выхода и т. п. Совокупность этих данных называется ID3-тегами. Большинство современных плееров умеют считывать их и отображать на экране.
В 2001 году компанией Swedish Coding Technologies совместно с Thomson Multimedia был создан кодек MP3 Pro. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству большинства других кодеков. По этой причине данный формат применяется преимущественно для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.
Другой разновидностью МР3 стала разработка MP3 Surround, представленная недавно создателями МР3 – Институтом Фраунхофера. Этот формат повторяет все особенности многоканального звука, оставаясь при этом совместимым со стандартным стерео-МР3: на дополнительную дорожку записывается информация, описывающая объемные характеристики звука. При проигрывании файлов данного формата на специальной технике, способной считывать эту дорожку, можно получить объемное звучание, отвечающее стандарту Surround 5.1. Обычные устройства также читают файлы MP3 Surround, однако извлекаемый ими звук ничем не отличается от классических МР3.
Формат WAV был создан инженерами Microsoft и Intel. Аббревиатура WAV расшифровывается как Waveform Audio File Format. Полное название формата - Microsoft RIFF/WAVE — Resource Interchange File Format/Wave — формат файлов передачи ресурсов/волновая форма. WAV является основным форматом для большинства систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах.
Apple AIFF является стандартным для Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format (формат файла обмена звуком), в чем-то он схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Впрочем, в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.
Кодек WMA, или Microsoft Windows Media Audio, является серьезной альтернативой МР3. Файлы этого формата имеют расширения .WMA и .ASF, обладают явным преимуществом перед МР3 на низких скоростях потока данных (битрейтах) и теряют его при увеличении скорости подачи информации на кодек. На основе WMA разработан стандарт WMA DRM, реализующий близкую сердцу звукозаписывающих компаний защиту от копирования. Файлы, созданные на основе этого формата, можно записывать на устройства воспроизведения, типа МР3-флэш-плееров, однако скопировать их оттуда нельзя.
ATRAC(Adaptive TRansform Acoustic Coding — акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока — 292 кбит/с (сжатие 1:5). Применяется в системах MiniDisk.
Формат Ogg Vorbis — относительно новый универсальный формат записи звука с потерями данных. Он принадлежит к тому же типу форматов аудиосжатия, что и МР3 и WMA, а психоакустическая модель, описывающая особенности человеческого слуха, в соответствии с которыми производится сжатие, по принципам действия близка к МР3. Радикальным же отличием этого формата стала математическая обработка и практическая реализация модели. Пороговая максимальная частота оцифровки здесь не 44 кГц как в MP3, а 48, что теоретически улучшает качество звука. Также следует отметить, что теоретическое число каналов не ограничено двумя, как обычно, а достигает 255. Файлы, закодированные в этом формате, меньше аналогичных файлов в МР3. Распространение формата долгое время сдерживалось недостаточной поддержкой со стороны производителей аппаратуры.