Что такое разрядность звука
Частота дискретизации и разрядность
При описании цифровых записывающих устройств используют два фундаментальных понятия: частота дискретизации и разрядность. В этой статье мы рассмотрим, что это такое.
Частота дискретизации
Частота дискретизации — это частота, с которой записывающим устройством фиксируются отсчеты входного сигнала. При записи звука в цифровом виде фактически записываются отдельные отсчеты или, иными словами, значения интенсивности звука в отдельные моменты времени.
Частота дискретизации для записывающих устройств имеет обычно следующие стандартные значения: 44,1 кГц; 48 кГц и 96 кГц. Чем большая величина частоты дискретизации, тем большее количество отсчетов делается за 1 секунду и тем лучше качество цифрового звука мы имеет в результате.
Каково значение этих чисел? Они подразумевают количество раз снятия за секунду записывающим устройством значения интенсивности звука входного сигнала. Для измерения частоты дискретизации используются килогерцы (кГц), 1 кГц = 1 000 отсчетам в секунду.
К примеру, если запись осуществляется с частотой дискретизации 48 кГц, то это означает, что значение интенсивности звука звукозаписывающее устройство измеряет и фиксирует 48 000 раз в секунду.
Такое количество может показаться невообразимо огромным, но здесь стоит вспомнить о явлении, называемом частотой Никвиста. Частота Никвиста названа так в честь человека, который первым ее обнаружил. Она определяет наивысшую частоту звука, которую возможно записать при данной частоте дискретизации.
Если говорить вкратце, то максимальное значение высоты звука, которое может быть подано в цифровом виде, равно примерно половине частоты дискретизации.
Поэтому, при проведении записи с частотой дискретизации 48 кГц максимальная частота звука, которая может быть записана, равна 24 кГц. Этого вполне достаточно, если учесть, что человеческое ухо слышит частоты в среднем от 20 Гц до 20 кГц.
Разрядность
В разговоре о цифровых записывающих устройствах часто можно услышать слова «16 бит», «24 бита» и т. д. Одни означают количество единиц информации, с помощью которых можно представить значение каждого отсчета, получаемого при цифровой записи.
Чем большая величина этого числа, тем точнее можно записать значение каждого отсчета и тем более высокое качество звука можно получить в итоге.
Не стоит думать, что чем больше количество бит, то есть чем выше величина разрядности, тем большее значение интенсивности можно зафиксировать. Здесь имеется в виду именно точность представления.
В современных записывающих устройствах обычно реализована разрядность 24 бита. Стоит учитывать, что запись с большой разрядностью занимает много места на устройстве хранения, но это не так уж важно, ибо современные носители отличаются огромными объемами и постоянно стают более и более доступными в финансовом плане.
Что такое разрядность звука
www: kramer.ru, e-mail: academy@kramer.ru
МУЗЫКА ПОД ПРЕССОМ
ЗАПИСЫВАТЬ МУЗЫКУ ЛЮДИ НАУЧИЛИСЬ ОЧЕНЬ ДАВНО. ИЗ-ЗА ОТСТАЛОСТИ АНТИЧНОЙ ТЕХНИКИ ДРЕВНИЕ ЭЛЛИНЫ ВЫНУЖДЕНЫ БЫЛИ ДЕЛАТЬ ЭТО С ПОМОЩЬЮ ОСОБОГО НОТНОГО ПИСЬМА, ПРИЧЕМ ВЫСОТА ЗВУКОВ ОБОЗНАЧАЛАСЬ С ПОМОЩЬЮ БУКВ, А ДЛИТЕЛЬНОСТЬ ЗАДАВАТЬ ТО ЛИ НЕ УМЕЛИ, ТО ЛИ НЕ СЧИТАЛИ НУЖНЫМ.
Тем не менее этот способ записи дожил аж до XI в. нашей эры, когда было создано нечто похожее на современную нотную грамоту. Но до настоящей звукозаписи было еще далеко. Для того чтобы воспроизвести музыку, нужно было, во-первых, уметь играть на музыкальных инструментах, а во-вторых, читать ноты.
С помощью таких приборов можно установить, что некоторые музыкальные инструменты, например скрипка, имеют относительно равномерный спектр, а у некоторых духовых спектры с ярко выраженными максимумами и минимумами, называемыми формантами.
Терминов, прямо описывающих тембровую окраску голоса человека или музыкальных инструментов, не существует, поэтому приходится прибегать к различным метафорам, вроде «глубокий тембр», «жесткий тембр», «металлическое» или даже «транзисторное» звучание.
Попытки использовать цифровые методы обработки информации применительно к записи звука предпринимались многократно, но первых серьезных результатов удалось добиться в начале 80-х годов XX века, и совпали они с бурным развитием компьютеров и успехами микроминиатюризации радиокомпонентов. Применение цифровых методов обработки звука открыло новые и очень интересные возможности.
Сейчас мы не будем вдаваться в теорию кодирования, тем более что она довольно сложна и требует знания высшей математики. Для нас важно понимать, что качество оцифрованного звука и размер полученного файла зависят от частоты дискретизации и разрядности.
Понятно, что такое неэкономное расходование дискового пространства оказалось неприемлемым, и были созданы специальные алгоритмы и форматы для более экономного хранения аудиофайлов.
При сравнении различных форматов сжатия часто используют параметр «качество звучания при определенном битрейте».
В принципе, все программы для кодирования звука (их еще называют кодерами) используют алгоритмы двух видов: для сжатия звука без потерь качества и для сжатия с потерями качества.
Алгоритмы сжатия без потерь качества по сути представляют собой хорошо знакомые пользователям персоналок архиваторы, специально модифицированные под работу со звуковым потоком. При воспроизведении звука «на лету» происходит распаковка файла из архива.
Алгоритмы сжатия с потерями качества основаны, грубо говоря, на том, что путем отбрасывания некоторых относительно несущественных элементов звука получают весьма компактные звуковые файлы. При выборе этих самых «несущественных элементов» используют принципы маскировки звука. Их два: маскировка по частоте и маскировка по времени.
Маскировка по частоте означает, что если рядом с тихим звуком в частотном диапазоне будет находиться громкий звук, то тихий можно отбросить, так как человеческое ухо его все равно не услышит.
Маскировка по времени основана на том, что если сразу за громким звуком последует тихий, то его можно отбросить, ибо изменение порога слышимости человеческого уха происходит не мгновенно.
Все методы кодирования звука с потерей качества работают по одной схеме. Вначале звук разбивается на кадры, из которых удаляются маскируемые компоненты, после чего кадры кодируются методом Хоффмана, в соответствии с которым наиболее часто встречающиеся кодовые слова получают минимальную длительность, а наименее частые, наоборот, максимальную. Разница между методами заключается в способе анализа звука и удаления замаскированных компонентов.
Алгоритмов сжатия аудиофайлов и, соответственно, форматов этих файлов существует великое множество. Например, форматы записи звука в компьютерных играх, в аудиоплеерах и для загрузки через Интернет различаются. Общее правило заключается в том, что файлы с высоким битрейтом имеют относительно высокое качество звука и большой объем, а файлы с малым битрейтом компактны, но музыкой их можно назвать только из вежливости.
Кроме того, различные форматы аудиофайлов создавались для различных компьютерных платформ, таких как PC, Macintosh, Amiga и другие.
Рассмотрим основные форматы аудиофайлов.
Доработанный кодек Voxware превратился в марку WMA и теперь позволяет записывать музыку при битрейте 64 Кбит/с, по качеству аналогичную mp3 с битрейтом 128 Кбит/с. Это означает, что при том же качестве звучания файл WMA занимает вдвое меньший объем, чем файлы mp3. Специалисты считают, что музыка, записанная в WMA, звучит «чище и живее», чем в mp3.
Liquid Audio до недавнего времени считался самым лучшим по качеству воспроизведения и мог бы претендовать на роль преемника mp3, но создатель формата, компания Liquid Audio, повела неудачную политику по его внедрению.
РСМ используется для кодирования несжатых аудиоданных. Существует множество вариантов этого формата, разработанных различными компаниями, например Microsoft.
Macintosh AIFF. Это стандартный формат аудиофайлов для платформы Macintosh. Он поддерживает 8-ми и 16-битные моно- и стереофонические аудиоданные.
RealMedia позволяет создавать потоковые аудио- и видеофайлы для передачи через Интернет. Он предлагает сложные собственные функции сжатия, дающие возможность передавать аудио- и видеоданные через Интернет (даже через медленные телефонные линии) в режиме реального времени.
Microsoft Wave. Подобно формату mp3, это еще один очень популярный формат аудиофайлов для Windows. Поддерживает множество различных типов аудиоданных, в том числе 8-ми и 16-битные, моно и стерео. Файлы в формате Wave имеют расширение wav. l
Нужен ли вам отдельный ЦАП?
Содержание:
Давайте разберемся в этой теме и уясним для себя раз и навсегда — нужен ли вам отдельный ЦАП, или нет.
Думаю, вы ни раз читали на форумах или слышали от знакомых о том, что для того, чтобы слушать качественный звук вам просто необходимо купить отдельный ЦАП. Правда это или нет — будем разбираться. Нужен ли вам ЦАП на самом деле, сколько он стоит и как он работает — обо всём этом я поведую вам в этой статье. Маленький спойлер — может оказаться так, что отдельный ЦАП вам совершенно не нужен.
Итак, что такое ЦАП?
Подобно усилителям для наушников, отдельные ЦАП стали появляться в продаже для того, чтобы хоть как-то компенсировать низкий уровень качества воспроизведения звука. Вы удивитесь, но в 80-е и даже в 90-е годы далеко не всё потребительское оборудование могло справится даже с простыми наушниками, не говоря уже о более серьезном оборудовании. Довольно часто, даже если ЦАП был встроен в готовый прибор, он был неправильно к нему подключен или плохо экранирован, поэтому во время прослушивания вы могли слышать помехи или наводки от работы самого оборудования. Добавим сюда далеко не лучшее качество музыкального материала с низкой частотой дискретизацией первых mp3 файлов и вы можете вообразить на что была похожа музыка 90-х. Согласитесь, никто не захочет слушать такое для собственного удовольствия.
ЦАП преобразует цифровой сигнал в аналоговый, чтобы ваши наушники могли создавать звук. Вот так просто!
Но с тех пор цифровая музыка прошла долгий путь. Значительно возросшая культура производства музыкального оборудования привела к тому, что даже дешевые чипы стали давать довольно хорошее качество звучания, да и музыкальный материал стал гораздо более качественным. Сегодня музыка в формате mp3 почти везде записана с битрейтом в 320 кб/сек, а многие перешли на прослушивание материала в формате FLAC или в новомодном формате MQA. И там, где раньше требовалось серьезное оборудование для достижение хорошего качества звука, сейчас в большинстве случаев достаточно возможностей обычного хорошего смартфона.
Как работает ЦАП?
Любое аудио, независимо от того как оно хранится, в виде виниловой пластинки или mp3 файла, это звуковая волна. Когда компьютер записывает аналоговый сигнал, он представляет его в цифровой форме, напоминающий аналоговую волну. Но если аналоговая звуковая волна плавная и непрерывная, то её цифровая версия дискретна. Это значит, что волна записывается не постоянно, а один раз за определённый промежуток времени. По оси Y записывается амплитуда волны (т.е. насколько она громкая), а по оси X записывается её изменение во времени. Каждая волна имеет определённый период, изменяющийся со временем, и он называется частотой, измеряемой в Герцах. Думаю, вы уже где-то слышали, что частота волны определяет тон звука который вы слышите. Чем выше частота (т.е. чем чаще за единицу времени волна принимает максимальное и минимальное своё значение), тем выше тон звука.
Задача ЦАПа состоит в том, чтобы получить оцифрованную информацию о звуке и по ней воссоздать первоначальный звук в аналоговой форме, который потом подаётся в наушники и вы слышите звук. Для этого ЦАП получает данные о каждом положении звуковой волны очень много раз в секунду, это значение называется частотой дискретизации, чем она выше, тем ближе цифровая копия к оригиналу и тем выше качество звука. По причинам того, что ЦАПы несовершенны, при этой процедуре преобразования цифрового сигнала в аналоговый могут возникать различные проблемы, это: джиттеринг, узкий динамический диапазон и ограниченный битрейт (малая частота дискретизации).
Задача ЦАПа состоит в том, чтобы получить оцифрованную информацию о звуке и по ней воссоздать первоначальный звук в аналоговой форме, который потом подаётся в наушники и вы слышите звук.
Прежде чем продолжить, вы должны запомнить следующие термины: битрейт, битность записи звука и частота дискретизации.
Битрейт — показывает какое количество информации о звуке записывается для одной секунды звучания.
Частота дискретизации — показывает сколько раз в секунду было замерено изменение амплитуды звукового сигнала.
Битность звука — показывает какое количество данных было записано за одно измерение частоты дискретизации.
Что такое Джиттеринг?
Сразу хочу вас успокоить, скорее всего вы никогда не слышали этот артефакт звучания и, я думаю, не услышите в будущем. За последние 10 лет даже самые дешевые ЦАПы легко справляется с этим паразитным эффектом, а музыка записанная в mp3 файл с частотой дискретизации 44.1 Гц не подвержена его влиянию, не говоря о более качественных методах хранения звука.
Но всё же, что такое Джиттер? Этот эффект полностью зависит от частоты дискретизации, или от того как часто мы измеряем изменение амплитуды аналоговой звуковой волны. Представьте, что мы делаем это реже, чем 44.1 Гц или раз в секунду. Если мы попытаемся таким образом оцифровать звук очень высокой частоты, например тарелок ударной установки или колокольчиков, мы не будем успевать замерить прохождение сигналом полной амплитуды звука и при неудачном стечении обстоятельств будем замерять только нижние значение амплитуды или средние. В итоге, вместо высокого и чистого звука мы получим невнятное дрожжание звука, которое совсем не похоже на то, что мы записывали. Просто посмотрите на иллюстрацию и вам всё станет ясно.
Минимально необходимая частота дискретизации для полного отсутствия джиттеринга это 44.1 Гц.
Под пунктом А вы видите нормальную частоту дискретизации, которая успевает измерить движение звуковой волны в каждом его положении и в оцифрованном виде мы получим тот же звук, что и слышали от живого инструмента. На рисунке B мы видим, что амплитуда звука успевает полностью измениться, но частота дискретизации недостаточная для того, чтобы успеть замерить это, и потому мы услышим дрожание звука более низкой частоты, чем был звук изначально.
Просто запомните, что минимально необходимая частота дискретизации для полного отсутствия джиттеринга это 44.1 Гц, с этой частотой кодируется вся современная музыка, поэтому я писал чуть выше, что если вы слушаете то, что было записано за последние 20 лет, скорее всего, не содержит этот паразитный эффект.
Что такое битность записи, динамический диапазон и на что они влияют
Если вы послушаете старые mp3 файлы или плохие MIDI записи вы заметите, что вам сложно различать музыкальные инструменты, если они играют одновременно, они просто сливаются в «звуковую кашу» и разобрать в ней ничего невозможно.
Это происходит от того, что у записи узкий динамический диапазон. Чем он больше, тем более глубоким слышится звук, более приятным и реалистичным. Узкий динамический диапазон просто не позволяет разным инструментам, которые звучат одновременно, иметь различную громкость и один инструмент глушит другой, от этого возникает мутный неприятный звук и слушать такую музыку совершенно не хочется.
Низкая битность аудиозаписи виновата в узком динамическом диапазоне.
Теоретически за динамический диапазон отвечает битность звука во время его кодирования в цифровой вид. Чем выше битность, тем больше значений может принимать звуковая волна за единицу времени и тем шире может быть динамический диапазон. Но это в теории, т.к. это кроме битности на громкость могут влиять много других факторов и битность начинает влиять на динамический диапазон тогда, когда все другие факторы исключены.
Например, почти вся современная музыка выпускается со значительной компрессией, чтобы увеличить базовую громкость всего материала, от этого сильно страдает динамический диапазон, т.к. все тихие места композиции подтягиваются и становятся более громкими, а очень громкие пики инструментов срезаются до среднего значения. Таким образом, после процедуры компрессии уже почти не важно какой была битность записи. Но в том случае если вы слушаете качественный материал, который не испортили на студии, битность действительно начинает играть значительную роль в динамическом диапазоне.
Запомните, чем выше битность — тем больше значений записи уровня громкости звуковой волны записывается за единицу времени, и тем шире динамический диапазон.
Самое распространённое значение сегодня это 16 битная запись, но уже набирает популярность 24 битная музыка, а в скором времени в общее пользование начнут попадать 32 битные записи музыкальных произведений. При качественной обработки музыкального материала на студии и без ужасающей компрессии 16 битная точность записи, в общем, достаточна для того, чтобы не испытывать проблем с динамическим диапазоном.
Но в определении качества звука мы снова сталкиваемся с особенностями человеческого восприятия звука. Что такое 16 битная запись звука? Это значит, что одно измерение изменения амплитуды звуковой волны может принимать 65536 значений, что даёт нам динамический диапазон до 96,33 Дб. В свою очередь это означает, что звук с громкостью до 96,33 Дб должен быть записан без искажений по уровню громкости.
Если вы похожи на меня, то в большинстве случаев вы слушаете музыку в наушниках, а в наушниках довольно опасно долго слушать громкую музыку и, поверьте, 96,33 Дб это очень громко. Я стараюсь не превышать 60-65 Дб при прослушивании, этого вполне достаточно чтобы в полной мере насладиться звуком, но недостаточно чтобы повредить слух. И, как видите, у меня остается значительный запас по громкости до заветных 96,33 дб. По этой причине записи с 24 битной точностью для меня не дадут никакого преимущества, я просто не буду слышать разницы из-за того, что не слушаю музыку достаточно громко. Если кто-то из ваших знакомых, слушающий музыку в наушниках, говорит вам, что есть разница между 16 битной записью и 24 битной — не верьте ему. Он стал жертвой маркетинга и просто верит, что разница есть, хоть он её и не слышит. Добавим к этому тот факт, что наш слух имеет разную чувствительность по громкости к разным частотам звука, поэтому 16 битных записей для прослушивания в наушниках хватит для любых ситуаций.
16 битная запись позволяет записать громкость сигнала в виде 65536 значений, что даёт нам громкость уровня 96,33 Дб.
Так почему многие люди верят, что 24 битная запись музыки значительно превосходит 16 битную? Для некоторых ситуаций это действительно так. Например, если вы слушаете живую запись симфонического оркестра, вам действительно нужна 24 битная запись, т.к. вам придется значительно повышать громкость, чтобы услышать все нюансы. Вы повышаете громкость технически, на вашем устройстве, но та громкость, которую вы услышите будет нормальной, потому что записи симфонической музыки делаются довольно тихими как раз для того, чтобы можно было расслышать все нюансы звука. Но это правило не работает для современных записей поп музыки, т.к. уже на студии записи делают предельно громкими и если вы будете слушать её на той же громкости, что и качественную запись оркестра, вы просто рискуете повредить свой слух.
Также 24 битная запись подходит для записи звука. Гораздо эффективнее сделать запись в более высокой битности и потом, при финальной обработке снизить её до 16, чем наоборот. Если вы сделаете запись в 16 битах и потом искусственно увеличите её до 24, то качество будет даже ниже, чем при исходных 16 битах, а возможно и такое, что в звуке появится посторонний фоновый шум.
Каким должен быть битрейт?
Должно быть многие из вас замечали разницу в качестве звучания песен, если сначала вы слушали их на YouTube, а потом переключились на прослушивания CD или даже iTunes. Эта разница в качестве обусловлена битрейтом. Вообще, в повседневной жизни в 95% случаев качество записи определяет именно битрейт.
Как мы помним, битрейт это количество информации о звуковой волне, которую мы записываем за единицу времени, чаще всего за 1 секунду.
Вы же помните, что чем выше битность звука, тем больше информации нам нужно записать в единицу времени о каждом значении измерения амплитуды звука, тем больше нам нужен битрейт. Вот почему битрейт так важен, не имеет значения битность звука если у вас маленький битрейт, вы просто не сможете записать все необходимые данные для качественного воспроизведения.
Просто запомните — чем больше битрейт, тем выше качество звука. Вот так всё просто.
Для большинства случаев 320 Кб/Сек достаточно. Более того, большинство людей просто не заметят разницу, если будут слушать музыку с большим битрейтом.
Меня часто спрашивают каким должен быть битрейт для качественного звука? Я отвечаю — 320 Кб/Сек будет достаточно, при условии, что у вас 16 битная запись. Да, при прослушивании FLAC файлов с той же музыкой можно уловить разницу и FLAC будет звучать лучше, однако, для того чтобы эту разницу услышать вам нужны хорошие наушники и звуковая аппаратура, а также чтобы вокруг вас было тихо. Т.е. вам нужны хорошие домашние условия. Для дома я рекомендую музыку хранить в формате FLAC с более высоким битрейтом и битностью, но для любого мобильного использования (а большинство из нас музыку слушают именно на ходу) mp3 файла с битрейтом 320 Кб/Сек более чем достаточно. К тому же на вашем мобильном устройстве память ограничена и прослушивание mp3 отлично экономит её, либо ваш мобильный трафик если вы слушаете музыку с помощью стриминговых сервисов.
Так мне нужен ЦАП или нет?
Скорее всего нет, вам не нужен отдельный ЦАП. Единственная причина купить ЦАП сегодня заключается в том, что ваш компьютер, смартфон или домашняя аудиосистема не имеет его или в ваших устройствах используются старые и очень дешёвые встроенные ЦАПы, а качество звука при подключении любых наушников — ужасное. Тогда да, вам нужен ЦАП. Но если вы используете современное оборудование, то отдельный ЦАП вам не нужен, вы просто не услышите разницу.
Скорее всего нет, вам не нужен отдельный ЦАП.
Ещё одна причина приобрести отдельный ЦАП — вы собираете настоящую high-end звуковую систему, где каждый элемент должен быть безупречным. В этом случаев я согласен, вам нужен отдельный ЦАП.
В большинстве случаев вам будет достаточно того, что уже встроено в ваш телефон, планшет или ноутбук, современные ЦАПы достаточно хороши для того, чтобы вы не слышали заметных искажений звука и для 80% нашей аудитории я могу смело сказать — не покупайте ЦАПы, вы просто не услышите разницы.
Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).
Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).
Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).
Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).
Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).
Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).
Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.
Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
Несжатый (RAW) формат данных
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…