Что можно отнести к звуковой информации

Звуковая информация

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека, а чем больше частота сигнала, тем выше тон.

Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz).

Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Аналоговый сигнал — сигнал данных, у которого каждый из представляющих параметров описывается функцией времени и непрерывным множеством возможных значений.

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала.

Цифровой звук – это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.

Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде.

Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц).

Процесс перевода звуковых сигналов от непрерывной формы представления к дискретной, цифровой форме называют оцифровкой.

Другое название оцифровки звука — аналогово-цифровое преобразование звука.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука.

Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1 секунду:
— 1 (одно) измерение в секунду соответствует частоте 1 Гц;
— 1000 измерений в секунду соответствует частоте 1 кГц.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Источник

Лекция: Основные сведения о цифровом представлении звуковой информации. Определение звука. Запись звука.

«Управление общеобразовательной организацией:
новые тенденции и современные технологии»

Свидетельство и скидка на обучение каждому участнику

Тема: Основные сведения о цифровом представлении звуковой информации. Определение звука. Запись звука.

1. Понятие и основные характеристики цифрового звука.

Цифровой звук — это аналоговый (т.е. непрерывный) звуковой сигнал, представленный посредством дискретных (т.е. отдельных) численных значений его амплитуды.

Характеристика цифрового звука:

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука.

2. Преобразование и воспроизведение звуковой информации.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Аудиоадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера.

Частота дискретизации – это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за 1 секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц) = 1000 Гц. Характерные частоты дискретизации аудиоадаптеров: 11 кГц, 22 кГц и др.

Разрядность регистра – число бит в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65536) различных значений. Очевидно, что 16 – разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8 – разрядный.

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Звуковой фай л – файл, хранящий звуковую информацию в числовой двоичной форме. Как правило, информация в звуковых файлах подвергается сжатию.

Процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).

Аналого-цифровой преобразователь (АЦП, англ. Analog-to-digital converter, ADC) — устройство, преобразующее входной аналоговый сигнал в дискретный код (т.е. цифровой сигнал). Обратное преобразование осуществляется при помощи ЦАП (цифро-аналогового преобразователя).

Как правило, АЦП — электронное устройство, преобразующее напряжение в двоичный цифровой код. Тем не менее, некоторые неэлектронные устройства с цифровым выходом, следует также относить к АЦП, например, некоторые типы преобразователей угол-код. Простейшим одноразрядным двоичным АЦП является компаратор.

3. Принципы оцифровки звука.

Оцифровка звука — технология преобразования аналогового звукового сигнала в цифровой вид. Заключается в осуществлении замеров амплитуды сигнала с определенным временным шагом и последующей записи полученных значений в численном виде. Другое название оцифровки звука — аналогово-цифровое преобразование звука.

Оцифровка звука включает в себя два процесса:

· процесс дискретизации (осуществление выборки) сигнала по времени

· процесс квантования по амплитуде.

Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется, с определенным временным шагом — шагом дискретизации. Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизации или частотой выборки, или частотой сэмплирования (от англ. «sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале будет получено. Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.

Линейное (однородное) квантование амплитуды

Таким образом, способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).

Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука (16 битов, 48 кГц).

Источник

Кодирование звуковой информации

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Кодирование звуковой информации

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица «децибел» (дбл). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Временная дискретизация звука.

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 1.2).

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Линейное (однородное) квантование амплитуды

Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM ( Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Другие способы оцифровки

Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция – разностная ИКМ (англ. « Differential PCM» – DPCM). В случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов.

Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

Качество оцифрованного звука.

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются «избыточные» для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Результаты дискретизации звуковой информации, как и все остальные компьютерные данные, сохраняются на внешних носителях в виде файлов.

Формат AU. Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом другого, более общего формата RIFF (Resource Interchange File Format); другой разновидностью RIFF служат видеофайлы AVI. Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырехсимвольный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т. д.), а во втором — сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули). При стереозаписи числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный блок — для нашего примера его длина составит 4 байта. Такая, казалось бы, излишняя структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

Формат MP3 (MPEG Layer3). Это один из форматов хранения аудиосигнала, позднее утвержденный как часть стандартов сжатого видео. Природа получения данного формата во многом аналогична уже рассмотренному нами ранее сжатию графических данных по технологии JPEG. Поскольку произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, приходится переходить к методам необратимым: иными словами, базируясь на знаниях о свойствах человеческого слуха, звуковая информация “подправляется” так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Это называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, непросты для понимания и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Успехи технологии MP3 привели к тому, что ее применяют сейчас и во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т. е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные, освещение). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить авторский музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

Источник

Представление звуковой информации в памяти компьютера

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Представление звуковой информации в памяти компьютера

Звук – волновые колебания давления в упругой среде (воздухе, воде, металле и т. д.). Для обозначения звука часто используют термин «звуковая волна».

Человеческое ухо способно воспринимать звук в широком диапазоне частот, от 16 Гц до 20 кГц. В нетехнических областях (например, в музыке) вместо термина «частота» используют термин «тон».

Амплитуду звуковых колебаний называют звуковым давлением или силой звука, эта величина характеризует воспринимаемую громкость звука.

Сила звука измеряется в паскалях (Па), при этом самые слабые, едва различимые звуки имеют амплитуду 20 мкПа (2´10-5 Па – порог слышимости). Самые сильные звуки, ещё не выводящие слуховые органы из строя, могут иметь амплитуду до 200 Па (болевой порог). Из-за такого широкого диапазона значений (максимальное и минимальное значения отличаются на 6-7 порядков!) абсолютными величинами звукового давления пользоваться неудобно, на практике обычно используют логарифмическую шкалу децибелов.

Относительную силу звука, или уровень звука, определяют как логарифм отношения абсолютной величины звукового давления к величине порога слышимости, умноженный на некоторый постоянный коэффициент.

Свойства логарифмической шкалы децибелов:

— весь диапазон слышимых звуков составляет 0-140 дБ: 0 дБ – порог слышимости, 140 дБ – болевой порог;

— человеческое ухо способно уловить различие в громкости, если звуки отличаются по силе не менее, чем на 10%, что соответствует разнице в уровнях примерно на 1 дБ;

Некоторые значения уровней звука:

Шорох листьев, слабый ветер

Шёпот (на задней парте)

Разговор средней громкости

Автомагистраль с интенсивным движением

Звукозапись – процесс сохранения информации о параметрах звуковых волн. Способы хранения или записи звука разделяются на аналоговые и цифровые. При аналоговой записи на носителе размещается непрерывный «слепок» звуковой волны. Так, на грампластинке пропечатывается непрерывная канавка, изгибы которой повторяют амплитуду и частоту звука, а на магнитной ленте параметры звука сохраняются в виде намагниченности рабочей поверхности, а степень намагниченности непрерывно изменяется, повторяя параметры звука.

В компьютерах применяется исключительно цифровая форма записи звука. При цифровой записи звук необходимо подвергнуть временной дискретизации и квантованию.

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука. Такой процесс называется оцифровкой звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».

Что можно отнести к звуковой информации. Смотреть фото Что можно отнести к звуковой информации. Смотреть картинку Что можно отнести к звуковой информации. Картинка про Что можно отнести к звуковой информации. Фото Что можно отнести к звуковой информации

Рис. Временная дискретизация звука

Качество полученного звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду, тем выше качество записанного звука.

Частота дискретизации звука – это количество измерений громкости звука за одну секунду. Одно измерение в секунду соответствует частоте 1Гц, 1000 измерений в секунду – 1 кГц.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждая звуковая карта характеризуется количеством распознаваемых уровней громкости звука, которое зависит от глубины кодирования звука. Глубина кодирования звука (измеряется в битах) – это количество информации, которое необходимо для кодирования одного значения громкости цифрового звука. Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать. Пусть глубина кодирования звука составляет 16 бит, тогда количество уровней громкости звука будет равно N = 216 = 65536.

Очевидно, что 16-битные звуковые карты точнее кодируют и воспроизводят звук, чем 8-битные. Качество звука в дискретной форме может быть очень плохим (при 8 битах и частоте дискретизации 5,5 кГц) и очень высоким (при 16 битах и частоте дискретизации 48 или 96 КГц).

Формула для расчета размера цифрового моноаудиофайла:

Если звук записывается для нескольких источников воспроизведения (колонки, колонки+сабвуфер и т. д.), то объем умножается на соответствующий множитель.

1) Оценить информационный объем цифрового стереозвукового файла длительность звучания 1 секунда при глубине кодирования звука 16 бит и частоте дискретизации 24 кГц.

N =24000Гц *16 бит * 2(стереозвук!) * 1сек=768000 бит = 93,75 Кбайт.

2) Какой минимальный объём памяти (в мегабайтах) потребуется для хранения звукового сигнала длительностью 4 минуты, оцифрованного с частотой дискретизации 44032 Гц при 16-разрядном квантовании амплитуды?

N =44032Гц *16 бит * 240сек=169082880 бит ≈ 20,16 МБайт.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом более общего формата RIFF (Resource Interchange File Format). Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырехсимвольный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т. д.), а во втором — сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули).

При стереозаписи числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный блок — для нашего примера его длина составит 4 байта. Такая структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

Формат MP3 (более точно MPEG Layer3). Это один из форматов хранения аудиосигнала, позднее утвержденный как часть стандартов сжатого видео MPEG-1, MPEG-2, MPEG-4. Благодаря MP3 стало возможным передавать по Интернету мультимедийную информацию, потому что MPEG позволяет сжимать звуковые файлы (например, WAV) в 8-12 раз без ощутимых потерь качества исходного звучания.

Так как произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, переходят к сжатию с потерями: звуковая информация “подправляется” так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Такое кодирование называется адаптивным, при сжатии задаётся битрейт – параметр, который показывает, сколько килобит будет занимать запись одной секунды звука. Приемы, применяемые для сжатия в MP3, опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации.

1) звуковые данные разделяются на небольшие фрагменты – фреймы;

2) в каждом фрейме звуковой сигнал раскладывается на гармонические колебания (применяется косинусное преобразование MDCT, частный случай преобразования Фурье), в результате получается набор коэффициентов разложения;

4) на заключительном этапе кодирования производится сжатие уже готового потока данных с использованием алгоритма Хаффмана.

Широкое распространение формата MP3 связано с тем, что его разработчики не включили в формат никакой защиты или ограничений на копирование и воспроизведение звука на самых различных устройствах. Однако, каждый изготовитель нового программного или аппаратного МРЗ-кодера обязан платить отчисления изобретателям кодека. Такая ситуация не могла не вызывать недовольства среди разработчиков и появились независимые разработки в области сжатия звука, например форматы AAC и OGG.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т. е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные, освещение). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию.

Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования.

Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить авторский музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука (сэмплы), которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *