Звук — это колебания среды (воздуха, воды). С помощью микрофона звук преобразуется в аналоговый электрический сигнал, который в любой момент времени может принимать любое значение в некотором интервале. Этот сигнал можно подать на вход звуковой карты, где специальное устройство — аналого-цифровой преобразователь (АЦП) — преобразует его в цифровой код. Процессор компьютера может затем обработать этот код по некоторому алгоритму, сохранить в файле и т. д. (рис. 2.27).

Рис. 2.27

Для проигрывания звука через наушники или звуковые колонки (это аналоговые устройства!), цифровой код из памяти компьютера (например, из файла) передаётся звуковой карте, где с помощью цифро-аналогового преобразователя (ЦАП) преобразуется в аналоговый сигнал, поступающий на устройство вывода звука.

При оцифровке звука выполняется дискретизация — из всего бесконечного множества значений аналогового сигнала сохраняются в памяти только значения в отдельных точках, взятых с некоторым шагом Т по времени (рис. 2.28, а). Это называется дискретизацией по времени.

Рис. 2.28, а

Число Т называется интервалом дискретизации, а обратная ему величина f = 1 /Т — частотой дискретизации. Частота дискретизации измеряется в герцах (Гц) и килогерцах (кГц). Чем больше частота дискретизации, тем точнее мы записываем сигнал, тем меньше информации теряем. Однако при этом возрастает количество отсчётов, т. е. информационный объём закодированного звука. Для кодирования звука в компьютерах чаще всего используются частоты дискретизации 8 кГц (минимальное качество, достаточное для распознавания речи), 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт-диски), 48 кГц (фильмы в формате DVD), а также 96 кГц и 192 кГц (высококачественный звук в формате DVD-audio).

Кроме дискретизации по времени в АЦП происходит и дискретизация по уровню (квантование): измеренные значения сигнала записываются в памяти как целые числа. На рис. 2.28, б весь диапазон значений сигнала разбит на 8 = 23 одинаковых полос, что соответствует 3-битному кодированию. Все значения, попавшие в одну полосу, получают одинаковые коды.

Разрядность кодирования (глубина кодирования) — это число бит, используемое для хранения одного отсчёта.

Недорогие звуковые карты имеют разрядность 16-18 бит, большинство современных — 24 бита, что позволяет использовать 224 = 16777216 различных уровней.

Информационный объём данных, полученных в результате оцифровки звука, равен

I = f • i • t • k,

где f — частота квантования, i — разрядность кодирования, t — время и k — число каналов, которые записываются одновременно.

Для стереофонической записи (когда отдельно записываются левый и правый каналы) нужно принять к = 2, а для квадро-фонического звука (запись четырёх каналов одновременно) — к = 4.

Например, если используется 16-разрядное кодирование с частотой 44 кГц, то за 1 с выполняется 44 000 измерений сигнала, и каждое из измеренных значений занимает 16 бит (2 байта). Поэтому за 1 секунду накапливается f • i = 44000 • 2 = 88000 байт данных, а за 1 минуту

f • i • t = 88000 • 60 = 5 280000 байт * 5 Мбайт.

Если записывается стереозвук, это число нужно удвоить, а при записи квадрофонического звука — умножить на четыре.