Основные принципы цифровой магнитной записи звука
Основные принципы цифровой магнитной записи звука
Использование импульсно-кодовой модуляции для кодирования источника сигнала. В основу цифровой передачи и записи сигналов в цифровых магнитофонах положена импульсно-кодовая модуляция (ИКМ). Она предполагает дискретизацию аналоговых сигналов путем осуществления отсчетов значений сигналов в определенные (обычно равномерно распределенные) моменты Дискретизованный сигнал подвергается аналого-цифровому преобразованию. Вначале - квантованию (дискретизации по уровню), при котором непрерывно изменяющиеся по уровню отсчеты сигналов заменяются квантованными отсчетами. Фиксированные значения уровней квантования берутся из определенного их множества . Затем - кодированию: замене квантованного отсчета кодовым его значением (кодовым словом). Обычно используют двоичный код, где каждая позиция символа определяется одним из двух его значений: 0 или 1. В результате ИКМ аналоговый сигнал на интервале 1 -10, преобразуется в последовательность десяти кодовых слов: 1 - 0100,. 2 - 0110, 3 - 0111, 4 - 0111, 5 - 0101, 6 - 0100, 7 - 1001, 8 - 1010, 9 - 1001, 10 - 0010. Эти слова в виде двухуровневого сигнала - последовательности кодовых комбинаций - могут быть переданы по каналу связи или записаны на цифровом магнитофоне.
При приеме или воспроизведении импульсно-кодово-модулированного (ИКМ) сигнала осуществляется обратная операция - цифро-аналоговое преобразование. В цифро-аналоговом преобразователе (ЦАП) последовательность кодовых комбинаций преобразуется в последовательность восстановленных отсчетов низкочастотную составляющую из последовательности восстановленных отсчетов, получают восстановленный аналоговый сигнал
Точность передачи сигналов с ИКМ зависит от параметров аналого-цифрового преобразования - частоты дискретизации и шага квантования. Для неискаженной передачи сигнала частота дискретизации fд в соответствии с теоремой Ко-тельникова должна, по крайней мере, вдвое превышать высшую частоту FB передаваемого аналогового сигнала (fД>2FВ). Шаг квантования определяет максимальную погрешность восстановленного сигнала и характеризует ошибки квантования, которые проявляются как «шум квантования». Шаг квантования связан с количеством уровней квантования. Чем большее количество уровней, тем меньше шаг квантования и тем большая точность передаваемого ИКМ сигнала. При двоичном представлении информации количество уровней N выражают степенью n числа 2 N = 2n (n - разрядность двоичного числа или кода). Максимальное теоретическое отношение гармонического сигнала к шуму квантования приблизительно равно (6n+1,8) дБ. В зависимости от метода измерения шума в выражении максимального динамического диапазона DM, дБ, сигнала учитывается поправка Ра на метод измерения: DM=6n+l,8 - Ри. (Например, для квазипикового взвешенного измерения шума в соответствии с Рекомендацией 468-3 МККР РИ составляет 12 дБ.) Реальный динамичес ш: диапазон Dр, дБ, обычно меньше максимального, поскольку всегда оставляют запас Р3 на перегрузку оборудования: Dp = бn+ 1,8 - РИ - РЗ. В зависимости от вида сигнала и метода его измере ия Р3 ложет принимать различные значения [от 4 (для речевых) до 10 дБ и более (для музыкальных сигналов)]. Зная требования к сигналам и методам измерения, легко определить необходимое количество разрядов для аналого-цифрового преобразования n> (D- 1.8 + Ри + Р3)/6.
Для достижения динамического диапазона звукового сигнала свыше 80- 90 дБ в случае равномерного квантования количество разрядов должно быть 16 -18.
Иногда в бытовой записи и часто при передаче сигналов по каналам связи используют ИКМ с неравномерным квантованием Шаг квантования для больших уровней выбирается относительно большим и уменьшается с уменьшением уровня таким образом, что отношение уровня передаваемого сигнала к уровню шума квантования остается приблизительно одинаковым для всех сигналов (рис. 4). При этом для обеспечения заданного динамического диапазона (отношения максимального сигнала к минимальному) требуется меньшее число уровней квантования (т. е. меньшее число разрядов). Неравномерное квантование обычно осуществляется путем разбиения динамического диапазона на сегменты, в каждом из которых производится равномерное квантование. Преобразование такого рода называют сегментным компандиро-ванием. В последнее время оно осуществляется цифровыми средствами.
Достоинство компандирования при ИКМ состоит в уменьшении цифрового потока. К его недостаткам относятся динамические искажения сигнала и наличие остаточного шума квантования, по структуре близкого к модуляционному. Скорость последовательной передачи символов ИКМ сигнала (цифровая скорость) в бит за секунду fс = fдn. В случае передачи символов в параллельном коде по n каналам значение скорости передачи символов по каждому из параллельных каналов совпадает со значением частоты дискретизации. Возможна последовательно-параллельная передача.
Рассмотрим, каким образом могут быть связаны параметры ИКМ со свойствами канала записи — воспроизведения. Параметры импульсно-кодовой модуляции. Современный профессиональный цифровой магнитофон обеспечивает запись сигнала с верхней частотой 20 кГц при скорости 38,1 см/с с максимальным динамическим диапазоном свыше 80 -90 дБ. Частота дискретизации должна превышать 2FE. С учетом конечной крутизны характеристики фильтров АЦП и ЦАП она может составлять 44 - 60 кГц (в качестве стандарта для цифровой студийной аппаратуры выбрана частота 48 кГц). Минимальное необходимое количество разрядов аналого-цифрового преобразования равно 16. Следовательно, канал прямой записи — воспроизведения с однодорожечной записью должен пропускать как минимум 16-48000 = 768000 бит/с. С увеличением числа дорожек цифровая скорость пропорционально уменьшается.
Свойства канала записи - воспроизведения цифрового магнитофона. На практике используют два варианта цифровой записи звука. В одном случае цифровой сигнал звука преобразуют в квазителевизионный и записывают этот сигнал на видеомагнитофоне. В видеомагнитофоне применяется модуляционная (в основном частотно-модулированная) запись, при которой обеспечиваются линейность канала, равномерность амплитудно-частотной характеристики в полосе пропускания и достаточно хорошее отношение сигнал-шум (около 40 дБ). Свойства видеомагнитофонов Во втором случае осуществляется прямая запись цифрового сигнала звука без подмагничивания. Свойства канала записи - воспроизведения существенно отличаются от свойств канала видеомагнитофона или канала связи. Канал записи (от входа усилителя записи до еигналограммы) обладает нелинейными свойствами, зависящими от частоты (или длины записываемой волны). Канал воспроизведения линеен и частотозависим. Ход кривых семейства условных амплитудно-частотных (или амплитудно-волновых) характеристик [Под условными амплитудно-частотными характеристиками здесь понимается зависимость уровня первых гармоник воспроизводимого сигнала от частоты] канала записи - воспроизведения без подмагничи-вания на носителе с рабочим слоем, превышающим половину длины волны Параметром семейства является значение тока записи.
Спадающая часть амплитудно-частотной характеристики неустойчива и в значительной степени зависит от условий контакта головки с лентой. Из-за неидеальности лентопротяжного механизма, колебаний скорости и динамических перекосов ленты наблюдаются колебания частоты и фазы воспроизводимого сигнала. В случае записи с высокой плотностью проявляется взаимовлияние фронтов (межсимвольные искажения) записанных сигналов из-за ограниченной полосы пропускания канала записи - воспроизведения и из-за нелинейного процесса стирания ранее записанного участка еигналограммы полем записи.
Воспроизводимый сигнал дополняется аддитивными и мультипликативными помехами. В воспроизводимом сигнале наблюдаются выпадения различной длительности, вызванные дефектами рабочего слоя ленты и загрязнением ленты и головки. Максимальная длительность выпадений может достигать тысяч бит.
Таким образом, условия передачи цифровых сигналов через канал записи - воспроизведения оказываются не совсем благоприятными для неискаженной передачи звука, и необходимо предъявлять ряд определенных требований к записываемым сигналам.
Требования к записываемым сигналам. Огибающая спектра записываемого цифрового сигнала должна быть по возможности близкой к выбранной амплитудно-частотной характеристике канала прямой записи — воспроизведения. Спектр не должен содержать постоянную составляющую во избежание «плавания базовой линии» воспроизводимого сигнала. Наиболее важные составляющие спектра не должны располагаться в высокочастотной области, которая в большей степени подвержена паразитным амплитудной и фазовой модуляциям, вызванным переменным неконтактом. Записываемый сигнал должен обладать свойством самосинхронизации для обеспечения правильного определения тактового интервала воспроизводимого сигнала в условиях зашумленности и паразитных частотной, амплитудной и фазовой его модуляций.
Канальные коды. В магнитной записи наиболее широко используется двухуровневое кодирование без возвращения к нулю, которое легко связать с двумя противоположными соетояниями намагниченности рабочего слоя носителя. Диаграммы типичных канальных кодов (кодов, используемых в канале записи - воспроизведения) для цифровой записи Простейший код без возвращения к нулю (БВН), в котором в течение каждого тактового интервала (или интервала бита на ленте) логической единице (1) соответствует одна полярность сигнала (или состояние намагниченности рабочего слоя магнитной ленты), а логическому нулю (0) соответствует противоположная полярность сигнала (или противоположное состояние намагниченности), мало пригоден для непосредственной записи на ленте и воспроизведения индукционной магнитной головкой. Кодовая последовательность ЕВН принципиально содержит постоянную составляющую, которая не передается через канал воспроизведения из-за дифференцирующего действия индукционной головки. Этот код не обладает свойствами самосинхронизации - яе несет регулярной информации о длительности тактовых интервалов. Поэтому код БВН не находит практического применения в магнитной записи.
Модифицированный код БВН-1, в котором одному из двоичных -символов, например 1, соответствует изменение полярности сигнала на тактовом интервале, а другому символу, например 0, соответствует отсутствие такого изменения, хотя и позволяет воспроизвести все 1, но не обладает свойствами самосинхронизации и также мало пригоден для магнитной записи. О пригодности кодов для передачи через канал магнитной записи — воспроизведения можно судить по их нескольким параметрам. Отношение минимального интервала Гмин между изменением полярности сигнала к тактовому интервалу Тт характеризует так называемую эффективность кода, влияющую на требуемую полосу пропускания канала передачи сигнала и определяющую условия взаимовлияния соседних символов, что особенно важно при записи. Чем больше отношение Tмин/Тт, тем меньше взаимовлияние символов.
Возможность самосинхронизации кодов, т. е. способность нести в себе регулярную информацию о продолжительности тактовых интервалов, определяется отношением максимального интервала Гмакс между изменением полярности сигнала к тактовому интервалу. Чем меньше отношение ТМАКС/ТТ, тем лучше самосинхронизация кода, тем проще осуществлять посимвольную синхронизацию сигнала при воспроизведении. Отношение минимальной разницы между интервалами изменения полярности сигнала АГ в кодовой последовательности к тактовому интервалу («окно детектирования») характеризует способность кода к детектированию (различению символов при воспроизведении) и оказывает влияние на требуемые полосу пропускания канала и допустимые временные искажения сигналов записи — воспроизведения. Чем больше отношение Д7УГТ, тем проще детектировать сигнал и тем менее жесткие требования предъявляются к полосе пропускания канала записи - воспроизведения и к допустимым временным искажениям воспроизводимого сигнала.
Неравномерные интервалы между изменениями полярности кодированного сигнала могут привести к изменению постоянной составляющей в текущем или мгновенном (на протяженном участке кодовой последовательности) спектре сигнала, к «плаванию базовой линии» воспроизводимого сигнала, затрудняющему пороговое детектирование. Для сбалансированных кодов отношение постоянной составляющей кодовой последовательности (С=) к полному размаху сигнала (Л) стремится к нулю. Для несбалансированных кодов отношение С=/А может достигать 0,5. В последнем случае пороговое детектирование сигнала невозможно.
Рассмотрим несколько видов канальных кодов, пригодных для цифровой записи.
Бифазный код (БФ) характеризуется тем, что одному логическому состоянию, например 1, соответствует изменение фазы сигнала на 180 в начале тактового интервала и противоположное изменение фазы в середине тактового интервала, а другому логическому состоянию, например 0, соответствует изменение фазы сигнала на 180° в середине тактового интервала.
Бичастотный код (БЧ) одному из логических состояний, например 1, соответствует два полупериода прямоугольного колебания с частотой 1/Tт в течение тактового интервала, а противоположному логическому состоянию, например 0, соответствует один полупериод прямоугольного колебания с частотой 1/2TT.
Бичаетотная и бифазная кодовые последовательности близки по своей структуре и по спектральному составу. Они полностью сбалансированы (постоянная составляющая равна 0), обладают наилучшей самосинхронизирующей способностью, но требуют вдвое большей полосы пропускания канала передачи, чем, например, БВН.
Расширения полосы пропускания не требуют трехчастотные коды. Трех-частотные кодовые сигналы содержат последовательности полупериодов прямоугольных колебаний с продолжительностью Гт, 1,5ГТ и 2ГТ Существует 14 вариантов трехчастотных кодов с приблизительно одинаковыми свойствами. Они обладают самосинхронизацией, но могут содержать постоянную составляющую. Для этих кодов правильное восстановление информации после сбоя возможно лишь после прихода комбинации из трех символов, образующей в кодовой последовательности максимальный интервал (2ГТ) между соседними изменениями полярности сигнала. Один из вариантов этих кодов назван кодом Миллера, или модифицированной частотной модуляцией (МЧМ). Его алгоритм следующий одному из логических состояний, например 1, соответствует изменение полярности сигнала в середине тактового интервала, а противоположному логическому состоянию, например О, соответствует изменение полярности сигнала в начале тактового интервала, за исключением случаев, когда 0 непосредственно следует за 1. Правильное детектирование этого кода осуществляется после прихода комбинации 101. Этот код находит применение в цифровой записи звука. Модифицированный код Миллера, или М2 сбалансирован. Для уменьшения постоянной составляющей в кодовой последовательности в алгоритм кодирования введено дополнительное ограничение. Одному логическому состоянию, например 1, в коде М2 соответствует изменение полярности в середине тактового интервала, за исключением последней 1 в серии «единиц»; другому логическому состоянию, например 0, соответствует изменение полярности в начале тактового интервала, за исключением случая, когда 0 непосредственно следует за 1. Кодированный сигнал состоит из полупериодов прямоугольных колебаний продолжительностью Tт, 1,5 TТ, 2,5 Тт и ЗГТ. Этот код часто применяют при цифровой записи. Трехпозиционная модуляция, или код ЗРМ), относится к групповым кодам. Исходная информация разделяется на группы из трех символов, и каждое трехраэрядное цифровое слово преобразуется в шестиразрядное слово, в котором 1 соответствует изменению полярности и любые 1 всегда разделены двумя 0:
1. 000->000010 5. 100->001000
2. 001->000100 6. 101->100000
3. 010->010000 7. 110->00010
4. 011->010010 8. 111->00100
Если на стыках слов, например 1 и б, 7 и 8, образуются комбинации Ш1, то они заменяются комбинациями 010: 000010 100000 000001 000000
Чтобы при перекодировании не происходило изменения временного масштаба, каждое 6-разрядное слово размещают на таком же временном интервале, что и исходное 3-разрядное слово. Самосинхронизуемость кода ЗРМ несколько хуже, чем кода М2, поскольку максимальное расстояние между точками изменения полярности составляет пять тактовых интервалов исходной кодовой последовательности. Но взаимовлияние импульсов проявляется в меньшей степени, так как ТМИН/Тт = 1,5. Групповой код 8/16 обладает лучшей еамосинхронизуемостью, чем код ЗРМ, но импульсы в нем в большей степени подвержены взаимовлиянию. Код 8/16 полностью сбалансирован. Для его образования исходная информация разделяется на 8-разрядные слова, каждое из которых заменяется 16-разрядным словом в том же временном интервале с учетом следующих правил: каждое слово имеет восемь 1 и восемь 0 и не содержит изолированных il и 0; каждое слово начинается с 0 (либо каждое — с 1). На стыках слов не имеется изолированных 1 и 0. Из 65 384 возможных комбинаций 16-разрядг ных слов выбираются 296 комбинаций, начинающихся с 0 (либо с 1) и удовлетворяющих перечисленным условиям, для кодирования 256 возможных входных 8-разрядных слов. Неиспользованные 40 комбинаций могут служить в качестве абсолютных маркеров для иерархической синхронизации. Код обладает хорошей самосинхронизацией (TМАKC/TТ = 3) и не требует расширения полосы пропускания канала передачи (ТМин/Тт = 1). Этот код обладает способностью обнаруживать ошибки: 29 из 216 (свыше 99%).
Модуляция с высокой плотностью, или код HDM-1, также не требует расширения полосы пропускания канала и обладает самосинхронизацией, уступающей, однако, коду 8/16. Правила его построения следующие: если входная комбинация содержит 01, то изменение фазы сигнала осуществляется в середине интервала бита «единицы». Для последовательности 1 изменение фазы осуществляется на границе каждой пары 1; если три 1 предшествуют 0, точка изменения фазы сдвигается от края второй 1 к границе между последней 1 и 0. Для последовательности 0 исходного сигнала используются следующие правила: если предшествующая точка смены фазы находится на границе интервала бита, для последующих «нулей» не имеется переходов, за исключением случаев смены фазы на границе четвертого или пятого 0 (по крайней мере, для пяти последовательных 0). Если предшествующий переход находится в середине интервала бита, смена фазы для последующих «нулей» отсутствует, за исключением точек на границе третьего и четвертого 0 (для, по крайней мере, последовательности из четырех 0).
Параметры канальных кодов
Тип кодов |
Tмин /Tт |
Tмакс /Tт |
ДТ/ТТ |
БВН, БВН-1 |
1 |
|
1 |
БФ |
1 2 |
1 |
1/2 |
3-част. |
1 |
2 |
1/2 |
М2 |
1 |
3 |
1/2 |
ЗРМ |
1,5 |
5 |
1/2 |
HDM-1 |
1,5 |
4,5 |
1/2 |
8/16 |
1 |
3 |
1 |
Трехпараметрические К(р, s, т)-коды обладают всеми свойствами кода канала. Каждая кодовая комбинация из m символов такого кода всегда начинается с одного из символов, например 1, а оканчивается не менее чем р «нулями» и не более чем s «нулями». Выбирая различные соотношения параметров р, s и т, легко получить коды с наперед заданными свойствами, оптимизируя для каждого конкретного случая соотношения между самосинхро-низируемостью, эффективностью, степенью сбалансированности и т. п. Коды обладают и помехозащитными свойствами. Параметры канальных кодов приведены в табл. 1.
Правильный выбор канального кода, хорошо согласованного е каналом прямой записи - воспроизведения, - лишь одно из условий успешной записи .цифрового сигнала. Важно правильно определить начало каждого слова, соответствующего отсчету, т. е. требуется помимо посимвольной синхронизации осуществление пословной синхронизации или синхронизации группы слов (блоков). Для этой цели в записываемый код дополнительно вводят специальные символы или слова синхронизации. Они оказываются чрезвычайно помпезными для восстановления временного масштаба при воспроизведении. Защита от ошибок. Из-за дефектов носителя, неконтакта или шумов возможны ошибки при воспроизведении: вместо 0 будет воспроизведена 1 или наоборот. В результате восстановленный отсчет будет отличаться от исходного, что может привести к щелчку, воспринимаемому на слух. Для устранения влияния таких ошибок используют помехоустойчивое кодирование, суть которого сводится к следующему. Каждое исходное кодовое слово из n символов заменяют кодовым словом из т символов (m>n) таким образом, чтобы любая пара вновь образованных слов отличалась друг от друга как минимум на l символов (l — расстояние Хэмминга). Число комбинаций из т символов превышает число требуемых комбинаций (из n символов). Используемые комбинации из m символов называют разрешенными, а неиспользуемые — запрещенными. Ошибка в одном из символов воспроизведенного m-разрядного слова переведет его в разряд запрещенных слов, что позволит обнаружить ошибку.
Для обнаружения всех одиночных ошибок достаточно, чтобы l>2. Обнаружение всех ошибок кратности q возможно при l>q+l. Для исправления ошибок необходимо иметь большее кодовое расстояние l>2q+1. Например, имея исходные информационные слова A1 = 00, Л2=01, A3=10, A4=11 (здесь l=1) и добавляя к каждому из них по одному разряду А1 = = 000, A2=011, Л3=101, A4=11О (l=2), можно обнаружить ошибочное слово, если произошла одиночная ошибка. Если в результате ошибки слово az либо Лз принято в виде 001, то его считают ошибочным.
Для исправления одиночных ошибок добавим еще два разряда в каждое слово: A1 = 00000, A2=01101, A3=10110, A4= 11011 (1>3). В этом случае можно определить, в каком из символов произошла одиночная ошибка. Действительно, если Л3 принято в виде 10010, легко определить, что ошибка произошла в третьей позиции. Ошибка исправляется заменой ошибочного символа на противоположный: 10010-40110 Имеется литература по помехоустойчивому кодированию [8, 10], с которой читатель может ознакомиться. Здесь же мы остановимся лишь на специфических случаях, характерных для магнитной записи.
В магнитной записи, как уже упоминалось, возможны многократные ошибки и длительные пакеты ошибок. Поэтому помехозащитные коды должны обеспечивать возможность исправления и пакетов ошибок. К таким кодам, в частности, относятся каскадные коды. Но в случае пакета ошибок длительностью в тысячи бит и они оказываются либо бессильными, либо аппаратур-но нереализуемыми. Для борьбы с длительными выпадениями в цифровой записи используют перемежение символов, слов или блоков. Символы исходного цифрового сигнала размещают на ленте не подряд в естественном порядке, а вразброс через большие интервалы, превышающие длительность выпадений. При воспроизведении осуществляют обратное преобразование (деперемеже-ние) и размещение символов в естественном порядке. Если случается выпадение, то ошибочные символы после деперемежения равномерно распределяются по различным словам таким образом, что в каждом слове будет не более одного ошибочного символа Операция перемежения позволяет эффективно бороться с выпадениями и значительно упрощает коды и аппаратурную реализацию кодеков.
Если разбить звуковой сигнал на отдельные фрагменты одинаковой длительности, то каждый кодированный фрагмент будет содержать информационную часть и дополнительные биты,. Введение избыточности в сигнал приводит к увеличению цифровой скорости передачи битов через канал записи - воспроизведения битов и к уменьшению информационной плотности записи (уменьшению количества информационных битов, приходящихся на единицу длины дорожки записи или на единицу площади носителя). Таким образом происходит «обмен» полосы частот или площади носителя на достоверность воспроизводимого сигнала.
Глубокое понимание свойств канала магнитной записи - воспроизведения, правильный выбор помехозащитного кода, кода записи и предыскажений сиг-палов позволяют рационально использовать носитель записи. Расход носителя в современных цифровых магнитофонах (с продольной многодорожечной записью) не превышает расхода носителя в аналоговых магнитофонах. Примером тому служат высококачественные кассетные цифровые магнитофоны с лентой шириной