Свойств речи Классификация Скорость АЦП Искажения Цифро-аналоговое преобразование Сложение сигналов Плотность импульсов Кодовые комбинации Дискреты Анализ Частотный спектр Цифровые схемы Модуляторы Конференц-связь

Преобразование речевых сигналов в цифровую форму

Область преобразования речевых сигналов в цифровую форму вследствие его интересной природы и полезности во многих применениях в последние 20 лет подвергается интенсивному изучению. Это изучение породило множество различных типов преобразователей с большим числом разновидностей в каждом типе. Выбор конкретного типа в первую очередь зависит от области применения и качества передачи речи, которое желательно получить. Вообще говоря, области применения можно классифицировать следующим образом: а) передача, б) коммутация, в) хранение и их комбинации. Кодеры речи для передачи можно классифицировать в соответствии с высокоскоростной и низкоскоростной передачей. Для высокоскоростной передачи применяются системы типа Т, где желательно получить стандартное качество передачи речи при телефонии. В настоящее время экономичные преобразователи речи, обеспечивающие стандартное качество передачи при телефонии, требуют скоростей передачи от 32 до 64 кбит/с. Еще большие скорости требуются для цифровой передачи программ звукового вещания, где желательно более высокое качество. Например, МККР предлагает как стандарт для передачи сигналов звукового вещания [1] скорость 384 кбит/с (включая биты проверки на четность).

Низкоскоростная передача применяется в общем случае при использовании для секретной передачи речи существующих аналоговых средств, таких как телефонная сеть общего пользования или высокочастотные радиоканалы. При таких применениях скорости передачи в типовых случаях ограничиваются значениями от 2 до 16 кбит/с. В этих случаях преобразователи речи (за исключением устройств для верхней границы этого диапазона скоростей) существенно сложнее и используют принципиально другие алгоритмы, чем преобразователи для обычной телефонии.

Поскольку полоса пропускания систем коммутации в общем случае менее ограничена, чем полоса систем передачи, в преобразователях речи для целей коммутации используются обычно простые устройства, работающие с повышенными скоростями. Например, в первой цифровой УТС в США, которая выпущена фирмой Rolm в 1975 г., была использована техника преобразования, аналогичная той, которая используется в системах передачи типа Т, но требующая скорости передачи 144 кбит/с [2]. Поскольку стоимость обычных кодеров и декодеров (кодеков) для передачи снижается и все большее число функций передачи и коммутации объединяется, техника преобразования речи на повышенных скоростях (только для коммутации) перестает применяться.

Цифровые устройства хранения речевых сигналов также можно подразделить в соответствии со скоростью передачи преобразованного в цифровую форму сигнала, которая, естественно, непосредственно влияет на требования к устройствам цифровой памяти. Нижней границе скорости соответствуют устройства для записи сообщений, где необходим минимальный объем памяти и реализуются только минимальные требования к качеству речи. Одним из них является обучающий аппарат «Спик-энд-спел», разработанный фирмой Texas Instrument.

В этом устройстве использованы некоторые из наиболее изощренных достижений в технике цифрового преобразования речи; оно способно запоминать до 200 слов (в среднем примерно по 1000 битов на слово). При таких данных эквивалентная скорость передачи получается несколько меньшей, чем 1200 бит/с. Отсюда следует, что запись сообщений при ограниченном объеме памяти требует наиболее сложной техники кодирования и декодирования. Вследствие этого, способ получения таких низких скоростей передачи в настоящее время не может обеспечить качество, требуемое для применений в реальном масштабе времени.

Анализ и синтез речи является еще одной областью широко распространенных исследований, тесно связанных с преобразованием речи в цифровую форму Цифро-аналоговое и аналого-цифровое преобразования