Технология идентификации по голосу Voice Key основана на уникальности геометрии речевого тракта каждого человека. В Voice Key используется спектрально-формантный метод, базирующийся на различных спектральных характеристиках речи разных людей. Спектрально-формантный метод основан на анализе поведения трех и более формант (спектральных максимумов), отражающих уникальность геометрии речевого тракта индивида.
Наиболее явно различие спектральных характеристик проявляется в соположении формант в вокализованных отрезках речи. Пример формантного представления речи двух разных людей при произнесении фразы «Голосовой поиск» приводится на рисунке №1 ниже (по вертикальной оси - частота сигнала в Гц, по горизонтальной - время звучания в секундах, степень зачернения отражает концентрацию энергии).
Рисунок №1. Пример формантного представления речи двух разных людейИспользуемый в Voice Key спектрально-формантный метод основан на выделении и сравнении положения и динамики поведения трех и более формант. Используется несколько десятков параметров, характеризующих формантную структуру речи.
Принцип работы включает 4 основных этапа:
· Создание шаблона - сведения о физиологической или поведенческой характеристике преобразуются в форму, доступную компьютерным технологиям, и сохраняются в память биометрической системы
· Выделение - из вновь предъявленного идентификатора выделяются уникальные признаки, анализируемые системой
· Сравнение - сопоставляются сведения о вновь предъявленном и ранее зарегистрированном идентификаторе
· Решение - вносится заключение о том, совпадают или не совпадают вновь предъявленный и ранее зарегистрированный идентификатор
Заключение о совпадении/несовпадении идентификаторов затем транслируется другим системам (контроля доступа, защиты информации и т.д.), которые далее действуют в зависимости от полученной информации.
Важнейшим элементом успешного распознавания дикторов является выбор информативных признаков (речевых параметров), способных эффективно представлять информацию об особенностях речи конкретного диктора.
К ним предъявляются следующие требования:
эффективность представления информации об особенностях речи конкретного диктора;
простота измерения;
стабильность во времени;
частое и естественное появление в речи;
невосприимчивость к имитации.
В качестве уникального вектора признаков можно использовать одномерный частотный вектор кепстральных коэффициентов, а также вектор, составленный из его производных.
Кепстральные коэффициенты определяются в соответствии со схемой, представленной на Рисунке №2:
Рисунок №2 - Общая схема кепстрального анализа сигнала (FFT - блок быстрого преобразования Фурье сигнала, LOG - блок логарифмирования спектра, IFFT - блок обратного быстрого преобразования Фурье)
В качестве вектора признаков можно использовать коэффициенты отражения. Физический смысл коэффициентов отражения состоит в определении величины волны, отраженной на границе двух акустических труб.
Коэффициенты отражения рассчитываются путем преобразования вектора коэффициентов предсказывающего фильтра a в коэффициенты отражения соответствующей решетчатой структуры по следующему рекурсивному алгоритму:
(n)=an(n) (1.1)
(1.2)
Данные формулы основаны на рекурсивном алгоритме Левинсона. Для его реализации в цикле перебираются элементы вектора a, начиная с последнего и заканчивая вторым.
Иногда используются также функции от коэффициентов отражения - логарифмические отношения площадей (Log-Area Ratio - LAR):
(1.3)
где ki - коэффициенты отражения.
Еще одним признаком являются площади поперечных сечений акустических труб. Голосовой тракт можно представить в виде последовательности р акустических труб одинаковой длины и различных диаметров, имеющие площади поперечных сечений Ai. Представление голосового тракта в виде последовательности труб изображено на Рисунке №3.
Другие статьи по теме
Методика проектирования многослойной печатной платы
1. Погонная
емкость сигнальных проводников
. Число
сигнальных проводников
. Число
потенциальных слоев
. Технологические
требования:
4.1. Пе ...
Блокинг-генераторы
Блокинг-генератором называется однокаскадный усилитель, охваченный
глубокой обратной связью с помощью трансформатора. Он может работать в
автоколебательном, ждущем режиме и в режимах син ...
Исследование звуковой системы ПК с помощью диодной пластины
С
ростом популярности беспроводных технологий расширяется и сфера их применения.
В дипломной работе рассмотрено решение, построенное на принципе передачи
медиаданных по беспроводным кан ...