Главное


Техническая характеристика технологии VoiceKey

Технология идентификации по голосу Voice Key основана на уникальности геометрии речевого тракта каждого человека. В Voice Key используется спектрально-формантный метод, базирующийся на различных спектральных характеристиках речи разных людей. Спектрально-формантный метод основан на анализе поведения трех и более формант (спектральных максимумов), отражающих уникальность геометрии речевого тракта индивида.

Наиболее явно различие спектральных характеристик проявляется в соположении формант в вокализованных отрезках речи. Пример формантного представления речи двух разных людей при произнесении фразы «Голосовой поиск» приводится на рисунке №1 ниже (по вертикальной оси - частота сигнала в Гц, по горизонтальной - время звучания в секундах, степень зачернения отражает концентрацию энергии).

Рисунок №1. Пример формантного представления речи двух разных людейИспользуемый в Voice Key спектрально-формантный метод основан на выделении и сравнении положения и динамики поведения трех и более формант. Используется несколько десятков параметров, характеризующих формантную структуру речи.

Принцип работы включает 4 основных этапа:

· Создание шаблона - сведения о физиологической или поведенческой характеристике преобразуются в форму, доступную компьютерным технологиям, и сохраняются в память биометрической системы

· Выделение - из вновь предъявленного идентификатора выделяются уникальные признаки, анализируемые системой

· Сравнение - сопоставляются сведения о вновь предъявленном и ранее зарегистрированном идентификаторе

· Решение - вносится заключение о том, совпадают или не совпадают вновь предъявленный и ранее зарегистрированный идентификатор

Заключение о совпадении/несовпадении идентификаторов затем транслируется другим системам (контроля доступа, защиты информации и т.д.), которые далее действуют в зависимости от полученной информации.

Важнейшим элементом успешного распознавания дикторов является выбор информативных признаков (речевых параметров), способных эффективно представлять информацию об особенностях речи конкретного диктора.

К ним предъявляются следующие требования:

эффективность представления информации об особенностях речи конкретного диктора;

простота измерения;

стабильность во времени;

частое и естественное появление в речи;

невосприимчивость к имитации.

В качестве уникального вектора признаков можно использовать одномерный частотный вектор кепстральных коэффициентов, а также вектор, составленный из его производных.

Кепстральные коэффициенты определяются в соответствии со схемой, представленной на Рисунке №2:

Рисунок №2 - Общая схема кепстрального анализа сигнала (FFT - блок быстрого преобразования Фурье сигнала, LOG - блок логарифмирования спектра, IFFT - блок обратного быстрого преобразования Фурье)

В качестве вектора признаков можно использовать коэффициенты отражения. Физический смысл коэффициентов отражения состоит в определении величины волны, отраженной на границе двух акустических труб.

Коэффициенты отражения рассчитываются путем преобразования вектора коэффициентов предсказывающего фильтра a в коэффициенты отражения соответствующей решетчатой структуры по следующему рекурсивному алгоритму:

(n)=an(n) (1.1)

(1.2)

Данные формулы основаны на рекурсивном алгоритме Левинсона. Для его реализации в цикле перебираются элементы вектора a, начиная с последнего и заканчивая вторым.

Иногда используются также функции от коэффициентов отражения - логарифмические отношения площадей (Log-Area Ratio - LAR):

(1.3)

где ki - коэффициенты отражения.

Еще одним признаком являются площади поперечных сечений акустических труб. Голосовой тракт можно представить в виде последовательности р акустических труб одинаковой длины и различных диаметров, имеющие площади поперечных сечений Ai. Представление голосового тракта в виде последовательности труб изображено на Рисунке №3.

Перейти на страницу: 1 2 3

Другие статьи по теме

GMSK-модулятор
В среде MATLAB собрали схему MSK модулятора, установили заданные параметры элементов схемы. Рисунок1-спектр сигнала на выходе схемы Затем со всех осциллогр ...

Малошумящий усилитель с устройством защиты входа от просачивающейся высокой мощности СВЧ
При интенсивной эксплуатации радиолокационных станций (РЛС) рано или поздно встает вопрос об их ремонте, техническом обслуживании и замене выработавших ресурс комплектующих, включая мал ...

Характеристики сигналов в каналах связи
Беспроводные сети. Беспроводная Ethernet. Существует несколько технологий беспроводных сетей, использующих как радио-, так и инфракрасные волны. Эти технологии существуют уже несколько лет ...

www.domen.ru © 2018