Применение нейронной сети к идентификации пользователя

Автор работы: Пользователь скрыл имя, 01 Июля 2013 в 17:55, дипломная работа

Описание работы

Разработчики традиционных устройств идентификации уже столкнулись с тем, что стандартные методы во многом устарели. Про-блема, в частности, состоит в том, что общепринятое разделение методов контроля физического доступа и контроля доступа к инфор-мации более несостоятельно. Ведь для получения доступа к серверу иногда совсем не обязательно входить в помещение, где он стоит. Причиной тому - ставшая всеобъемлющей концепция распределенных вычислений, объединяющая и технологию клиент-сервер, и Интернет. Для решения этой проблемы требуются радикально новые методы, основанные на новой идеологии. Проведенные исследования показывают, что ущерб в случаях несанкционированного доступа к данным компаний может составлять миллионы долларов.

Содержание работы

Введение 7
1 Анализ предметной области 8
1.1 Задачи системы ограничения доступа 10
1.2 Технические средства формирования аудиоданных 17
1.3 Основы биометрической идентификации 19
1.4 Характеристика существующих аналогичных систем 22
1.5 Возможность использования нейросетей для построения системы распознавания речи 27
1.6 Система распознавания речи как самообучающаяся система 29
2 Постановка задачи 30
3 Общее описание системы 31
3.1 Описание структурной схемы разрабатываемой САПР 33
3.2 Описание схемы работы системы разрабатываемой подсистемы САПР 35
4 Описание видов обеспечений 36
4.1 Описание математического обеспечения 36
4.2 Описание технического обеспечения 60
4.3 Описание информационного обеспечения 61
4.4 Описание лингвистического обеспечения 66
4.5 Описание методического обеспечения 71
4.6 Тестирование программного обеспечения 73


5 Вопросы охраны труда 77
5.1 Введение в охрану труда 77
5.2 Неблагоприятные факторы и средства защиты от них 78
5.3 Классификация объекта по взрывной, взрывопожарной и пожарной опасности 80
5.4 Электробезопасность 81
5.5 Расчёт заземляющего контура 82
5.6 Производственное освещение 84
5.7 Гигиена труда 92
6. Технико-экономическое обоснование проекта 93
6.1 Персонал. орагнизационная структура. 95
6.2 Сроки реализации проекта. календарный график проекта. планирование работ по проекту с использованием сетевого графика 95
6.3 Оценка экономической эффективности от внедрения проекта 98
6.4 Расчет единовременных затрат 99
6.5 Расчет стоимости одного машино-часа работы комплекса технических средств САПР 101
6.6 Расчет предустановочных затрат 104
6.7 Затраты на внедрение аналогичных систем. 104
6.8 Расчет годовых текущих издержек на разработку проекта 106
6.9 Сводная таблица технико-экономических показателей разработки САПР 108
6.10 Выводы 108
Заключение 109
Список используемых источников 110

Файлы: 1 файл

diplom.doc

— 3.16 Мб (Скачать файл)

Эффект маскирования — это важный инструмент в современных аудиотехнологий. Определяя и выборочно отбрасывая слабые звуки, которые будут маскированы более громкими, можно в целом упростить звук и добиться того, что обрабатывать его будет проще. Хорошее понимание эффекта маскирования позволит выявить наиболее слышимые составляющие сложного звука: для этого требуется понять, что звуки с самыми большими амплитудами вовсе не обязательно слышны лучше всех остальных.

Есть еще несколько  факторов, которые влияют на наше восприятие громкости. Во-первых, громкость частично зависит от высоты тона. Слух человека более чувствителен в определенном среднем диапазоне частот. Его чувствительность прогрессирующе падает на более низких или высоких тонах. В результате этого, если взять звук средней высоты тона и звук высокого тона, у которых будет одинаковая мощность, то более громким покажется звук среднего тона.

Кроме того, сложные звуки  человек слышит хуже звуков простых тонов. В частности, очень трудно расслышать высокочастотный шум. Метод цифрового преобразования, называемый размыванием (dithering) позволяет преобразовать ошибки некоторых типов в менее различимый высокочастотный шум.

4.1.2 Спектральное преобразование сигнала

Поскольку любой  звук раскладывается на синусоидальные волны, мы можем построить частотный спектр звука. Спектр частот звуковой волны представляет собой график зависимости амплитуды от частоты.

На рисунке 4.2 показаны некоторые основные характеристики синусоиды. Частота – это количество полных циклов которые укладываются в одну секунду; она связана с периодом времени, необходимым для одного цикла. Вертикальная шкала обозначает амплитуду, которая соответствует величине отсчета, электрического напряжения, тока или давление воздуха.

Рисунок 4.2 - Частота, период и амплитуда волны

Математически синусоида описывается функциями sin() или соs(). Простая функция sin(t) имеет амплитуду равную единице, период равный 2 секунд и соответствующую частоту, равную 1/2 циклов секунду. Можно преобразовать эту запись в более полезную форму: Asin(2 ft) что соответствует синусоиде с амплитудой А и частотой f.

Здесь предполагается, что t представляет собой время (в секундах), f - значение частоты. При работе с дискретным сигналом в качестве t удобнее использовать номер отсчета. В этом случае запись Asin(2 ft) представляет синусоиду с амплитудой А и частотой fS, где S - частота дискретизации. Далее будем будем работать в каждый момент времени с группами по N отсчетов и интересовать нас будут определеные  частоты, поэтому я использую записи вида sin(2 ft/N)  и cos(2 ft/N), которые представляют волны с единичной амплитудой и частотой равной fS/N.

Амплитуда и  частота не дают полной картины. Временные  задержки могут послужить причиной смещения волн друг относительно друга, как показано на рисунке 4.3. Хотя измеряются эти смещения как временные задержки, более удобно представлять их как дробные части периода, называемые фазой.

Рисунок 4.3 - Три синусоиды с различной частотой

Поскольку синусоиды  тесно связаны с окружностями, фаза измеряется в градусах. Один полный цикл - это 360°. На рисунке 4.4 показана еще одна синусоида. Ее временная, горизонтальная, ось размечена в градусах фазы. Как поворот на 360° возвращает в исходное положение, так изменение фазы на 360° оставляет  сигнал неизменным.

Рисунок 4.4 - Синусоида, размеченная в градусах фазы

 

Фазовые изменения  часто происходят по причине временных  задержек. Например, каждый цикл сигнала в 1000 Гц занимает 1/1000 секунды. Если задержать сигнал на 1/2000 секунды (полупериод), то получится 180-градусный сдвиг но фазе. Заметим, что этот эффект опирается на зависимость между частотой и временной задержкой. Если сигнал в 250 Гц задержать на те же самые 1/2000 секунды, то будет реализован 45-градусный сдвиг по фазе.

Если сложить  вместе две синусоидальные волны  одинаковой частоты, то получится новая синусоидальная волна той же частоты. Это будет верно даже в том случае, если два исходных сигнала имеют разные амплитуды и фазы. Например, Asin(2 ft) и Bcos(2 ft)- две синусоиды с разными амплитудами и фазами, но I c одинаковой частотой.

Для измерения  амплитуды одной частоты нужно  умножить имеющийся сигнал на синусоиду той же частоты и сложить полученные отсчеты.

Чтобы записать это в символьном виде, предположим, что отсчеты имеют значения s0, s1, … , st, …. Переменная t представляет собой номер отсчета (который заменяет значение времени). Измеряется амплитуду частоты f в первом приближении, при вычислении следующей суммы:

Af =

Значения t и f не соответствуют в точности времени и частоте. Более того, f – целое число, а реальная исследуемая частота – это частота дискретизации, умноженная на f/N.  Подобным образом, t — это целочисленный номер отсчета. Кроме того, суммирование дает не непосредственное значение амплитуды, а всего лишь число, пропорциональное амплитуде.

Если повторить эти вычисления для различных значений f, то можно измерить амплитуду всех частот в сигнале. Для любого целого f меньшего N легко определяется значение Аf, представляющее амплитуду соответствующей частоты как долю от общего сигнала. Эти значения могут быть вычислены по той же формуле:

Если мы знаем  значения Af мы можем восстановить отсчеты. Для восстановления сигнала необходимо сложить все занчения для разных частот.

Чтобы осуществлять точное обратное преобразование Фурье, помимо амплитуды и частоты необходимо измерять фазу каждой частоты.

Для этого  нужны комплексные числа. Можно  изменить описанный ранее метод вычислений так, что он будет давать двумерный результат. Простое коми1 лексное число – это  двумерное значение, поэтому оно одновременно но представляет и амплитуду, и фазу.

При таком подходе фазовая часть вычисляется неявно. Вместо амплитуды и фазы измеряется две амплитуды, соответствующие разным фазам. Одна из этих фаз представляется косинусом (соs()), другая - синусом sin()).

Используя комплексные  числа, можно проводить измерения одновременно, умножая синусную часть на -i.

Каждое значение Af теперь представляется комплексным числом; действительная и мнимая части задают амплитуду двух синусоидальных волн с разным фазами. Заменим на эквивалентное .

Основная  идея быстрого преобразования Фурье  заключается в том, что каждую вторую выборку можно использовать для получения половинного спектра. Формально это означает, что формула дискретного преобразования Фурье может быть представлена в виде двух сумм. Первая содержит все четные компоненты оригинала, вторая - все нечетные

Представление речевой информации в частотной  области обладает некоторыми преимуществами. Во-первых, это дает достаточно четкое описание звуков речи. Во-вторых, в начальной стадии восприятия в ухе человека производиться некоторый грубый анализ. Таким образом, характерные особенности, которые проявляются в результате частотного анализа, играют важную роль в процессах восприятия и распознавания голосовой информации. Поэтому важно найти спектральную плотность апериодической функции.

Непрерывный речевой сигнал, как и любой другой можно представить в виде:

если множество  функций Un являются ортогональными, то есть удовлетворяющим условию

где    C - константа.

В этом случае значения коэффициентов an определяются выражением:

В зависимости  от вида используемых ортогональных  функций различают несколько видов преобразований. С помощью пары преобразований Фурье можно выразить связь между апериодической функцией времени f(t) и ее комплексным спектром F(w):

Спектральная  форма включает в себя две основные операции: аналого-цифровое преобразование — преобразование сигнала из волны звукового давления в цифровой сигнал; цифровая фильтрация — выделение главной частоты сигнала. Процесс преобразования показан на рисунке 4.5. Я не останавливаюсь на выборе частоты оцифровки сигнала, хотя этот выбор играет важную роль в задаче моделирования сигнала.



      Рисунок 4.6 - Пример входного сигнала АЦП



Микрофон, используемый в процессе АЦ - преобразования, обычно вносит нежелательные примеси в сигнал, например сетевой шум (звук с частотой 50 Гц от электрической проводки), теряет часть низких и высоких частот и нелинейные искажения. АЦ - преобразователь также вносит свои собственные искажения из-за нелинейной функции передачи и колебания постоянного смещения. Пример такого сигнала показан на рисунке 4.6. Ослабление низких и высоких частот часто вызывает проблемы с алгоритмами последовательного параметрического спектрального анализа.

Главная цель процесса оцифровки заключается  в получении данных речевого сигнала с высоким отношением Сигнал/Шум. В настоящее время телекоммуникационные системы обеспечивают значение этого коэффициента порядка 30 dB для приложений распознавания голоса, что более чем достаточно для получения высокой производительности таких приложений. Изменения в преобразователях, каналах и фоновом шуме, тем не менее, вызывают определенные проблемы.

4.1.3 Фильтрация спектра.

Получив спектральное представление сигнала его требуется  отчистить от шумов. Человеческий голос обладает известными характеристиками, и поэтому те области которые не могут являются характеристиками голоса нужно погасить.

Для этого  применим функцию, которая получила название «окно Кайзера»

После фильтрации спектра нужно наложить окно Ханнинга

4.1.4 Сравнение с эталонными образцами

Основным  параметром, используемым для идентификации, является мера сходства двух звуковых фрагментов. Для ее вычисления необходимо сравнить спектрограммы этих фрагментов. При этом сначала сравниваются спектры, полученные в отдельном окне, а затем вычисленные значения усредняются.

Для сравнения  двух фрагментов использовался следующий подход:

Предположим что X[1..N] и Y[1..N] - массивы чисел, одинакового размера N, содержащие значения спектральной мощности первого и второго фрагментов соответственно.

Тогда мера сходства между  ними вычисляется по следующей формуле:

где    Mx и My - математические ожидания для массивов X[] и Y[] соответственно, вычисляющиеся по следующей формуле:

Данный способ вычисления меры сходства двух фрагментов представленных в виде спектра является самым оптимальным для задачи идентификации человека по его голосу.

4.1.5 Нейросетевое сравнение на  основе простых персептронов.

Искусственный нейрон

Несмотря на большое разнообразие вариантов  нейронных сетей, все они имеют  общие черты. Так, все они, так же, как и мозг человека, состоят из большого числа связанных между собой однотипных элементов – нейронов, которые имитируют нейроны головного мозга. На рисунке 4.7 показана схема нейрона.

Рисунок 4.7 – Схема  нейрона

Из рисунка  видно, что искусственный нейрон, так же, как и живой, состоит из синапсов, связывающих входы нейрона с ядром; ядра нейрона, которое осуществляет обработку входных сигналов и аксона, который связывает нейрон с нейронами следующего слоя. Каждый синапс имеет вес, который определяет, насколько соответствующий вход нейрона влияет на его состояние. Состояние нейрона определяется по формуле

где      n – число входов нейрона

x– значение i-го входа нейрона

w– вес i-го синапса

Затем определяется значение аксона нейрона по формуле

Y = f(S)

 

где     f – некоторая функция, которая называется активационной. Наиболее часто в качестве активационной функции используется так называемый сигмоид, который имеет следующий вид:

 

Основное достоинство  этой функции в том, что она  дифференцируема на всей оси абсцисс и имеет очень простую производную:

 

При уменьшении параметра a сигмоид становится более пологим, вырождаясь в горизонтальную линию на уровне 0,5 при a=0. При увеличении a сигмоид все больше приближается к функции единичного скачка.

Хотя один нейрон и  способен выполнять простейшие процедуры распознавания, сила нейронных вычислений проистекает от соединений нейронов в сетях. Простейшая сеть состоит из группы нейронов, образующих слой. Каждый элемент из множества входов отдельным весом соединен с каждым искусственным нейроном. А каждый нейрон выдает взвешенную сумму входов в сеть. В искусственных и биологических сетях многие соединения могут отсутствовать, все соединения показаны в целях общности. Могут иметь место также соединения между выходами и входами элементов в слое.

Информация о работе Применение нейронной сети к идентификации пользователя