Применение нейронной сети к идентификации пользователя

Автор работы: Пользователь скрыл имя, 01 Июля 2013 в 17:55, дипломная работа

Описание работы

Разработчики традиционных устройств идентификации уже столкнулись с тем, что стандартные методы во многом устарели. Про-блема, в частности, состоит в том, что общепринятое разделение методов контроля физического доступа и контроля доступа к инфор-мации более несостоятельно. Ведь для получения доступа к серверу иногда совсем не обязательно входить в помещение, где он стоит. Причиной тому - ставшая всеобъемлющей концепция распределенных вычислений, объединяющая и технологию клиент-сервер, и Интернет. Для решения этой проблемы требуются радикально новые методы, основанные на новой идеологии. Проведенные исследования показывают, что ущерб в случаях несанкционированного доступа к данным компаний может составлять миллионы долларов.

Содержание работы

Введение 7
1 Анализ предметной области 8
1.1 Задачи системы ограничения доступа 10
1.2 Технические средства формирования аудиоданных 17
1.3 Основы биометрической идентификации 19
1.4 Характеристика существующих аналогичных систем 22
1.5 Возможность использования нейросетей для построения системы распознавания речи 27
1.6 Система распознавания речи как самообучающаяся система 29
2 Постановка задачи 30
3 Общее описание системы 31
3.1 Описание структурной схемы разрабатываемой САПР 33
3.2 Описание схемы работы системы разрабатываемой подсистемы САПР 35
4 Описание видов обеспечений 36
4.1 Описание математического обеспечения 36
4.2 Описание технического обеспечения 60
4.3 Описание информационного обеспечения 61
4.4 Описание лингвистического обеспечения 66
4.5 Описание методического обеспечения 71
4.6 Тестирование программного обеспечения 73


5 Вопросы охраны труда 77
5.1 Введение в охрану труда 77
5.2 Неблагоприятные факторы и средства защиты от них 78
5.3 Классификация объекта по взрывной, взрывопожарной и пожарной опасности 80
5.4 Электробезопасность 81
5.5 Расчёт заземляющего контура 82
5.6 Производственное освещение 84
5.7 Гигиена труда 92
6. Технико-экономическое обоснование проекта 93
6.1 Персонал. орагнизационная структура. 95
6.2 Сроки реализации проекта. календарный график проекта. планирование работ по проекту с использованием сетевого графика 95
6.3 Оценка экономической эффективности от внедрения проекта 98
6.4 Расчет единовременных затрат 99
6.5 Расчет стоимости одного машино-часа работы комплекса технических средств САПР 101
6.6 Расчет предустановочных затрат 104
6.7 Затраты на внедрение аналогичных систем. 104
6.8 Расчет годовых текущих издержек на разработку проекта 106
6.9 Сводная таблица технико-экономических показателей разработки САПР 108
6.10 Выводы 108
Заключение 109
Список используемых источников 110

Файлы: 1 файл

diplom.doc

— 3.16 Мб (Скачать файл)

Подсистема  подготовки и вывода документации необходима для подготовки и создания необходимой документации и вывода её на бумажный носитель. Данная подсистема представляет собой диалоговую подсистему использующую COM объект основанный на стандартных программах подготовки документации, таких как Microsoft Word XP, Excel XP. Результатом работы этой системы является подготовленный, не без участия человека, документ, готовый к выводу на бумажный носитель, причём системный администратор имеет возможность контролирования и изменения документа перед выводом его на печать. Для упрощения создания документации, в дальнейшем будет необходима база данных шаблонов и графических примитивов, при помощи которой пользователь сможет быстро и качественно документацию.

Подсистема  визуализации полученного спектра предназначена для визуального представления результатов расчёта. Результатами работы данной подсистемы является визуальное отображение на монитор.

Информационная  подсистема необходима для хранения данных на всех этапах работы подсистемы, обеспечения взаимосвязи между остальными подсистемами, а также для сбора и хранения необходимых вспомогательных данных, таких как параметры пользователей, настройки программы, статистическая документация, образцы голоса пользователя. Данная подсистема организована в виде базы данных и имеет необходимый набор программных средств для доступа, поиска, изменения и коррекции хранимых данных. Информационная подсистема включает в себя следующие базы данных:

    • БД образцов голоса;
    • БД зарегистрированных в системе пользователей;
    • БД статистической информации;
    • БД настроек программы.

Подсистема  обслуживания занимается проблемами, связанными с настройкой программы, выбором оптимальных настроек микрофона, настройкой режимов работы программы. Основной её задачей является обслуживание подсистемы авторизации пользователя. Имея доступ к базам данных, данная подсистема осуществляет сохранение необходимых значений в базе данных.

Структурная схема подсистемы САПР защиты от несанкционированного доступа выполнена согласно ГОСТ 23501.106-85 "САПР.  Технический проект".

3.2 Описание схемы работы системы разрабатываемой подсистемы САПР

На схеме работы системы САПР (приложение Б) представлен процесс работы подсистемы САПР защиты от несанкционированного доступа.

При запуске  программа запрашивает какое  действие хочет выполнить пользователь. При выборе необходимой подпрограммы она запускается и работает отдельно от остальных подсистем.

Возможные варианты действий:

1) добавление нового пользователя – проверяется есть ли этот пользователь в системе, если есть то предыдущая запись удаляется при сохранении параметров пользователя. Далее программа ожидает ввода данных с микрона. Звуковые образцы можно записывать в любой последовательности. На основе полученных образцов выносится первичное заключение об их похожести, и вычисляется возможное значение порогового уровня схожести при входе. При нажатии на кнопку записи новые параметры сохраняются.

2) Удаление пользователей – от пользователя требуется выбрать нужную запись и программа удалит его. После этого у удаленного пользователя голосовая защита при входе в систему отключается.

3) Просмотр статистики – от пользователя требуется выбрать необходимый ему тип статистики, который можно будет просмотреть, экспортировать в Excel или распечатать.

4) Настройка программы – администратор имеет возможность настроить программу на оптимальные параметры отвечающие его требованиям к оборудованию. Требуется настроить микрофон, ширину спектра, качество записи, выбрать используемый драйвер, установить использование технологии OpenGL, выбрать возможность полная блокировка системы при неудачном входе в систему, установить максимальное количество попыток, выбрать обходной пароль.

Схемы работы подсистемы САПР защиты выполнена согласно ГОСТ 23501.106-85 "САПР. Технический проект”. Размеры блоков функциональной схемы регламентированы ГОСТ 19.701-90 "Схемы алгоритмов и программ" и ГОСТ 19.002-80, который предписывает способы оформления алгоритмов.

4 ОПИСАНИЕ  ВИДОВ ОБЕСПЕЧЕНИЙ

4.1 Описание математического обеспечения

Элементами  математического обеспечения  являются математические модели объекта проектирования, методы численного решения математических моделей, алгоритмы расчетов и методов оптимизации.

Оптимизация заключается в ускорении сравнивания  двух образцов голоса, на основе чего должно быть вынесено решение о принадлежности голоса пользователю. Также требуется настроить систему сравнивания с учетом имеющегося оборудования, с помощью чего, при наличии звуковой подсистемы с низкой потерей качества при записи среднего и профессионального уровня, можно повысить качество сравнивания, чтобы вероятность принятия неправильного решения был минимальным. Так же при наличии современного процессора, например выбранный мной для проектируемой подсистемы САПР Pentium 4 3Гц, можно увеличить ширину спектрального преобразования в 2 раза, что соответственно повысит качество распознавания. 

Процесс сравнивания  образцов состоит из следующих стадий:

  • фильтрация шумов;
  • спектральное преобразование сигнала;
  • постфильтрация спектра;
  • лифтеринг;
  • наложение окна Кайзера;
  • сравнение.

4.1.1 Фильтрация шумов

Что делать, если спектр звука имеет вид графика  показанного на рисуноке 4.1? В такой ситуации невозможно выделить частоту или хотя бы несколько частот, с помощью которых можно было бы попробовать охарактеризовать звук.

Звук, образованный колебаниями всего диапазона  частот, подобный тому, спектр которого показан на рисунке 4.1, называется шумом. Толкование этого слова, принятое в технике, отличается от общепризнанного. Свист высокого тона (издаваемый, например, старым монитором) может считаться шумом в бытовом смысле. Но у этого звука есть четко определенный спектр частот, и, следовательно, он не может считаться шумом в техническом смысле этого слова.

Рисунок 4.1 - Спектр частот шума

Шум издает двигающийся  воздух – независимо от того, дуновение ли это человека или шорох ветра в микрофоне. Можно сказать, что нежные звуки флейты в некоторой степени извлекаются из шума, производимого выдуваемым человеком воздухом.

Так как шум содержит все частоты, флейта может выделить в нем нужные и усилить их.

Если анализировать  дискретные значения (отсчеты) уровня шума (а не спектр его частот), то получится, случайная выборка. Хорошим источником шума является высококачественный генератор случайных чисел.

Для того чтобы получить четкие спектральные характеристики звука их нужно отчистить от лишних шумов.

Входной дискретный звуковой сигнал  обрабатывается фильтрами, для того чтобы избавится от помех возникающих при записи по формуле.

где    Xi – набор дискретных значений звукового сигнала.

После обработки  в сигнале ищется начало и конец  записи, а так как шумы уже отфильтрованы, то начало фрагмента будет характеризоваться всплеском сигнала, если искать с Х0. Соответственно если искать с Хn вниз, то всплеск будет характеризовать конец фрагмента. Таким образом получим начала и конца фрагмента в массиве дискретных значений сигнала. В нематематическом виде это означает, что мы нашли слово сказанное пользователем в микрофон, которое нужно усреднить с другими характеристиками голоса.

Помимо высоты тона человек  ощущает и другую характеристику звука - громкость. Физические величины, наиболее точно соответствующие громкости, - это шоковое давление (для звуков в воздухе) и амплитуда (для цифрового или электронного представления звука).

Если говорить об оцифрованном сигнале, то амплитуда - это значение выпорки. Анализируя миллионы дискретных значений уровня одного и того же звука, можно сказать о пиковой амплитуде, то есть об абсолютной величине максимального из полученных дискретных значений уровня звука. Чтобы избежать искажения, вызванного искажением ограничения сигнала при цифровой записи звука (данное искажение возникает в том случае, если величина пиковой амплитуды выходит за границы, определяемые форматом хранения данных), необходимо обратить внимание на величину пиковой амплитуды. При этом нужно сохранять отношение сигнал/шум на максимально достижимом уровне.

Основной причиной разной громкости звуков является различное давление, оказываемое ими на уши. Можно сказать, что волны давления обладают различными уровнями мощности. Волны, несущие большую мощность, с большей силой оказывают воздействие на механизм  ушей. Электрические сигналы, идущие по проводам, также передают мощность. По проводам звук обычно передается в виде переменного напряжения, и мгновенная мощность этого звука пропорциональна квадрату напряжения. Чтобы определить полную мощность за период времени, необходимо просуммировать все значения моментальной мощности за этот период.

На языке  математики это описывается интегралом , где - это напряжение в заданный момент времени.

Поскольку вы используете звук, представленный дискретными значениями, вам не понадобится брать интеграл. Достаточно просто сложить квадраты отсчетов. Среднее значение квадратов дискретных значений пропорционально средней мощности.

Так как  моментальная мощность зависит от квадрата моментальной амплитуды, имеет смысл аналогичным образом подобрать похожее соотношение, связывающее среднюю амплитуду и среднюю мощность. Способ, которым это можно сделать, заключается в определении средней амплитуды (СКЗ). Вместо того, чтобы вычислять среднее значение непосредственно амплитуды, мы сначала возводим в квадрат полученные значения, вычисляем среднее значение получившегося множества, а затем извлекаем из него корень. Метод СКЗ применяется в том случае, когда необходимо вычислить среднее для быстро меняющейся величины. Алгебраически это выражается следующим ооразом: пусть у нас N значений и х(i) - это амплитуда i-ого дискретного значения. Тогда

СКЗ амплитуды = .

Мощность пропорциональна возведенной в квадрат величине дискретного значения. Это означает, что для перехода к реальной мощности, эту величину необходимо умножить на некоторый коэффициент. Для этого не требуются точные данные электрической мощности, так что, на самом деле, нас не интересуют точные числа, скорее - относительная мощность.

Относительная мощность измеряется в белах, а чаще в децибелах (дБ, децибел, - это одна десятая бела). Чтобы сравнить два звука, берется отношение их мощности. Десятичный логарифм этого отношения и есть различие в белах; если множить получившееся число на десять, то получится значение в децибелах. Например, если мощность одного сигнала превосходит мощность другого в два раза, то первый сигнал будет громче на 10lоg10(2) = 3,01 дБ.

Децибелы можно применять только для сравнения двух сигналов. Однако измерение звуков в децибелах оказалось настолько удобным, что используют некоторый звук в качестве стандартного эталона. Этот эталон очень близок к самому тихому звуку, который только может расслышать человек. Самый громкий звук, который способен слышать человек, громче эталона приблизительно на 120 дБ (в миллион миллионов раз громче, чем эталон) — его громкость почти соответствует громкости работающего рядом реактивного двигателя. Слух человека приспособлен для восприятия звуков в широком диапазоне громкости.

Шкала децибелов  также используется для измерения  потерь звука. Если два различных  звука с одной и той же энергией пропустить через некоторую электронную цепь или цифровой алгоритм обработки звука, на выходе один звук может оказаться на 6 дБ слабее другого.

Шкала децибелов используется и для измерения уровня шума или искажений, которые были добавлены (непреднамеренно) к любому сигналу.

Есть несколько  причин, по которым с помощью измерений, проведенных в децибелах, удается хорошо аппроксимировать то, как человек ощущает громкость. Во-первых, чувство слуха у человека очень близко к логарифму: ощущаемая разница и громкости двух звуков зависит от отношения, а не от разности мощностей каждого из звуков. Хотя это будет и не совсем корректно, было бы неплохо рассматривать децибел как минимально ощущаемое изменение громкости.

Еще один аспект, для которого измерения в децибелах дают точную картину ощущений человека — это то, что ощущаемая громкость очень сильно зависит от относительной мощности. В частности, известна акустическая иллюзия, называемая маскированием. Если звук образуется двумя независимыми компонентами и одна из этих компонент гораздо громче другой, то более тихая компонента часто будет неслышна. Фактически, слух человека «настраивается» к уровню более громкого звука и более тихий звук слышится гораздо более тихим, чем он есть на самом деле. Это особенно относится к тем ситуациям, когда у этих звуков очень близки высоты тона.

Информация о работе Применение нейронной сети к идентификации пользователя