Нейронные сети

Автор работы: Пользователь скрыл имя, 18 Ноября 2011 в 07:39, реферат

Описание работы

В моменты принятия сложных решений человек старается «заглянуть в себя» и постичь, каким образом он справляется с трудными и порой не решаемыми формальной логикой задачами

Содержание работы

Введение

1. Нейронные сети: варианты использования

2. Диагностика и прогнозирование экономических объектов

3. Применение нейронных сетей в экономике и бизнесе

4. Нейросетевые модели бизнес-прогнозирования

Заключение

Список использованной литературы

Файлы: 1 файл

Нейронные сети.doc

— 117.00 Кб (Скачать файл)

      Одно  важное направление связано с процедурами голосования при оценке состояний объектов. В сфере голосования ситуация крайне сложна, и здесь на каждом шагу встречаются парадоксы. Нами показано, что противоречий удаётся избежать в случае, когда решение задачи выбора сведено к серии задач классификации, и в этом случае метод комитетов даёт хорошие результаты. Методу комитетов отвечает трёхслойная нейронная сеть, и из теорем существования комитетов следует, что такую сеть можно обучить по прецедентам решению любой задачи, решение которой выражается словом в каком–либо конечном алфавите.

      Приведём  аргументы в пользу сведения принятия решений к сериям задач классификации. Близкая многокритериальной оптимизации  процедура коллективных решений  является важнейшей в задачах выбора вариантов. Проблема принятия согласованных решений коллективом людей или коллективом решающих правил возникает постоянно в задачах прогнозирования. Однако оказалось, что нельзя априори предложить наиболее эффективную процедуру голосования. Она всегда зависит от конкретной ситуации и фактически при грамотном подходе превращается в процесс согласования интересов сторон – процесс, требующий большой аккуратности, чтобы не попасть в одну из многочисленных формальных ловушек. Это важно для диагностики коллективами экспертов. Фактически, это игра нескольких лиц, где выигрывает тот, кто хорошо считает и использует малейшие просчёты партнёров. Изучение задачи согласования индивидуальных мнений экспертов и лиц, принимающих решения (ЛПР) сегодня перешло на качественно новый математический уровень.

      Решение почти любой задачи можно представить  в виде схемы:

      Задача Z -> параметризатор S -> x = [x1,…,xn] -> решатель -> arg Z = f(x). Решатель – это компьютер  того или иного вида. Вместо того, чтобы говорить об алгоритме решения задачи Z из класса З, будем говорить об алгоритме, позволяющем с помощью программы П восстанавливать по последовательности (коду) х из Х последовательность ( код) y = argZ, y – из Y.

      Собственно  говоря, этот круг вопросов связан с  идеей расщепления сложной задачи в сеть простых задач. Эта идея реализована в разных разделах математики под разными названиями: модульный принцип в пакетах программ (Н.Н. Яненко), принцип расщепления в математической физике (Г.И. Марчук), метод декомпозициии в оптимизации, метод конечных элементов в вычислительной физике и т.д. Спрашивается, можно ли синтезировать решение большой сложной задачи из множества решений подзадач?

      Итак, мы решаем следующую конкретную задачу.

      Требуется по данным наблюдений (таблица объект\признак) выявить закономерности вида y = f(x), где у – целевой показатель, х – вектор входных признаков (факторов). На основании этой информации провести прогноз параметров деятельности экономических объектов. Зависимость требуется получить в нейросетевой форме.

      С этим подходом связана задача управления признаками. Эта задача распадается  на ряд этапов: селекция признаков, преобразование признаков (построение спрямляющего пространства), оценка отдельных  признаков и их совокупностей, оценка влияния вариаций признаков на результат классификации.

      Настройка нейронной сети на моделирование  зависимости y = f(x) сводится к дискриминантному анализу.

      Итак, для моделирования эмпирических закономерностей мы рассматриваем  задачу дискриминантного анализа –  задачу построения функции f из функционального класса F, разделяющую прецедентные множества А и В. Эту задачу обозначим DA(A,B,F): найти f из F: f(x)>0 для х из А, f(x)<0 для х из В.

      Разделяющий комитет: C = [ f1,…,fq], причем каждому неравенству  нашей задачи удовлетворяет более половины элементов из С.

      Эти задачи решаются на основе накопленных  наблюдений по динамике показателей. Распознавание  образов и регрессионный анализ используются для нахождения эмпирических зависимостей между показателями. Далее  на этой основе рассматриваются оценки признаков и систем признаков, отбор полезных признаков и их отбор. А именно, пусть f = arg DA(A,B,F), то есть f - разделяющая функция для множеств А и В. Если имеется вектор состояния объекта: x = [x1,…,xn], который мы хотим перевести в класс А, то мы решаем задачу управления признаками: найти y = [y1,…,yn], чтобы f(x+y) > 0. В более общей модели u – оператор управления, действующий на вектор состояния х так, чтобы в результате х можно было перевести в нужный класс.

      Это связано с оценкой факторов: ценность фактора ( входного показателя) xi –это эластичность критериальных (целевых) функций f1,…,fp по отношению к фактору xi, val(x) = матрица, составленная из векторов gradfj(x).

      Для детализации содержательной схемы  моделирования работы экономического объекта мы должны учесть тот факт. что построение адекватной математической модели экономических показателей требует разработки содержательной концепции экономического и производственного процесса на промышленном объекте и его формализации. Результат – выделение входных и выходных показателей.

 

       3. Применение  нейронных сетей  в экономике и  бизнесе

 

      Применение  нейронных сетей в экономике  и бизнесе основывается на возможности сетей прогнозировать тенденции развития тех или иных показателей. Известны применения нейронных сетей для прогнозирования изменения биржевых цен, стоимости акций и т.п. В таких задачах к входным параметрам предъявляются следующие требования: 1) входные данные должны быть представлены в числовом виде; 2) обучающие выборки должны быть большими. Но в рыночной экономике числовые показатели важны так же, как и психологические факторы, политика, которые могут хоть и кратковременно, но значительно изменять рыночные цены. Поэтому часто используют экспертные оценки ситуаций и выражают их числами, которые тоже учитываются как входные параметры нейронных сетей.

      Известно, что риск инвестиций в экономику  высок, если изменение рыночных цен  большое. Чтобы оценить этот риск, применяют нейронные сети. Это  основано на том факте, что нейронные сети могут представлять сложные нелинейные отношения в таких областях, в которых обычные статистические методы не работают хорошо.

      В рыночной экономике высока вероятность  банкротства предприятий, фирм, целых  корпораций, банков. Банкротство –  самая значительная угроза для фирм. Но это не только ликвидация самой фирмы, этот процесс оказывает влияние на экономику в целом. Опыт последних даух десятилетий показывает, что бизнесмены терпят крах своих предприятий чаще, чем в любые другие годы, начиная с 30-х годов. Особенно страдают от банкротства инвесторы, кредиторы, управленцы и сотрудники. Поскольку экономическая цена банкротств высока, существует необходимость в моделях, которые предсказали бы подобные события. Предупреждение о несостоятельности предприятий можно получить на основе моделирования с помощью нейронных сетей.

      В банковской деятельности важной задачей  работы с клиентами является подтверждение  подписи клиента на чеках. Задача верификации подписи клиента  может быть решена с помощью нейронных сетей.

      4. Нейросетевые модели бизнес-прогнозирования

 

      В настоящее время, на наш взгляд, самым  перспективным количественным методом  прогнозирования является использование  нейронных сетей. Можно назвать  много преимуществ нейронных  сетей над остальными алгоритмами, ниже приведены два основных.

      При использовании нейронных сетей  легко исследовать зависимость  прогнозируемой величины от независимых  переменных. Например, есть предположение, что продажи на следующей неделе каким-то образом зависят от следующих параметров:

  1. продаж в последнюю неделю
  2. продаж в предпоследнюю неделю
  3. времени прокрутки рекламных роликов (TRP)
  4. количества рабочих дней
  5. температуры

      Кроме того, продажи носят сезонный характер, имеют тренд и как-то зависят  от активности конкурентов.

      Хотелось бы построить систему, которая бы все это естесственным образом учитывала и строила бы краткосрочные прогнозы.

      В такой постановке задачи большая  часть классических методов прогнозирования  будет просто несостоятельной. Можно  попробовать построить систему на основе нелинейной множественной регрессии, или вариации сезонного алгоритма ARIMA, позволяющей учитывать внешние параметры, но это будут модели, скорее всего, малоэффективные (за счет субъективного выбора модели) и крайне негибкие.

      Используя же даже самую простую нейросетевую архитектуру (персептрон с одним скрытым слоем) и базу данных (с продажами и всеми параметрами) легко получить работающую систему прогнозирования. Причем учет, или не учет системой внешних параметров будет определяться включением, или исключением соответствующего входа в нейронную сеть.

      Более искушенный эксперт может с самого начала воспользоваться каким-либо алгоритмом определения важности (например, используя Нейронную сеть с общей  регрессией и генетической подстройкой) и сразу определить значимость входных переменных, чтобы потом исключить из рассмотрения мало влияющие параметры.

      Еще одно серьезное преимущество нейронных  сетей состоит в том, что эксперт  не является заложником выбора математической модели поведения временного ряда. Построение нейросетевой модели происходит адаптивно во время обучения, без участия эксперта. При этом нейронной сети предъявляются примеры из базы данных, и она сама подстраивается под эти данные.

      Недостатком нейронных сетей является их недетерминированность. Имеется в виду то, что после обучения имеется "черный ящик", который каким-то образом работает, но логика принятия решений нейросетью совершенно скрыта от эксперта. В принципе, существуют алгоритмы "извлечения знаний из нейронной сети", которые формализуют обученную нейронную сеть до списка логических правил, тем самым создавая на основе сети экспертную систему. К сожалению, эти алгоритмы не встраиваются в нейросетевые пакеты, к тому же наборы правил, которые генерируются такими алгоритмами достаточно объемные. Подробнее об этом можно почитать в книге А.А. Ежова, С.А. Шумского "Нейрокомпьютинг и его применения в экономике и бизнесе".

      Тем не менее, для людей, умеющих работать с нейронными сетями и знающими нюансы настройки, обучения и применения, в практических задачах непрозрачность нейронных сетей не является сколь-нибудь серьезным недостатком.

      Использование многослойных персептронов

      Самый простой вариант применения искусственных  нейронных сетей в задачах  бизнес-прогнозирования - использование  обычного персептрона с одним, двумя, или (в крайнем случае) тремя скрытыми слоями. При этом на входы нейронной сети обычно подается набор параметров, на основе которого (по мнению эксперта) можно успешно прогнозировать. Выходом обычно является прогноз сети на будущий момент времени. 

        

      Рассмотрим  пример прогнозирования продаж. На рисунке представлен график, отражающий историю продаж некого продукта по неделям. В данных явно заметна выраженная сезонность. Для простоты предположим, что никаких других нужных данных у нас нет. Тогда сеть логично строить следующим образом. Для прогнозирования на будущую неделю надо подавать данные о продажах за последние недели, а также данные о продажах в течении нескольких недель подряд год назад, чтобы сеть видела динамику продаж один сезон назад, когда эта динамика была похожа на настоящую за счет сезонности.

      Если  входных параметров много, крайне рекомендуется  не сбрасывать их сразу в нейронную  сеть, а попытаться вначале провести предобработку данных, для того чтобы  понизить их размерность, или представить в правильном виде. Вообще, предобработка данных - отдельная большая тема, которой следует уделить достаточно много времени, так как это ключевой этап в работе с нейронной сетью. В большинстве практических задач по прогнозированию продаж предобработка состоит из разных частей. Вот лишь один пример.

      Пусть в предыдущем примере у нас  есть не только историческая база данных о продажах продукта, которые мы прогнозируем, но и данные о его  рекламе на телевидении. Эти данные могут выглядеть следующим образом  

        

      По  оси времени отложены номера недель и рекламные индексы для каждой недели. Видно, что в шестнадцатую и семнадцатую недели рекламы  не было вообще. Очевидно, что неправильно  данные о рекламе подавать в сеть (если это не рекуррентная нейронная сеть) в таком виде, поскольку определяет продажи не сама реклама как таковая, а образы и впечатления в сознании покупателя, которые эта реклама создает.

Информация о работе Нейронные сети