Методы оптимизации

Автор работы: Пользователь скрыл имя, 05 Июня 2012 в 02:07, реферат

Описание работы

Дана функция y=f(x)-целевая функция. Функция одной переменной, имеющая в интервале исследования один горб(впадину) называется унимодальной.

Файлы: 1 файл

оптимизация.docx

— 38.47 Кб (Скачать файл)

Методы оптимизации.

 

Классические методы функции одной  переменной.

 

Дана функция y=f(x)-целевая функция. Функция одной переменной, имеющая в интервале исследования один горб(впадину) называется унимодальной.

Более строго:                                                                     

Определение: функция f(x), заданная на интервале a<=x<=b называется унимодальной на [a,b], если существует единственная точка x* минимума f(x), т.е. f(x*)=min F(x) {на a<=x<=b}                                                                   и если для любых двух точек x1,x2 принадлежащих [a,b] выполняется соотношение:

-из неравенств x1<x2<=x* следует f(x1)>f(x2);

-из неравенств x2>x1=>x* следует F(x1)<F(x2).

 

Необходимое условие  минимума(максимума) функции f(x) в точке x*.

Необходимые условия того, что x* является точкой локального минимума (максимума) дважды дифференцируемой функции f на открытом интервале (a,b) выражаются следующими соотношениями:

1)    df                        2)      d2f


                       =0                                     =>0(<=0)


       dx     x=x*                   dx2      x=x*

Определение:

Стационарной точкой называется точка x*, в которой

     df


                        =0


     dx     x=x*

 

Если стационарная точка не соответствует  локальному оптимуму (минимуму или  максимуму), то она называется точкой перегиба, или седловой точкой.

 

Пример:

                                          f(x)=x3


 

 


                                                              x*                     x

 

 

                                                             Точка перегиба(седловая точка)

 

 

Достаточные условия экстремума.

 

Пусть в точке  x* первые (n-1) производные функции обращаются в нуль, а производная порядка n отлична от нуля.

(1)Если n-нечетное, то x*-точка перегиба.

(2)Если n-четное, то x*-точка локального оптимума.

Кроме того,

(а)если эта производная положительная,  то x*-точка локального минимума

(б)если эта производная отрицательная,  то x*-точка локального максимума

Пример:

Исследуем функцию f(x)=x3 на оптимум в точкеx=0.

Вычисляем

df                                      d2f                                   d3f


              =3x2          =0;                   =6x          =0;                =6.


dx    x=0           x=0         dx2    x=0          x=0        dx3  x=0

Так как порядок  первой отличной от нуля производной  равен 3 (нечетное число), точка x=0 является точкой перегиба.

Пример:

Дана функция

f(x)=5x6 - 36x5 + (162/2)x4 - 60x3 + 36,определенная на всей действительной оси. Определить точки локальных минимумов и максимумов.

Вычисляем:

df/dx=30x5 – 180x4 + 330x3 – 180x2 = 30x2(x-1)(x-2)(x-3)

Первая производная обращается в нуль в точках x=0,1,2,3-это стационарные точки.

Вычисляем:

d2f/dx2=150x4 – 270x3 + 990x2 – 360x

  d2f

                 =0       , пока ничего нельзя сказать об этой точке

  dx2   x=0

 

  d2f


                =60>0  ,  x=1 – точка локального минимума

  dx2  x=1

 

  d2f


               = -120<0, x=2 – точка локального максимума

  dx2  x=2


  d2f


               =540>0,    x=3 – точка локального минимума


  dx2  x=3

Чтобы идентифицировать точку x=0, вычислим третью производную

  d3f


                =(600x3-2160x2+1980x-360)           = -360


  dx3  x=0                                                  x=0

Т.к. эта производная  не равна нулю и имеет нечетный порядок, то точка x=0 является не точкой оптимума, а точкой перегиба.

 

Определение глобального максимума  или минимума функции одной переменной.

Пусть требуется  максимизировать f(x) при ограничениях a<=x<=b, где a и b – установленные границы измерений переменной x.

(Очевидно  в этом случае проверку наличия  локального оптимума необходимо  проводить не только в стационарных  точках, но и в граничных точках  интервала)

Алгоритм  следующий:

Шаг 1: приравнять df/dx=0 и найти все стационарные точки.

Шаг 2: выбрать все стационарные точки, которые расположены а интервале [a,b]. Обозначим эти точки через x1,x2,…,xn. Проверку наличия локального оптимума следует проводить только на множестве указанных точек, дополненном точками a и b.

Шаг 3:найти наибольшее значение f(x) из множества f(a),f(b),f(x1),…,f(xn). Это значение соответствует глобальному максимуму.

Примечание:при построении этого алгоритма нет необходимости классифицировать стационарные точки как точки локального минимума, точки локального максимума или точки перегиба(и нет необходимости вычислять производные высших порядков)

Д,ля определения  глобального оптимума легче вычислить  соответствующие значения функции  и выбрать из них максимальное.

Пример:

Максимизировать

f(x)= -x3 +3x2 +9x +10=0 на интервале –2<=x<=4

Решение:

Имеем

df/dx= -3x2 +6x +9=0

             3(x-3)(x+1)=0

Решая это уравнение, получаем две  стационарные точки:

x=3, x= -1

Они расположены внутри заданного  интервала.

Для того чтобы найти глобальный максимум, вычислим значения f(x) в точках           x=3, -1, -2 и 4.

f(3)=37; f(-1)=5;f(-2)=12;f(4)=30.

Ответ: точка x=3 соответствует максимальному значению f на интервале   [-2,4].

 

Выпуклые и вогнутые функции.

(Это важный класс унимодальных  функций)

Введем обозначение: x=(x1,x2,…,xn)-n-мерный вектор.

Определение:

Функция n мерных f(x), определенная на выпуклом множестве D, называется выпуклой функцией тогда и только тогда, когда для любых двух точек x(1) и x(2) принадлежащих D, и любого числа L (0<=L<=1) выполняется неравенство:

f(Lx(1) +(1-L)x(2))<=Lf(x(1))+(1-L)f(x(2)).

Проиллюстрируем определение выпуклой функции для  случая одной переменной:

 

 

        f(x)


 

                                               Lf(x1)+(1-L)f(x2                 f(x2)


                                               


                      f(x1)

 


                                                                                                   выпуклая

                                                                                                    функция

 


                               x1                Lx1+(1-L)x2                 x2         x

 

 

Свойства  выпуклых функций:

1.Хорда, соединяющая две любые  точки кривой графика выпуклой  функции, всегда проходит над  (или выше) кривой в интервале  между двумя этими точками.

2.Выпуклая функция лежит над  своими касательными

3.Тангенс угла наклона касательной,  или первая производная f(x), возрастает или по крайней мере не убывает при увеличении x.

4.Вторая производная f(x) всегда не отрицательна на рассматриваемом интервале.

5.Для выпуклой функции локальный  минимум всегда является глобальным  минимумом.

Градиент функции f(x1,x2,…,xn) определяется как вектор

 

           f(x1,…,xn)=(df/dx1,df/dx2,…,df/dxn)T.


 

Матрица Гессе(гессиан) для функции f(x1,…,xn) есть симметрическая матрица порядка n*n:

Hf(x1,…,xn)=[d2f/dxidxj]=     2f.


 

Проверка функции на выпуклость.

Функция f(x1,…,xn) выпуклая, если ее матрица Гессе положительно определена или положительно полуопределена для всех значений x1,x2,…,xn .

Для функции  одной переменной: функция f(x) выпуклая, если ее вторая производная неотрицательна для всех значений x:

d2f/dx2=>0, для всех x.

Если матрица  Гессе Hf – положительно определенная матрица, то f называется строго выпуклой функцией и обладает единственной точкой минимума.

 

Проверка матриц на положительную  определенность.

1)Все диагональные  элементы должны быть положительными.

2)Все ведущие  главные определители должны  быть положительными.

Пример:

                    1 2 3

Матрица     4 5 6

                    7 8 9

Ведущие главные определители:


                       1 2 3


1,      1 2  ,      4 5 6


         4 5         7 8 9     .

Проверка матриц на положительную  полуопределенность:

1)Все диагональные элементы  неотрицательны.

2)Все главные определители неотрицательны.

Главные определители:

                                       1 2 3


1,5,9,   1 2 ,  1 3 ,  5 6 ,  4 5 6 


            4 5    7 9    8 9    7 8 9

Замечание:

Чтобы установить, что данная матрица  является отрицательно определенной (полуотрицательно определенной), следует умножить ее на  -1 и проверить полученную матрицу  на положительную определенность (полуположительную  определенность).

 

Вогнутая функция.

Функция f(x1,…,xn) является вогнутой функцией на множестве D тогда и только тогда, когда –f(x) есть выпуклая функция на D.

 

Проверка функции на вогнутость.

Функция f(x1,…,xn) вогнутая, если ее матрица Гессе отрицательно определена, или отрицательно полуопределена для всех значений x1,…,xn.

Пример:

Исследовать функцию на выпуклость.

f(x1,x2,x3)=3x12 +2x22 +x32 –2x1x2 –2x1x3 +2x2x3 –6x1 –4x2 –2x3

                                    6x1 –2x2 –2x3 –6


            f(x1,x2,x3)=      4x2 –2x1 +2x3 –4


                                    2x3 –2x1 =2x2 –2

                            6  -2   -2


Hf (x1,x2,x3)=   -2    4    2


                          -2    2    2

Исследуем Hf.

  1. Hf –симметрическая матрица.
  2. Все диагональные элементы Hf положительны.
  3. Ведущие главные определители Н равны:

                                                    6   –2  –2 


        6 >0      6   –2   =20>0        –2   4    2     =16>0


                    –2   4                       –2   2    2 


                                                                     (см. кн.2,с.302)

Следовательно, Hf – положительно определенная матрица.

Отсюда следует, что f-выпуклая функция.

Более того, f строго выпуклая функция и обладает единственной точкой минимума.


Пример:

                 1 2 3               5 6         2 3        2 3


        A=    4 5 6 ;  A =1  8 9   -4   8 9   +7 5 6


                 7 8 9


 Anxn, то |A|= n     i=1  ai1(-1)i+1|Mi1|


Mi1-подматрица матрицы A, полученная путем исключения строки i и столбца1.

Исследовать свойства функции:

f(x)=(2x+1)2(x-4)

Вычисляем:

f |=2(2x+1)2(x-4)+(2x+1)2=(2x+1)(6x-15)

f ||=2(6x-15)+6(2x+1)=24(x-1)

При x<=1 имеем f ||<=0, следовательно, функция является вогнутой в заданной области.

Если x=>1, то f || =>0, т.е. функция является выпуклой в этой области.

Найдем  стационарные точки из уравнения

f|(x)=(2x+1)(6x-15)=0

x=-1/2 и x=5/2 – стационарные точки.

 

Вычислим

f||(-1/2)=24(-1/2-1)<0,  следовательно функция обладает локальным максимумом при x=-1/2.

Вычислим

f||(5/2)=24(5/2-1)>0, следовательно функция достигает в точке x=5/2 локального минимума.

Если  ограничить допустимую область неравенством x<=1, то f(x) имеет глобальный максимум при x=-1/2, т.к. f(x)-вогнутая функция(в данной области) и x=-1/2 – точка локального максимума.

Аналогично, если ограничить допустимую область  неравенством x=>1, то f(x) достигает глобального минимума при x=5/2.

Однако, если переменная x изменяется на всей действительной оси от –00 до +00, то функция f(x) не имеет конечного глобального максимума или минимума.

Примерный вид функции:



 

                                   max


                             -1   -1/2   0            1        2    5/2    3                              x

 

 

 

 

 

 

                                                                             min

Пример. (Задача управления запасами).

Многие  фирмы создают запасы производимых товаров для удовлетворения будущего спроса.

Информация о работе Методы оптимизации