Решение экономических задач в информационном обеспечении Интернет-проекта

Автор работы: Пользователь скрыл имя, 17 Марта 2013 в 11:10, дипломная работа

Описание работы

На основании результатов кластерного анализа формируются выводы, уточняется система целей проекта и формируется план – график работ по формированию задач, выявленных при анализе. В данной работе на основании анализа были получены выводы, которые будут использоваться для дальнейшего развития интернет-магазина и привлечения новых посетителей.
Результаты финансового анализа, представленные в виде больших массивов чисел, не сильно упрощают процесс принятия решений. Можно сгруппировать результаты в таком виде, чтобы процесс принятия решений стал более эффективным. Можно визуализировать данные и результаты анализа так, чтобы аналитик разом мог охватить их взглядом.

Содержание работы

Введение…………………………………………………………………….3
Глава 1……………………………………………………………………...7
Описание интернет-проекта………………………………………...7
Задачи проекта……………………………………………………..20
Глава 2. Общее представление о методах кластерного анализа............22
Введение в кластерный анализ……………………………………22
Измерение близости объектов…………………………………….26
Характеристики близости объектов………………………………28
Методы кластерного анализа……………………………………..30
Иерархические алгоритмы………………………………………...31
Примеры использования кластерного анализа…………………..36
Глава 3. Результаты кластерного анализа……………………………....42
Кластерный анализ посещаемости интернет-магазина по городам……………………………………………………………...42
Кластерный анализ реализации по интернет-магазину………….50
Кластерный анализ посещаемости интенет-магазина по возрасту посетителей………………………………………..………………..55
Кластерный анализ сезонности посещения интернет-магазина...58
Выводы…………………………………………………………………….63
Заключение………………………………………………………………..64
Приложение……………………………………………………………….67
Список литературы……………………………………………………….74

Файлы: 1 файл

Решение экономических задач в информационном обеспечении Интернет-проекта.docx

— 4.33 Мб (Скачать файл)

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Расстояние Чебышева (Chebychev distance metric) рис. 3.11:

Рис. 3.11.

 

Данный метод выделил  явные лидеры продаж: обувь, сумки, аксессуары, ремни и футболки. Остальной ассортимент  на данной дендрограмме уравнялся, так как отличия в их реализации были незначительны.

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем степенное расстояние (Power: SUM(ABS(x-y)**p)**1/r) рис.3.12:

Рис. 3.12.

 

При данном расстоянии можно  более детально рассмотреть статистику реализации. Образовалось 9 более четких кластеров. Построение групп продукции  осталась прежней. Но теперь в группе аксессуары, сумки и ремни снова  составляют один кластер. В группе одежда четко видно, что футболки это  самый большой кластер в группе одежда. Куртки теперь объединяются с  кластером шорты и шарфы.

Вывод: разные расстояния одного и того же метода позволяют определить с различной детализацией реализацию товара сайта. Каждое расстояние выбирается под свою задачу анализа.

Данные анализ продаж показывают, что обувь является лидером продаж. Данное направление хорошо развито, так как обувь всегда есть на складе и данным направление активно рекламируется. Мои партнеры активно развивают направление аксессуары, сумки, ремни и в дендрограммах хорошо видно, что данное направление лидирует. Для развития продаж в интернет-магазине стоит уделить внимание ассортименту одежда, проанализировать причины отставания продаж и составить стратегический план для увеличения продаж данного ассортимента.

3.3. Кластерный анализ посещаемости интенет-магазина по возрасту посетителей

Важно определить возрастную категорию посетителей сайта  для выбора ассортимента товара. Для этого была собрана статистика посещаемости сайта по возрасту посетителей рис.3.13:

 

Рис. 3.13.

 

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Евклидово расстояние (Euclidean distances) рис. 3.14:

 

Рис. 3.14.

 

Образовалось 7 кластеров. Кластерное дерево разбилось на 2 части: 1-ая часть посетители от 18–27 лет; 2-ая часть посетители от 27–45 лет. Можно выделить, что самый большой кластер образуют посетители от 21–24 лет. За ним идет кластер посетителей от 18–21 лет. И третье место по посещаемости занимает кластер до 18 и от 24–27 лет. Посетители от 27–45 лет заходят гораздо реже на сайт.

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Расстояние Чебышева (Chebychev distance metric) рис. 3.15:

Рис. 3.15.

 

Образовалось 7 кластеров. На дендрограмме можно увидеть, что самый большой кластер – это посетители от 18–24 лет. За ним идет кластер посетителей до 18 лет и от 24–27 лет. Самый маленький кластер – это посетители от 35–45 лет.

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Манхэттенское расстояние (расстояние городских кварталов, City-block (Manhattan) distance) рис. 3.16:

Рис. 3.16.

 

Образовалось 7 кластеров. При  сравнении с другими рассмотренными методами можно увидеть, что кластеры распределились таким же образом.

Вывод: Эти статистические данные показали нам, что в интернет-магазин  больше заходят покупатели от 18–27 лет и при выборе ассортимента нужно больше ориентироваться на молодежную продукцию. Необходимо отслеживать тенденции в моде, что бы интернет-магазин пользовался популярностью. Возможно, стоит продумать стратегию для привлечения покупателей других возрастных категорий.

3.4. Кластерный  анализ сезонности посещения интернет-магазина

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Евклидово расстояние (Euclidean distances) рис. 3.17:

 

Рис. 3.17.

 

Образовалось 5 кластеров. На дендрограмме видно, что самый большой кластер – это посетители мужского пола в марте 2011г. Второй по величине кластер – это посетители женского пола в марте 2011г. За ними идут кластеры посетителей мужского пола в апреле и мая 2011г. На дендрограмме видно,  что кластеры посетителей мужского пола гораздо больше кластеров посетителей женского пола.

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Расстояние Чебышева (Chebychev distance metric) рис.3.18:

Рис. 3.18.

 

Образовалось 5 кластеров. Как видно из дендрограммы при изменении расстояния структура не поменялась.

Рассмотрим результаты кластеризации  по методу одиночной связи (Single Linkage) и выберем Манхэттенское расстояние (расстояние городских кварталов, City-block (Manhattan) distance) рис.3.19:

Рис. 3.19.

 

Образовалось 5 кластеров. При сравнении с другими рассмотренными методами можно увидеть, что кластеры распределились таким же образом.

Используя статистические данные рис. 3.13. построим дендрограмму по методу одиночной связи (Single Linkage) и выберем Евклидово расстояние (Euclidean distances) рис.3.20:             

Рис. 3.20.

 

На данной дендрограмме четко просматривается сезонность посещения интернет-магазина. Можно сделать вывод, что посещаемость увеличивается в начале сезона. Во время самого сезона  активность посещения уменьшается.

Вывод: Мужское население  более активно приобретает вещи в интернет-магазине. И начало сезона характеризуется увеличением активности посетителей на сайте.

 

 

 

 

 

Выводы

Используя кластерный анализ, руководство интернет-магазина сделало выводы, которые будут использоваться для дальнейшего развития и увеличения продаж.

Вывод 1: В связи с тем, что основной процент продаж осуществляется в городах Москва и Санкт-Петербург, то нужно больше внимания уделять данным городам. Но нельзя забывать о прочих региональных центрах. Свой представитель в данных городах увеличат объем продаж.

Вывод 2: Анализ продаж показывает, что обувь является лидером продаж. Данное направление хорошо развито, так как обувь всегда есть на складе и данным направление активно рекламируется. Мои партнеры активно развивают направление аксессуары, сумки, ремни. На сайте интернет-магазина детально описан выше указанный ассортимент. Ассортимент одежда без подробного описания и возможно это одна из причин низких продаж. Для развития продаж в интернет-магазине стоит уделить внимание ассортименту одежда, проанализировать причины отставания продаж и составить стратегический план для увеличения продаж данного ассортимента.

Вывод 3: Статистические данные показали нам, что в интернет-магазин больше заходят покупатели от 18–27 лет и при выборе ассортимента нужно больше ориентироваться на молодежную продукцию. Необходимо отслеживать тенденции в моде, что бы интернет-магазин пользовался популярностью. Возможно, стоит продумать стратегию для привлечения покупателей других возрастных категорий.

Вывод 4: Мужское население более активно приобретает вещи в интернет-магазине. И начало сезона характеризуется увеличением активности посетителей на сайте. Поэтому наполняемость новым товаром стоит осуществлять перед началом сезона.

Анализ будет проводиться  в течение этого года. Первые выводы уже сделаны и будут практически  применены в работе интернет-магазина.

Заключение

Кластерный анализ является очень  удобным средством для выделения  сегментов рынка. В особенности  в наш век высоких технологий, когда на помощь человеку приходят машины, и столь трудоемкий процесс  становиться буквально секундным  делом.

Образование сегментов зависит  от имеющихся данных, а не определяется заранее.

Переменные, которые являются основанием для кластеризации, следует выбирать, исходя из опыта предшествующих исследований, теоретических предпосылок, проверяемых  гипотез, а также по усмотрению исследователя. Кроме того, следует выбрать соответствующую  меру расстояния (сходства). Особенность  иерархической кластеризации – разработка иерархической или древовидной структуры. Иерархические методы кластеризации могут быть агломеративными или дивизивными. Агломеративные методы включают: метод одиночной связи, метод полной связи и метод средней связи. Широко распространенным дисперсионным методом является метод Барда. Неиерархические методы кластеризации часто называют методами k-средних. Эти методы включают последовательный пороговый метод, параллельный пороговый метод и оптимизирующее распределение. Иерархические и неиерархические методы можно применять совместно. Выбор метода кластеризации и выбор меры расстояния взаимосвязаны.

Решение о числе кластеров принимают  по теоретическим и практическим соображениям. В иерархической кластеризации  важным критерием принятия решения  о числе кластеров являются расстояния, при которых происходит объединение  кластеров. Относительные размеры  кластеров должны быть такими, чтобы  имело смысл сохранить данный кластер, а не объединить его с  другими. Кластеры интерпретируют с  точки зрения кластерных центроидов. Часто интерпретировать кластеры помогает их профилирование через переменные, которые не лежали в основе кластеризации. Надежность и достоверность решений кластеризации оценивают разными способами.

Кластерный анализ включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями  во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры. В общем, всякий раз, когда необходимо классифицировать "горы" информации к пригодным  для дальнейшей обработки группам, кластерный анализ оказывается весьма полезным и эффективным. Кластерный анализ необходим для классификации  информации, с его помощью можно  определенным образом структурировать  переменные и узнать, какие переменные объединяются в первую очередь, а  какие следует рассматривать  отдельно.

Большое достоинство кластерного  анализа в том, что он позволяет  производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства  математико-статистических методов  не накладывает никаких ограничений  на вид рассматриваемых объектов, и позволяет рассматривать множество  исходных данных практически произвольной природы. Это имеет большое значение, например, для прогнозирования конъюнктуры, когда показатели имеют разнообразный  вид, затрудняющий применение традиционных эконометрических подходов.

Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения: В частности, состав и количество кластеров зависит  от выбираемых критериев разбиения. При сведении исходного массива  данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов за счет замены их характеристиками обобщенных значений параметров кластера. При  проведении классификации объектов игнорируется очень часто возможность  отсутствия в рассматриваемой совокупности каких-либо значений кластеров.

Первоначально неизвестно число кластеров, на которое необходимо разбить исходную совокупность элементов, и визуальные наблюдения в многомерном случае просто не приводят к успеху.

Описанная методика позволяет оптимально решить сразу две важнейшие проблемы: разбиение множества товаров  на отдельные группы, а также выявление факторов, воздействующих  на продажу, влияющих на данные группы с последующим нахождением факторных весов. Это позволяет избежать искусственно занижающей роли некоторых позиций товара и влияние ассортимента на посещаемость  интернет-магазина.

Таким образом, компетентное проведение постоянного кластерного исследования будет способствовать диверсификации и сбалансированному развитию интернет-магазина и повышению уровня качества, доступности, заинтересованности. Но успех возможно достичь только за счет хорошей координации  действий и осознания необходимости  постоянно повышать свою конкурентоспособность. Важной задачей, которую может решить кластерный анализ, является позиционирование, то есть определение ниши, в которой следует позиционировать новый продукт, предлагаемый на рынке. В результате применения кластерного анализа строится карта, по которой можно определить уровень конкуренции в различных сегментах рынка и соответствующие характеристики товара для возможности попадания в этот сегмент. С помощью анализа такой карты возможно определение новых, незанятых ниш на рынке, в которых можно предлагать существующие товары или разрабатывать новые.

Кластерный анализ также может быть удобен для анализа клиентов интернет-магазина. Для этого все клиенты группируются в кластеры, и для каждого кластера вырабатывается индивидуальная политика. Такой подход позволяет существенно сократить объекты анализа, и, в то же время, индивидуально подойти к каждой группе клиентов.

 

 

Приложение

Кластерный анализ в программе  Statistica:

  1. Запускаем программу Statistica
  2. Открываем наш документ (рис. 4.1)

Информация о работе Решение экономических задач в информационном обеспечении Интернет-проекта