Разработка ПС (поисковой системы)

Автор работы: Пользователь скрыл имя, 18 Января 2015 в 22:59, курсовая работа

Описание работы

На данный момент существует российская поисковая система под названием Яндекс, но в ближайшее время они собираются выпустить новый формат выдачи под названием острова, что может привести к серьёзным последствиям. Многие специалисты считают, что это приведёт к снижению трафика данной поисковой системы, люди будут искать альтернативу.
Цель курсовой работы – разработать поисковую систему предназначенную для РФ.

Содержание работы

Введение:
1. Изучение предметной области.
2. Разработка модели системы.
3. Разработка системы на структурно-параметрическом и функциональном уровне.
4. Выбор критериев, анализ системы и механизма его применения.
5. Оптимизация и усовершенствование алгоритма.
Заключение.

Файлы: 1 файл

курсовик.docx

— 102.97 Кб (Скачать файл)

 

Оглавление

 

 

    Введение:

 

1. Изучение предметной области.

2. Разработка модели системы.

3. Разработка системы на структурно-параметрическом и функциональном уровне.

4. Выбор критериев, анализ системы и механизма его применения.

5. Оптимизация и усовершенствование алгоритма.

 

     Заключение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение.

 

   Постоянно увеличивается объём сайтов в глобальной сети под названием интернет. Существует несколько крупнейших поисковых систем, но их алгоритмы не совершенны и выдача не всегда релевантна запросу.

   Актуальность проекта – На данный момент существует российская поисковая система под названием Яндекс, но в ближайшее время  они собираются выпустить новый формат выдачи под названием острова, что может привести к серьёзным последствиям. Многие специалисты считают, что это приведёт к снижению трафика данной поисковой системы, люди будут искать альтернативу.

   Цель курсовой работы – разработать поисковую систему предназначенную для РФ.

   Объектом данного проекта является поисковая выдача сайтов.

   Предметом является поисковая система.

   Гипотеза – при создании поисковой системы учесть особенности русского языка, геозависимость и опыт зарубежных коллег (Гугл) и уже существующих наших аналогов ( Рамблер, Яндекс) 

  Практическая значимость – При создание хорошего, уникального поискового алгоритма, данная поисковая система будет востребована.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Изучение предметной области

 

В России существуют несколько  поисковых систем:

  1. Яндекс
  2. Гугл
  3. Майл
  4. Рамблер

 

Рассмотрим процент трафика каждой поисковой системы на территории РФ:

 

 

 

Из этих данных можно сделать вывод, что лидерами являются Яндекс и Гугл.

 

Яндекс – вводит новый алгоритм и с прогнозировать, что будет после полного запуска островов не возможно.

 

Гугл – мировая поисковая система, вследствие чего не может учитывать особенности каждой страны.

 

 

 

 

Основные особенности ранжирование

 

Яндекс – соблюдение тематики сайта и актуальности информации, с недавних пор ПФ (поведенческий фактор).

Гугл – в большей степени на авторитетность сайта и на количество вхождение ключевых слов в тексте.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Разработка модели системы.

 

 

 

Возьмём за основу базовые алгоритмы Яндекса и Гугла и смешаем их.


U

 

x1



x2       y1

 

 


 

 

x3                          


 

 

 

 

 

 

 

 

 

 

 

 

Входные параметры:

x1  – Уникальность текста 

x2 – Поведенческий фактор

x3   – Авторитетность

 

Выходные данные:

y1  – позиция сайта в выдачи

 

Управлен:

U – алгоритм поиска

 

Возможные Проблемы с алгоритмом:

– Черная оптимизация ( дорвеи, клоакинг и тд).

– Ошибка автоматического алгоритма.

 

Способ решения:

– Отслеживать резкое изменение параметров.

– При необходимости ручная проверка данных.

 

 

 

 

 

 

 

 

 

 

 

  1. Разработка системы на структурном, параметрическом и функциональном уровне.



 



 



 


 


 

 

T = 2 недели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Выбор критериев, анализ системы и механизма его применения

 

Критерием для оптимизации алгоритма берём увеличение количества входных параметров:

 

- Геозависимость ( вплоть до районов/округов)

- Поисковая история пользователя

 

 

Рассмотрим новые параметры подробней:

 

Геозависимость. Нужна при заказе пиццы, выборе автосервиса, музеев, кинотеатров, муниципалитет и тд. Весьма удобно заказывать пиццу, которая расположена недалеко от вашего дома…

 

Поисковая история пользователя. На некоторые запросы поисковая система не может дать точный ответ.

Например:

Запрос – сталкер

Что пользователь хотел увидеть в выдаче? 
- Книгу

- Игру 
- Определение, что это за профессия

Анализирую предыдущие запросы пользователя можно выявить его предпочтения.

 

1 вариант.

Предыдущие запросы – Достоевский, Евгений Онегин, Человек в футляре, Война и мир.

Следовательно скорее всего он хотел увидеть выдачу про книгу.

 

 

2 вариант.

Предыдущие запросы – CS 1.6 , GTA 5, WOW, прохождение игры Принц Персии,  купить компьютерную игру …

Следовательно скорее всего он хотел увидеть выдачу про компьютерную игру.

 

3 вариант.

Пользователь частый гость на Wiki, читает форумы диггеров и тд

Следовательно скорее всего он хотел увидеть выдачу про профессию.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Оптимизация и усовершенствование алгоритма

 

1. Проводить анализ запросов за определённый период (например 3 месяца), выводить самые популярные подсказки.

Например:

Компьютер

Подсказки – ремонт, цена, собрать, …

 

2. Мониторить вручную выдачу по самым популярным тематикам, чистить выдачу от сайтов не отвечающим требованиям алгоритма или не отвечающим удобствам пользователям (юзабилити).

   Например:

Черный шрифт на красном фоне.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение.

 

Изучив данную предметную область были выявленные недостатки существующих поисковых систем, найдены нестандартные решение для нового алгоритма, что несомненно способствует увеличению релевантности выдачи, что в свою очередь поможет привлечь большую часть аудитории пользователей.

 

 


Информация о работе Разработка ПС (поисковой системы)