Автор работы: Пользователь скрыл имя, 18 Января 2015 в 22:59, курсовая работа
На данный момент существует российская поисковая система под названием Яндекс, но в ближайшее время они собираются выпустить новый формат выдачи под названием острова, что может привести к серьёзным последствиям. Многие специалисты считают, что это приведёт к снижению трафика данной поисковой системы, люди будут искать альтернативу.
Цель курсовой работы – разработать поисковую систему предназначенную для РФ.
Введение:
1. Изучение предметной области.
2. Разработка модели системы.
3. Разработка системы на структурно-параметрическом и функциональном уровне.
4. Выбор критериев, анализ системы и механизма его применения.
5. Оптимизация и усовершенствование алгоритма.
Заключение.
Оглавление
Введение:
1. Изучение предметной области.
2. Разработка модели системы.
3. Разработка системы на структурно-параметрическом и функциональном уровне.
4. Выбор критериев, анализ системы и механизма его применения.
5. Оптимизация и усовершенствование алгоритма.
Заключение.
Введение.
Постоянно увеличивается объём сайтов в глобальной сети под названием интернет. Существует несколько крупнейших поисковых систем, но их алгоритмы не совершенны и выдача не всегда релевантна запросу.
Актуальность проекта – На данный момент существует российская поисковая система под названием Яндекс, но в ближайшее время они собираются выпустить новый формат выдачи под названием острова, что может привести к серьёзным последствиям. Многие специалисты считают, что это приведёт к снижению трафика данной поисковой системы, люди будут искать альтернативу.
Цель курсовой работы – разработать поисковую систему предназначенную для РФ.
Объектом данного проекта является поисковая выдача сайтов.
Предметом является поисковая система.
Гипотеза – при создании поисковой системы учесть особенности русского языка, геозависимость и опыт зарубежных коллег (Гугл) и уже существующих наших аналогов ( Рамблер, Яндекс)
Практическая значимость – При создание хорошего, уникального поискового алгоритма, данная поисковая система будет востребована.
В России существуют несколько поисковых систем:
Рассмотрим процент трафика каждой поисковой системы на территории РФ:
Из этих данных можно сделать вывод, что лидерами являются Яндекс и Гугл.
Яндекс – вводит новый алгоритм и с прогнозировать, что будет после полного запуска островов не возможно.
Гугл – мировая поисковая система, вследствие чего не может учитывать особенности каждой страны.
Основные особенности ранжирование
Яндекс – соблюдение тематики сайта и актуальности информации, с недавних пор ПФ (поведенческий фактор).
Гугл – в большей степени на авторитетность сайта и на количество вхождение ключевых слов в тексте.
Возьмём за основу базовые алгоритмы Яндекса и Гугла и смешаем их.
U
x1
x2 y1
x3
Входные параметры:
x1 – Уникальность текста
x2 – Поведенческий фактор
x3 – Авторитетность
Выходные данные:
y1 – позиция сайта в выдачи
Управлен:
U – алгоритм поиска
Возможные Проблемы с алгоритмом:
– Черная оптимизация ( дорвеи, клоакинг и тд).
– Ошибка автоматического алгоритма.
Способ решения:
– Отслеживать резкое изменение параметров.
– При необходимости ручная проверка данных.
T = 2 недели
Критерием для оптимизации алгоритма берём увеличение количества входных параметров:
- Геозависимость ( вплоть до районов/округов)
- Поисковая история пользователя
Рассмотрим новые параметры подробней:
Геозависимость. Нужна при заказе пиццы, выборе автосервиса, музеев, кинотеатров, муниципалитет и тд. Весьма удобно заказывать пиццу, которая расположена недалеко от вашего дома…
Поисковая история пользователя. На некоторые запросы поисковая система не может дать точный ответ.
Например:
Запрос – сталкер
Что пользователь хотел увидеть
в выдаче?
- Книгу
- Игру
- Определение, что это за профессия
Анализирую предыдущие запросы пользователя можно выявить его предпочтения.
1 вариант.
Предыдущие запросы – Достоевский, Евгений Онегин, Человек в футляре, Война и мир.
Следовательно скорее всего он хотел увидеть выдачу про книгу.
2 вариант.
Предыдущие запросы – CS 1.6 , GTA 5, WOW, прохождение игры Принц Персии, купить компьютерную игру …
Следовательно скорее всего он хотел увидеть выдачу про компьютерную игру.
3 вариант.
Пользователь частый гость на Wiki, читает форумы диггеров и тд
Следовательно скорее всего он хотел увидеть выдачу про профессию.
1. Проводить анализ запросов за определённый период (например 3 месяца), выводить самые популярные подсказки.
Например:
Компьютер
Подсказки – ремонт, цена, собрать, …
2. Мониторить вручную выдачу по самым популярным тематикам, чистить выдачу от сайтов не отвечающим требованиям алгоритма или не отвечающим удобствам пользователям (юзабилити).
Например:
Черный шрифт на красном фоне.
Заключение.
Изучив данную предметную область были выявленные недостатки существующих поисковых систем, найдены нестандартные решение для нового алгоритма, что несомненно способствует увеличению релевантности выдачи, что в свою очередь поможет привлечь большую часть аудитории пользователей.