Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа
Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.
ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А
СОДЕРЖАНИЕ
HTML – это более простой язык программирования, понятный любому пользователю Сети. Он позволяет ему создавать сложные документы простым и быстрым способом. Это одна из отличительных особенностей гипертекста. Гипертекст лучше других подходит для включения графики, звуков и других элементов мультимедиа в документы.
Благодаря развитию гипертекста, большинство пользователей имеет возможность создавать собственные WEB–страницы или сайты.
В курсовой работе
требуется реализовать web–
Целью данной курсовой работы является реализация web–приложения на языке HTML. Для этого должны быть выполнены следующие задачи:
– изучение основ теории классификации;
– освоение основных приемов работы в среде системы Statistica;
– изучение принципов работы языка HTML;
– организация и реализация web–пособия.
В первом разделе представлена информация о прикладной статистике и пакете Statistica. Во втором разделе описана информация о структуре языка HTML, а также приведена практическая реализация web–пособия. В третьем разделе разработан пользовательский интерфейс.
Прикладная статистика – наука о методах обработки статистических данных. Методы прикладной статистики активно применяются в технических исследованиях, экономике менеджменте, социологии, медицине, геологии, истории и т. д. С результатами наблюдений, измерений, испытаний, опытов, с их анализом имеют дело специалисты во многих областях теоретической и практической деятельности.
В СССР термин «прикладная статистика» вошёл в широкое употребление в 1981 г. после выхода массовым тиражом сборника «Современные проблемы кибернетики (прикладная статистика)». В этом сборнике обосновывалась трёхкомпонентная структура прикладной статистики. Во–первых, в неё входят ориентированные на прикладную деятельность статистические методы анализа данных. Однако прикладную статистику нельзя целиком относить к математике. Она включает в себя две внематематические области: методологию организации статистического исследования и организацию компьютерной обработки данных, в том числе разработку и использование баз данных и электронных таблиц, статистических программных продуктов, например, диалоговых систем анализа данных. В СССР термин «прикладная статистика» использовался и ранее 1981 г., но лишь внутри сравнительно небольших и замкнутых групп специалистов [1].
Прикладная статистика – методическая дисциплина, являющаяся центром статистики. При применении методов прикладной статистики к конкретным областям знаний и отраслям народного хозяйства получаются научно–практические дисциплины типа «статистика в промышленности», «статистика в медицине», «статистика в психологии» и др. С этой точки зрения эконометрика – это «статистические методы в экономике» [2]. Математическая статистика играет роль математического фундамента для прикладной статистики.
К настоящему времени очевидно чётко выраженное размежевание этих двух научных направлений. Математическая статистика исходит из сформулированных в 1930–50 гг. постановок математических задач, происхождение которых связано с анализом статистических данных. Начиная с 70–х годов ХХ в. исследования по математической статистике посвящены обобщению и дальнейшему математическому изучению этих задач.
Прикладная статистика нацелена на решение реальных задач. Поэтому в ней возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими методами, то есть путём доказательства теорем. Большую роль играет методологическая составляющая – как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.
Хотя статистические данные собираются и анализируются с незапамятных времён, современная математическая статистика как наука была создана, по общему мнению специалистов, сравнительно недавно – в первой половине ХХ в. Именно тогда были разработаны основные идеи и получены результаты, излагаемые ныне в учебных курсах математической статистики. После чего специалисты по математической статистике занялись внутриматематическими проблемами, а для теоретического обслуживания проблем практического анализа статистических данных стала формироваться новая дисциплина – прикладная статистика. В настоящее время статистическая обработка данных проводится, как правило, с помощью соответствующих программных продуктов.
По типу решаемых задач прикладная статистика делится на разделы:
– описание данных;
– оценивание;
– проверка гипотез.
По виду анализируемых статистических данных прикладная статистика делится на четыре области:
– статистика (числовых) случайных величин;
– многомерный статистический анализ;
– статистика временных рядов и случайных процессов;
– статистика объектов нечисловой природы.
Statistica – пакет для всестороннего статистического анализа, разработанный компанией StatSoft [3]. В пакете STATISTICA реализованы процедуры для анализа данных(data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization).
Существуют различные варианты пакета в зависимости от целей и задач пользователя:
– однопользовательская версия (Single–User);
– сетевая версия (Concurrent Network) – для использования в локальных вычислительных сетях;
– Enterprise версия – для использования в вычислительных системах и крупных организациях;
– Web–Based – для использования в крупных сетях через web–браузер.
Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных, например, для проведения социологических или биомедицинских исследований, решения технических и, что очень важно, промышленных задач (карты контроля качества, анализ процессов и планирование эксперимента):
– Base – включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа;
– Advanced Linear/Non–Linear Models – предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.;
– Multivariate Exploratory Techniques – многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов;
– QC – Контроль качества – предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества, непревзойденной гибкости и разнообразия;
– Neural Networks – (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык;
– Data Miner – интеллектуальный анализ данных.
Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах координат, специализированные статистические графики – гистограммы, матричные, категорированные графики и др.) [3].
В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика.
HTML (от англ. HyperText Markup Language – «язык разметки гипертекста») – стандартный язык разметки документов во Всемирной паутине. Большинство веб–страниц создаются при помощи языка HTML. Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме. HTML является приложением («частным случаем») SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879 [4].
Язык HTML был разработан британским учёным Тимом Бернерсом–Ли приблизительно в 1991–1992 годах в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантических элементов – дескрипторов. Дескрипторы также часто называют «тегами». С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста. Мультимедийные возможности были добавлены позже. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на оборудовании с различной технической оснащённостью (цветной экран современного компьютера, монохромный экран органайзера, ограниченный по размерам экран мобильного телефона или устройства и программы голосового воспроизведения текстов). Однако современное применение HTML очень далеко от его изначальной задачи. С течением времени, основная идея языка HTML заключается в потребности в мультимедийном и графическом оформлении.
Текстовые документы, содержащие код на языке HTML (такие документы традиционно имеют расширение .html или .htm), обрабатываются специальными приложениями, которые отображают документ в его форматированном виде. Такие приложения, называемые «браузерами» или «интернет–обозревателями», обычно предоставляют пользователю удобный интерфейс для запроса веб–страниц, их просмотра (и вывода на иные внешние устройства) и, при необходимости, отправки введённых пользователем данных на сервер. Наиболее популярными на сегодняшний день браузерами являются Internet Explorer, Mozilla Firefox, Safari, Google Chrome и Opera.
HTML – это теговый язык разметки документов. Любой документ на языке HTML представляет собой набор элементов, причём начало и конец каждого элемента обозначается специальными пометками – тегами. Элементы могут быть пустыми, то есть не содержащими никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие–либо их свойства (например, размер шрифта для элемента font). Атрибуты указываются в открывающем теге. Кроме элементов, в HTML–документах есть и сущности (англ. entities) – «специальные символы». Сущности начинаются с символа амперсанда и имеют вид &имя; или &#NNNN;, где NNNN – код символа в Юникоде в десятеричной системе счисления [5].
Рассмотрим процесс создания web–приложения, поддерживающего процесс изучения спецкурса «Введение в статистический анализ на основе системы Statistica». Разработаем главную страницу, которая будет появляться при открытии файла.
Для начала нужно открыть новый HTML–документ в текстовом редакторе. Далее указать стандартный HTML–заголовок, то есть:
<html><head><title>Введение в статистический анализ на основе системы Statistica</title></head>
Далее необходимо главную страницу разбить на фреймы вида "заголовок–содержание–данные". На рис. 2.2.1. показан внешний вид разбитой на фреймы страницы.
Заголовок | |
Содержание |
Данные |
Рис. 2.2.1 – Структура документа "заголовок – содержание – данные".
В самом верхнем фрейме отображаются основные рубрики, которым соответствует содержимое данного узла, в левом – эти же рубрики в развернутом виде, и в самом большом фрейме – содержимое страниц. Для этого пропишем следующий HTML–код:
<frameset rows="15%,85%" bordercolor="0000FF">
<frame src="frame/logo.html" name="logo" scrolling="auto">
<frameset cols="25%,75%" bordercolor="0000FF">
<frame src="frame/menu.html" name="menu" scrolling="auto">
<frame src="frame/content.html" name="content" scrolling="auto">
</frameset>
</frameset>
Во фрейме «Заголовок» будут отображаться название web–пособия и 2 ссылки: «Учебное пособие» и «Лабораторные работы»:
<center><h1>Введение
в статистический анализ на
основе системы Statistica</h1>
<table align="center">
<tr text="000000">
<td align="center">
<a href="menu1.html" target="menu"><b>Учебное пособие</b></a>
<a href="menu2.html" target="menu"><b>Лабораторные работы</b></a>
</td>
</tr>
</table>
Таким образом, с помощью данного HTML–скрипта была реализована главная страница web–приложения.
Рассмотрим процесс создания страницы, в которую будет помещена информация учебного пособия.
В левом фрейме будет отображаться содержание пособия, которое содержит три раздела: введение, первичный анализ в системе Statistica – модуль Basic Statistics/Tables (Основные статистики/Таблицы) и регрессионный анализ в системе Statistica – модуль Multiple Regression (Множественная регрессия). Каждый раздел содержит подразделы. Ниже показан HTML–код одного из разделов: