Автор работы: Пользователь скрыл имя, 03 Мая 2012 в 21:46, реферат
Исходя из вышесказанного, целью данной работы является изучение основ тестологии, выявление и определение основных понятий и принципов этой науки. Для достижения данной цели необходимо решить следующие задачи:
1. Изучить историю развития науки тестологии;
2. Рассмотреть основы конструирования тестов;
3. Проследить этапы разработки теста;
4. Разобрать основные критерии оценки эффективности тестов
Введе-ние...............................................................................................................3
1. Тестология как нау-ка......................................................................................4
1.1. Зарождение и развитие тестологии............................................................4
1.2. Тестология в России....................................................................................6
2. Теоретические и методические основы тестологии....................................9
2.1. Разработка тестов.........................................................................................9
2.2. Критерии оценки эффективности теста...................................................12
Заключе-ние.........................................................................................................16
Список использованной литерату-ры...............................................................17
Необходимо заметить, что данным критерием часто пренебрегают составители современных тестов. Это приносит большие неудобства и испытуемым, которым приходится отвечать на лишние вопросы, и психологам, которые вынуждены обрабатывать лишнюю информацию.
3. Вариация и дисперсия.
Вариация — буквально, степень разнообразия данных, полученных при выполнении задания. Она отражает дифференцирующую способность. Если дифференцирующая способность высокая, мы говорим о вариативных данных, и наоборот. При невариативных данных задание удаляют из теста. Определяется вариация путем вычисления дисперсии. Дисперсия вычисляет сумму квадратных отклонений значений баллов от среднего арифметического балла. Проще говоря, рассчитывается среднее арифметическое по выборке, и все полученные значения баллов начинают с ним сравниваться. Таким образом, мы получаем информацию о вариации тестового задания. Общепринятой мерой вариации тестовых баллов задания является стандартное отклонение, которое определяется путем вычисления квадратного корня из дисперсии.
Иногда вариацией называют наблюдаемую переменную величину. Дело в том, что то свойство, на измерение которого направлен тест, принимается за латентную (ненаблюдаемую) переменную. А с помощью теста определяется наблюдаемая переменная, которая выявляет лишь приближенные значения ненаблюдаемых истинных баллов испытуемого.
Первичный анализ результатов тестирования.
Итак, тест стандартизован, апробирован, одобрен экспертной комиссией. Теперь с помощью него можно получать необходимую информацию о психологическом свойстве или способности человека. Для этого после проведения тестирования проводят первичный анализ результатов. Обычно о нем говорят в случае группового тестирования.
Полученные данные сначала необходимо свести к среднему значению. Оно более наглядно показывает групповой результат. Однако среднее значение мало информативно в отношении характеристики распределения значений баллов, частоты встречаемости каждого значения. Мода (Мо) — показатель наиболее часто встречающегося значения балла. Мод может быть несколько — наибольшее количество раз могли встретиться несколько значений. Далее выборку делят пополам, а значения баллов пограничного испытуемого принимаются за медиану (Ме) [14].
График результатов теста обычно принимает форму колокола («колокол Гаусса»), отвечая закону о нормальном распределении, где крайние значения показывают редко встречающиеся баллы, а при приближении к середине кривой частота встречаемости баллов увеличивается. Моды, медиана и среднее арифметическое значение также откладываются на графике. В некоторых случаях они могут совпадать — тогда распределение данных называют симметричным. Чем больше расстояние между модой, медианой и средним значением, тем больше результаты теста отклоняются от нормального распределения [14].
2.2. Критерии оценки эффективности теста
Ошибки, влекущие за собой снижение эффективности теста, появляются, если:
- Тест неправильно составлен;
- Тест неправильно стандартизован;
- Тест неправильно использован.
Конструрирование теста.
Прежде, чем начинать конструировать тест необходимо четко представлять себе то психологическое свойство, которое он будет измерять. Ни один тест не создается «с нуля», обычно за его созданием стоит длительная научная работа по изучению тематического материала. Перед конструктором психологического теста стоит сложная задача — наиболее полно отразить все стороны измеряемого психологического свойства через минимальное количество заданий. Последнее условие — один из критериев эффективности теста.
Кроме этих требований, тест должен соответствовать целевой группе, на которую он направлен. Разрабатываются задания соответствующей сложности и доступности для разных возрастных групп, для людей с различными психическими нарушениями, для представителей разных национальных и языковых групп. Если тест предлагается к проведению в другой языковой группе или стране, его необходимо адаптировать.
Также необходимо учитывать и некоторые эффекты, наблюдаемые при заполнении людьми тестовых заданий. Так называемый эффект социальной желательности срабатывает тогда, когда человек в своих ответах хочет представить себя в лучшем свете. Многие тесты вооружены до зубов «шкалами лжи», вопросами-ловушками и пр. Но и это не всегда помогает — человек находит одинаковые вопросы, держит в памяти свои ответы.
Есть еще один прием — подмена цели теста в инструкции, если эта цель вообще открывается испытуемому. Тогда человек, отвечая на вопросы, показывает себя хорошо с одной стороны (ложная цель) и дает более или менее достоверные сведения о другой стороне (истинная цель), которая на самом деле измеряется данным тестом.
Существуют и требования к формулировке вопросов, к порядку их расстановки в тесте. Они опять же зависят от целевой группы, на которую тест рассчитан.
Правильно составленный тест еще нельзя назвать разработанным. Для этого он должен быть стандартизован.
Стандартизация.
Стандартизация теста обеспечивает возможность сравнения полученных с его помощью данных от разных людей. Для этого необходимо, чтобы все эти люди находились в равных условиях. На психологическом языке это называется «контроль всех зависимых переменных». В идеале единственной независимой переменной в тесте будет личность испытуемого. Для обеспечения равных условий разработчик теста дает специальные указания по его проведению. Они включают:
- Специфику стимульного материала;
- Временные ограничения (time limits);
- Инструкцию испытуемым;
- Пробные образцы заданий;
- Допустимые ответы на вопросы (если таковые ограничения необходимы).
Кроме этих указаний, в приложение к тесту включаются специально установленные нормы ответов (в «сырых баллах») и их интерпретации.
Помимо стандартизации тест должен быть проверен на предмет своей эффективности по критериям надежности и валидности. Очень часто эти понятия делают взаимозаменяемыми, поэтому рассмотрим, какое значение имеет каждое из них [15].
Надежность.
Под надежностью понимают согласованность результатов, полученных при каждом повторном выполнении теста одним и тем же испытуемым, с результатами его первого тестирования. Абсолютной тестовой надежности не существует, погрешности допускаются, однако чем они выше, тем ниже тестовая эффективность. Надежность можно проверить следующими методами:
- тест-ретестовая надежность подразумевает многократное выполнение одного теста и корреляционное сравнение полученных результатов;
- разделенная надежность определяется при делении теста на две части и сравнение результатов выполнения двух частей по отдельности;
- эквивалентная надежность выявляется путем предъявления испытуемому теста и его альтернативного варианта. Полученные результаты также сравниваются между собой [15].
Валидность.
Психологические словари раскрывают понятие валидности как степени соответствия теста своему назначению измерять то, для чего он создан; действительной способности теста измерять ту психологическую характеристику, для диагностики которой он заявлен. Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с успешностью выполнения соответствующей деятельности.
Оценка валидности теста включает следующие этапы:
- определение очевидной валидности (face validity). Такую валидность видно, что говорится, «невооруженным глазом» — оценивается общее соответствие теста его назначению.
- определение концептуальной валидности (construct validity). Степень соответствия теста, измеряющего какое-либо свойство, общепринятым теоретическим представлениям об этом свойстве. Как правило, эта валидность оценивается экспертами.
- определение эмпирической валидности (empirical validity). Выбирается критерий (независимая переменная), с которой связываются результаты теста. К примеру, критерием для теста готовности к школе может стать общая оценка успеваемости первоклассника.
- определение содержательной валидности (content validity). Разработанный тест должен включать вопросы для оценки максимально возможного числа параметров того свойства, которое этот тест измеряет (выше упоминалось первое правило составления теста — максимальное количество параметров свойства через минимальное количество заданий). Эта валидность также оценивается с помощью экспертных оценок [15].
Вышеприведенные методы оценки эффективности теста помогают психологу не только самому конструировать инструменты для измерения определенных свойств личности, но и выбирать из уже разработанных тестов наиболее качественные и надежные.
Составление теста – очень тяжелый и трудоемкий процесс. Отклонение от каких-либо требований к тесту может повлечь за собой снижение его эффективности. Для того, чтобы избежать подобных негативных последствий, составителю необходимо пройти все этапы конструирования теста и придерживаться основных принципов конструирования, в число которых входит: валидность, надежность, научная достоверность, обобщенность значимость, взвешенность, системность и т.д. Только следование основным правилам конструирования теста может привести к желаемому результату.
Заключение
Тестирование в настоящее время начинает охватывать фактически все сферы современной жизни. Мы сталкиваемся с тестами повсеместно: в образовательном процессе, при приеме на работу, при диагностике оборудования, в психологии, в социологии, встречаем их на страницах журналов и т.д.
Во многом такое распространение метод тестирования получил из-за своих положительных качеств, к которым относится: стандартизация условий и результатов, оперативность и экономичность, объективность, возможность компьютеризации. Все это позволяет наиболее быстро и эффективно получить необходимую информацию.
Таким образом, рассмотрев теоретико-методологические основы тестологии, можно сделать следующие выводы: теория и практика создания тестов в настоящее время хорошо развиты, так что можно даже говорить об особой прикладной дисциплине - тестологии. Создатели тестов опираются на методы математической статистики. В частности, каждый тест проверяется на надежность и валидность. Надежность тестов оценивается путем вычисления коэффициента корреляции для повторных измерений на одной и той же выборке. Он должен быть достаточно высок. Валидность в применении к тесту означает, что он измеряет именно то свойство, на которое направлен. Основным методом проверки валидности теста является сопоставление получаемых с его помощью результатов с каким-то внешним критерием [10;352].
Тестология, как и многие другие науки пришла к нам из-за рубежа, поэтому заслуга в развитии основ этой науки принадлежит зарубежным исследователям. Но и отечественные ученые внесли большой вклад в развитие тестологии. Кроме того, поборов пережитки советских времен, современные исследователи могут активно использовать метод тестирования на практике.
Список использованной литературы
1. Адаптивное тестирование: учеб.-метод. пособие / Н.М. Опарина Г.Н. Полина Р.М. Файзулин И.Г. Шрамкова. – Хабаровск: ДВГУПС, 2007. – 95 с.
2. Балыхина, Т.М. Словарь терминов и понятий тестологии / Т. М. Балыхина. — М.: РУДН, 2000. — 164 с.
3. Волков, Б.С. Методология и методы психологического исследования: Учебное пособие для вузов. — 4-е изд., испр. и доп. / Б.С. Волков, Н.В. Волкова, А.В. Губанов. — М.: Академический Проект, 2005. – 352 с.
4. Девятко, И.Ф. Методы социологического исследования / И.Ф. Девятко. – 4-е изд. – М.: КДУ, 2006. – 296 с.
5. Добреньков, В.И. Методы социологического исследования: Учебник / В.И. Добреньков, А.И. Кравченко. – М.: ИНФРА-М, 2006. – 768 с.
6. Кадневский, В.Н. История тестов / В.Н. Кадневский. - М.: Народное образование, 2004 - 464 c.
7. Корнилова, Т.В. Методологические основы психологии / Т.В. Корнилова, С.Д. Смирнов. – СПб.: Питер, 2008. – 320 с.
8. Крокер, Л. Введение в классическую и современную теорию тестов: учебник / Л.Крокер, Дж.Алгина; пер. с анг. Н.Н.Найденовой, В.Н.Симкина, М.Б.Челышковой; под общ.ред. В.И.Звонникова, М.Б.Челышковой. – М.: Логос, 2010. – 668 с.
9. Мальцев, А. В. Тестология в образовании: вчера, сегодня, завтра / А. В. Мальцев, О. Э. Наймушина // Известия Уральского государственного университета. – 2008. – № 60. – С. 7-14.
10. Новикова, С.С. Социологические и психологические методы исследований в социальной работе / С.С. Новикова, А.В. Соловьев. – М: Академический проект, 2006. – 496 с.
11. Ядов, В. А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности / В. А. Ядов. – 3-е изд., испр. – М.: Омега-Л, 2007. – 567 с.
12. http://vmwebmielabanew.narod.
13. http://www.litiana.ru/
14. http://www.asot.kz/index.php/
15. http://www.effecton.ru/642.
2