Валидность теста

Автор работы: Пользователь скрыл имя, 22 Февраля 2015 в 07:13, контрольная работа

Описание работы

Показатель валидности является одним из важнейших в указанных критеряих оценки результатов тестов.
Целью данной работы является рассмотрение сущности данного показателя, его типы и виды. а также особенности расчета показателя валидности теста.

Содержание работы

Введение
3
Понятие валидности теста
4
Виды валидности теста
6
Особенности определения и расчета валидности теста
10
Заключение
15
Список использованных источников

Файлы: 1 файл

кр по психодиагностике валидность теста.docx

— 45.96 Кб (Скачать файл)

СОДЕРЖАНИЕ

 

Введение

3

  1. Понятие валидности теста

4

  1. Виды валидности теста

6

  1. Особенности определения и расчета валидности теста

10

Заключение

15

Список использованных источников

16


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Общие предпосылки тестирования выражаются в критериях добротности, качества теста - стандартизированной методики психодиагностики, позволяющей получать сопоставимые количественные и качественные показатели степени развитости изучаемых свойств. Для того чтобы тесты соответствовали своему назначению, адекватно выявляли и достаточно точно измеряли определенные качества, были применимы к различным (до известных пределов) людям и группам, они должны отвечать таким критериям, как объективность, валидность, надежность, репрезентативность, адаптированность, научность.

Показатель валидности является одним из важнейших в указанных критеряих оценки результатов тестов.

Целью данной работы является рассмотрение сущности данного показателя, его типы и виды. а также особенности расчета показателя валидности теста.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. ПОНЯТИЕ ВАЛИДНОСТИ ТЕСТА

 

Объективность психодиагностики вообще и тестовых показателей в частности достигается путем неуклонного соблюдения психологом критериев достоверности психодиагностического измерения, а также путем приобретения опыта получения, использования и интерпретации полученных данных.

Достоверность психодиагностического измерения определяется валидностью (соответствием тестовых данных измеряемому свойству), надежностью (точностью психодиагностических измерений) и прогностичностью (предположением о развитии измеренного свойства) применяемых психологических методик (тестов).

Валидность (от англ. valid - действительный, пригодный, действенный) считается фундаментальным понятием экспериментальной психологии и психодиагностики, отражающим прагматическую идею обязательной практической (применительно к науке, эмпирической) проверки качества измерения психологических свойств человека.. По сути, оно обозначает соответствия методик и результатов исследования поставленным задачам.

Как в экспериментальной психологии, так и в статистике валидное измерение - такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.

В специальной литературе понятие «валидность теста» раскрывают, как действительную способность теста, то есть «стандартизированной методики психодиагностики, позволяющей получать сопоставимые количественные и качественные показатели степени развитости изучаемых свойств», измерять ту психологическую характеристику, для диагностики которой он заявлен. Это адекватность интерпретации тестовых результатов по отношению к цели тестирования, содержанию основного понятия (содержанию диагностируемого психического свойства) и применению результатов тестирования (в профотборе и других прикладных психологических обследованиях1.   

Валидность теста рассматривают также, как:

- «понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает»2 (А. Анастази, С. Урбина);

- комплексную характеристику методики (теста), включающую сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним 3 (Л. Ф. Бурлачук)

- критерий доброкачественности теста, характеризующий точность измерения исследуемого свойства (В. И. Лубовский);

- оценку адекватности теста исследуемой проблеме (В. И. Лубовский);

- «меру достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного тестам»4 (Конюхов Н.И., Шаккум М.Л.) и т.п.

В контексте прикладной задачи валидность теста представляет собой не столько критерий качества теста, сколько «показатель меры соответствия теста цели тестирования»5. Например, тест может быть валиден для измерения интеллекта и невалиден для оценки знаний. И наоборот: если тест создавался для проверки уровня знаний, то результаты по нему не могут быть интерпретированы как мера интеллектуального развития испытуемых. Результаты подобного истолкования невалидны изначально, по цели создания теста. Существенной стороной интерпретации является учет условий тестирования и применения результатов. Если тестирование протекает с нарушением правил (неодинаковое для всех время тестирования, различия в инструкциях, помощь отдельным испытуемым), то интерпретация таких нестандартных результатов не может быть названа валидной по условиям сбора данных. Содержание заданий теста должно соотноситься с содержанием основного понятия (концепции), отражающей измеряемое качество. Это гносеологический аспект валидности теста, отражающий меру связи теоретического понятия с операциональным понятием и качеством подбора эмпирических индикаторов.

Тестовые результаты могут быть валидны для отбора по одной профессии и невалидны для отбора на другую профессию. Это особенно характерно для сконструированных целенаправленно-прагматических тестов по критерию. Мерой валидности обычно выступает коэффициент корреляции результатов по тесту с результатами по профессиональному критерию. При этом встречаются немало корреляций, опосредованных другими, иногда неизвестными факторами. Отсюда берет начало широко исследованная на Западе проблема дифференциации различных тестов по их валидности для отбора на различные профессии.

Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на валидность. В результате оказывается, что они бесполезны или даже вредны. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности. Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.

Проверка валидности теста называется валидацией (валидизацией).

Отношение между тестовыми оценками и различными критериями валидности определяется и анализируется несколькими путями. Наиболее простая процедура оценки валидности конкретного теста по его связи с исходными данными результатов испытаний – составление таблицы ожиданий. Наличие информации об общем распределении оценок измерений позволяет с определенной степенью точности рассчитать вероятность получения оценки конкретного тестового испытания.

 

  1. ВИДЫ ВАЛИДНОСТИ ТЕСТА

 

Для определения вида валидности необходимо выделение специфичных характеристик психодиагностического инструментария, обусловленных особенностями тестирования, временным статусом внешнего критерия6.

В исследованиях (А.  Анастази, 1982; Л.Ф  Бурлачук, С.М. Морозов, 1989; K.M. Гуревич, 1970; Б.В. Кулагин, 1984; В. Черны, 1983; «Общая психодиагностика» (1987) и др.) чаще всего выделяются стандартные процедуры, позволяющие классифицировать и выделить три основных категории валидности:

  1. по содержанию - определяется путем систематического контроля содержания, должна показывать, насколько полно охватывает тест представительную выборку по совокупности измеряемых параметров. Сфера тестологического исследования должна постоянно изучаться и анализироваться, с тем, чтобы тест был наполнен адекватными задачами. (иногда этот прием называют логической валидностью).

Оценка валидности по содержанию используется в основном в тестах достижений, куда обычно включается не весь материал, который прошли учащиеся, а какая-то его небольшая часть (3-4 вопроса). Проверка валидности по содержанию отвечает на вопрос: «Можно ли быть уверенным в том, что правильные ответы на эти немногие вопросы свидетельствуют об усвоении всего материала?». Для этого проводится сопоставление успешности по тесту с экспертными оценками учителей (по данному материалу). Валидность «по содержанию» также подходит к критериально-ориентированным тестам. Для тестов способностей и тестов личности этот тип валидности малоприемлем и неадекватен.

  1. по связи с критериями, определяется с единственной, крайне важной для практики целью: оценить индивидуальную прогностичность теста. Для этого результаты выполнения теста сопоставляются с непосредственными и независимыми оценками того, что должен предсказывать тест.

Валидность по критерию обосновывает корреляции между результатами теста и эмпирическим критерием (чем «выше коэффициент корреляции, тем выше валидность» по данному критерию7).

Данный вид также может определяться как эмпирическая валидность.

  1. по конструкции теста.

Конструктивная валидность дает информацию о степени измерения тестом теоретически (конструктивно) выделяемой черты. Наиболее часто данный тип валидности характеризует тесты интеллекта, вербальные, скоростные, нейротицизма, тревожности. Конструктивная валидность требует постепенного накопления информации об изменчивости оценок. Фиксируются и анализируются данные, проливающие свет на отдельные черты и природу изучаемого явления, а также условия, воздействующие на его развитие и проявление. Специфика определения валидности по конструкции зависит от нескольких факторов, и в первую очередь таких, как возрастные различия и степень связи с другими, ранее использованными тестовыми испытаниями. Особое место в процедуре определения конструктивной валидности занимает факторный анализ, когда статистические процедуры применяются для идентификации результатов психологических исследований.

Здесь, в зависимости от подхода, выделяют: а) «конвергентную» -  проверку ожидаемой связи тестовых оценок с другими показателями чтобы понять будут ли оценки теста варьироваться в соответствии с ожиданиями (например, если для измерения какой-либо черты существует несколько методик, целесообразным было бы провести эксперименты по хотя бы двум, и тогда при обнаружении высокой положительной корреляции их результатов между собой можно говорить о валидности. Основной целью конвергентной валидизации является определение того; б) «дивергентную», предполагающую, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.

В исследованиях могут рассматриваться и другие классификации, где могут выделяться и другие виды валидности по другим критериям. Например, по способу установления валидности теста могут выделяться8:

  1. валидность, при которой оценивается общее соответствие теста его назначению - очевидная валидность;
  2. валидность, при которой тест имеет полный набор заданий для измерения определенной черты - содержательная валидность;
  3. конструктивная валидность, где способ проверки заключается в проведении продуманных экспериментов;
  4. прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.

Внешний временной фактор может лежать в разделении валидности на текущую, прогностическую (предсказывающую) и ретроспективную9:

1) текущая валидность  определяется с помощью внешнего  критерия, по которому информация  собирается одновременно с экспериментами  по проверяемой методике. Другими  словами, это валидность по одновременности, когда собираются данные, относящиеся  к настоящему времени (например, успеваемость в период испытания, производительность в этот же  период и т д.). С ними коррелируют  результаты успешности по тесту;

2) предсказывающая (прогностическая) определяется также внешнему  критерию, но информация по нему  собирается некоторое время спустя  после испытания. Внешним критерием  обычно бывает выраженная в  каких-нибудь оценках способность  человека к тому виду деятельности, для которой он отбирался по  результатам диагностических испытаний. Хотя этот прием наиболее соответствует  задаче диагностических методик - предсказанию будущей успешности, применять его очень трудно. Точность  прогноза находится в обратной зависимости от времени, заданного для такого прогнозирования. Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно;

Информация о работе Валидность теста