Наряду со статистической нормой - используется процентиль - это процентная доля индивидов из выборки стандартизации, результаты которой равны процентильному показателю или ниже него.
P - процентиль.
Например,
(18% испытуемых имели показатель меньше или равный 11).
Чем ниже P, тем хуже позиция индивида. P - отсчитывается снизу. Пятидесятый процентиль - это медиана, которая означает, что приблизительно половина испытуемых имеют показатель ниже, а другая половина - выше.
Еще есть возрастная норма, которая появилась раньше всех других показателей в психодиагностике.
Критериально-ориентированные тесты (или корты) появились не очень давно. На Западе - в 70-е годы, у нас - в середине 80-х. В кортах в качестве точки отсчета используется независимый от результатов обследования, объектно-заданный - содержательный критерий выполнения.
Корты нужны для выявления того, справятся ли люди с определенным видом деятельности. Обладает ли человек необходимыми умениями и навыками. Для этого создаются специальные корты. Отдельные типы заданий диагностируют определенные типы навыков. Все вместе субтесты определяют владение навыками.
Полное выполнение всех заданий тестов и является критерием выполнения. Выясняется процент выполнения заданий.
Если в опроснике нет определенного критерия оценки, то психодиагност должен взять некоторую группу людей и получить для каждого свой показатель, выстраивать по порядку от наилучшего к наихудшему.
Стандартизация - та первая характеристика, по которой психодиагностическая методика отличается от всех остальных.
Проверка методик на надежность и валидность.
Надежность и валидность - это те критерии, по которым можно определить качество и высокую эффективность психодиагностической методики.
Надежность.
Надежность - это первое, на что проверяется методика.
Надежность - это относительное постоянство, устойчивость, согласованность результатов методики при ее проведении на одних и тех же испытуемых.
Надежность - это критерий, говорящий о точности психодиагностических измерений. Надежность зависит от множества причин:
- от степени соблюдения стандартизации процедуры проведения методики (меняющаяся ситуация обследования, колебания в физическом состоянии испытуемого, нечеткость инструкции, указаний, особенности манеры поведения психодиагноста)
- от правильности подбора выборки стандартизации (она должна быть репрезентативна) Если на ней получен небольшой разброс показателей, то коэффициент надежности будет искусственно завышен (или занижен)
- выборка стандартизации должна состоять из таких людей, на которых она рассчитана.
3 вида надежности (которые обязательно устанавливают)
- гомогенность - внутренняя надежность самой методики, которая определяется однородностью заданий
- зависит от стабильности той психологической черты, которая измеряется
- константность - относительная независимость результатов диагностической методики от личности диагноста, который проводит исследование.
Путем вычисления коэффициента корреляции (степень согласованности) определяются виды надежности.
1. Гомогенность.
Установление надежности начинается от определения гомогенности заданий методики. Все задания измеряют одну и ту же психологическую черту. Для установления коэффициента надежности используется прием расщепления, который заключается в том, что все задания методики делятся на 2 группы по какому-то формальному признаку. Деление заданий на четные и нечетные используется чаще. Или задания первой и второй половины, что реже (так как задания второй половины испытуемые могут выполнять хуже). Берется выборка стандартизации и каждый испытуемый выполняет методику. Для каждого считается:
- показатель успешности выполнения нечетных заданий
- показатель успешности выполнения четных заданий.
Если задания однородные, то баллы по двум показателям успешности выполнения будут одинаковые или отличаться незначительно. Используется прием вычисления коэффициента ранговой корреляции по Спирмену.
между четными и нечетными заданиями.
Для вычисления d:
- по порядку все результаты от лучшего к худшему
- проранжировать результаты по нечетным заданиям
- проранжировать результаты по четным заданиям
Ранги четных заданий приблизительно одинаковые с рангами нечетных.
без учета знака
Затем
и
Гомогенность тем выше, чем ближе ФОРМУЛа к единице.
Методика гомогенна, если коэффициент гомогенности не ниже 0,75. У хороших методик - очень высокий уровень гомогенности =0,94 или 0,98. Все изменения в методике ведут к новой проверке на гомогенность.
2. Психологические признаки, характеристики:
- психические состояния нестабильны, имеют временной характер
- психологические черты - постепенно формируются и определяют индивидуальность.
Важно выяснить для методики, насколько стабильную характеристику она измеряет. Так как результаты методики используются для прогноза, то важно вычислить коэффициент стабильности помощью приема тест-ретест. Заключается в повторном обследовании испытуемых спустя какое-то время. Выборку стандартизации диагностируют дважды с помощью одной и той же методики. Опять имеем 2 показателя:
- при первом обследовании
- при повторном обследовании
Используется та же формула Спирмена дл определения согласования 2-х результатов обследования.
Если ,
то достаточно хорошая надежность по стабильности диагностируемой черты.
Чем короче промежуток времени между обследованиями - тем больше шансов обнаружения того же уровня измеряемой черты. С увеличением измеряемого интервала - стабильность снижается, так как больше влияния посторонних факторов. Надо проводить обследования с коротким промежутком времени (1-2 дня). Но часть испытуемых может повторить по памяти первые результаты, тогда вторые результаты будут зависеть от первого. Выбор промежутка осуществляется автором методики, и зависит от возраста испытуемых и содержания методики. Взрослые люди - от нескольких месяцев до года, дети-дошкольники - интервал укорачивается (изменения очень быстрые) от нескольких недель до нескольких месяцев.
3. Константность.
Скорость речи, тон голоса, выражение лица - все может повлиять на испытуемого при выполнении методики. Если одной стандартизации недостаточно, то нужна проверка на константность (не для всех методик, в основном это проективные методики, где многое зависит от психодиагноста). Используется выборка стандартизации. Сначала обследование проводит один психодиагност, затем через некоторое время другой. Опять два ряда независимых показателей. Вновь вычисляется коэффициент корреляции по Спирмену.
(п-ст - психодиагност)
В хорошей методике
и должен стремиться к единице. Первые два коэффициента вычисляются обязательно и приводятся в руководстве к методике (гомогенность, стабильность)
Валидность методики.
Валидность - ключевой критерий для оценки качества методики.
Валидность устанавливается только после проверки методики на надежность. Самая надежная методика бесполезна без знаний о ее валидности.
Валидность - это понятие, указывающее, что методика измеряет и насколько хорошо она это делает. Валидность - тоже комплексная характеристика.
Две стороны валидности:
- Теоретическая валидность
- Прагматическая валидность.
Установление валидности - процесс валидизации методики.
Теоретическая валидность - это характеристика внутренней сути методики.
Теоретическая валидизация - выяснение того, какие свойства измеряет новая методика.
Прагматическая валидность.
Прагматическая валидность относится к цели ее использования, а не к психологической сущности методики.
При прагматической валидизации доказывается, что то, что измеряется методикой, имеет практическую ценность, и это нужно уметь оценивать.
Теоретическая валидность.
Бывает просто, если уже есть какая-то методика, которая диагностирует тоже качество. Должны быть получены связи между показателями старой проверенной методики и новой на одной группе испытуемых. Сначала используется новая методика, через какое-то время старая. Вычисляется коэффициент корреляции, и он должен быть относительно высоким. Это конвергентная валидность.???
Дискриминантная валидность.
Дискриминантная валидность - отсутствие значимой связи с методикой, имеющей другое теоретическое основание. В середине 20-го века стала обязательна проверка на теоретическую валидность. Если не с чем сравнить, то проводятся исследования. Чисто теоретически определяется суть характеристики, ее проявления в реальном поведении, дальше они сопоставляются с показателями методики. Сведения о теоретической валидизации нужны для ясного понимания того, что психолог измеряет практически и для дальнейшей интерпретации.
Прагматическая валидизация.
Для ее проведения нужно выбрать независимый внешний критерий - это показатель проявления измеряемого свойства в повседневной жизни.
В качестве такого критерия могут быть:
- успешность учебной деятельности (валидизация интеллектуальных тестов, тестов достижений, тесты умственного развития...)
- эффективность выполнения трудовой и профессиональной деятельности (при разработке методик профессиональной направленности)
- эффективность выполнения какой-то реальной деятельности (для валидизации тестов специальных способностей)
- экспертные оценки (данные экспертизы) используются при валидизации личностных методик
Независимый внешний критерий должен быть:
- Релевантным. Независимый внешний критерий должен иметь психологическое сходство с тем видом деятельности, которая используется в психодиагностической методике. Деятельность должна быть похожа на ту деятельность, которая является независимым внешним критерием. Они должны зависеть от одной и той же психологической характеристики.
- Свободен от помех. Независимый внешний критерий вызывается тем, что выполнение какой-то реальной деятельности никогда не может определяться одним психологическим качеством или чертой. Независимый внешний критерий всегда загрязнен внешними факторами. Нужно его в большей степени освободить от посторонних факторов и должна больше проявляться та черта, которая проверяется.
- Надежным. Независимый внешний критерий должен отражать постоянство того свойства, которое диагностируется.