Калькулятор психометрики
и тестологии
Основы психометрики
Психометрика — наука об измерении психологических свойств. Она обеспечивает строгую математическую основу для разработки тестов, оценки их качества и интерпретации результатов. Без психометрических характеристик психологический тест является лишь опросником, а не научным инструментом.
Надёжность
Надёжность показывает, насколько стабильны результаты теста при повторном измерении. Коэффициент альфа Кронбаха измеряет внутреннюю согласованность — степень, в которой все пункты теста измеряют одно и то же конструкт. Приемлемый порог — α ≥ 0.70, для диагностических решений — α ≥ 0.85.
Валидность
Валидность — основной критерий качества теста: измеряет ли он то, для чего предназначен. Различают содержательную валидность (охват конструкта), конструктную (соответствие теоретической модели) и критериальную (связь с внешним критерием). Надёжность — необходимое, но недостаточное условие валидности.
Стандартизация
Стандартизация — процесс создания норм для интерпретации первичных баллов. Нормы разрабатываются на репрезентативной выборке и позволяют сравнить результат конкретного человека с популяцией. Российские тесты должны иметь отечественные нормы — зарубежные нормы неприменимы напрямую.
Возможности калькулятора
Полный психометрический инструментарий для разработки и оценки психологических тестов.
α Кронбаха (внутренняя согласованность)
Расчёт коэффициента альфа Кронбаха по числу пунктов k и средней межпунктовой корреляции. Диаграмма кривой альфа от длины теста. Формула Спирмена-Брауна для планирования длины теста.
SEM — стандартная ошибка измерения
Вычисление SEM = SD × √(1−r). Доверительные интервалы 68% и 95% для истинного балла. Визуализация распределения вероятности истинного балла.
Нормирование баллов
Перевод первичного балла в z, T-балл, стэнайн, процентиль, IQ-шкалу и SAT одновременно. Позиционирование на кривой нормального распределения.
Дифференцирующая способность
Индекс трудности p и индекс дифференциации d по методу 27% групп. Интерпретация и рекомендации по каждому пункту теста.
Конструктная валидность
Оценка структуры теста через конфирматорный факторный анализ. Взаимосвязь надёжности и валидности. Рекомендации по улучшению психометрических характеристик.
Нормы для российской выборки
Ориентация на требования РПО (Российского психологического общества) и российского легислативства. Разработка норм на отечественных выборках.
Теории и стандарты психометрики/ полное руководство
Современная психометрика опирается на две основные теоретические парадигмы: классическую теорию теста (CTT) и теорию ответа на задание (IRT). Для работы с данными тестирования также используют описательную статистику. Российское профессиональное сообщество руководствуется стандартами РПО и международными требованиями к психологическому тестированию.
Классическая теория теста (CTT)
CTT основана на модели: наблюдаемый балл X = истинный балл T + ошибка измерения E. Ключевые характеристики: надёжность как корреляция между параллельными формами, SEM, коэффициент Кронбаха.
X = T + E (модель CTT)α = k̲r̄ / [1 + (k-1)̲r̄] (α Кронбаха)SEM = SD × √(1 - r) (стандартная ошибка)Преимущества CTT: простота расчёта, широкая применимость, не требует специального ПО. Ограничения: характеристики заданий зависят от выборки, характеристики испытуемых — от теста.
IRT — Теория ответа на задание (модели Раша, 2PL, 3PL)
IRT моделирует вероятность правильного ответа как функцию латентной черты испытуемого и параметров задания. Основные модели:
Модель Раша (1PL)
P(θ) = exp(θ-b) / [1 + exp(θ-b)]Один параметр — трудность задания b. Строгая модель, удобна для конструирования шкал (батареи Раша). Широко применяется в образовательном тестировании (ЕГЭ, ОГЭ в России).
Двухпараметрическая модель (2PL)
P(θ) = 1 / [1 + exp(-a(θ-b))]Параметры: a (дифференцирующая способность) и b (трудность). Гибче модели Раша, применяется в психологических тестах.
Трёхпараметрическая модель (3PL)
P(θ) = c + (1-c) / [1 + exp(-a(θ-b))]Добавляет параметр угадывания c. Применяется в тестах с множественным выбором, где случайный ответ возможен.
Типы валидности
Валидность — степень, в которой тест измеряет именно то, для чего предназначен. Различают три основных типа согласно APA Standards (2014):
Содержательная валидность (Content Validity)
Степень охвата тестом всего содержания измеряемого конструкта. Оценивается экспертным путём (коэффициент CVR Лоше) или анализом таблицы спецификаций. Обязательна для тестов достижений и профессиональных экзаменов.
Конструктная валидность (Construct Validity)
Соответствие теста теоретической модели конструкта. Проверяется конфирматорным факторным анализом, мультитрейт-мультиметодными матрицами, дифференциальной валидностью. Ключевой тип в психологии.
Критериальная валидность (Criterion Validity)
Связь результатов теста с внешним критерием. Конкурентная (одновременная) — критерий измеряется сейчас, прогностическая — в будущем. Выражается коэффициентом валидности (обычно корреляция r ≥ 0.30 считается значимой).
Требования к тестам в России (стандарты РПО)
Российское психологическое общество и законодательство предъявляют конкретные требования к психодиагностическим методикам.
Стандарты РПО (2008, редакция 2019)
Требуют документирования психометрических характеристик: надёжность (α ≥ 0.70), конструктная и критериальная валидность, российские нормы на репрезентативной выборке не менее 200 чел. Для клинического применения — нормы на клинических группах.
ГОСТ Р 56827-2015 (психологическое тестирование)
Устанавливает требования к условиям проведения, квалификации психологов, документированию результатов. Обязателен для государственных организаций и образовательных учреждений.
Адаптация зарубежных тестов
Прямой перевод недопустим. Требуются: лингвистическая эквивалентность (обратный перевод), пилотажное исследование, сбор российских норм, подтверждение факторной структуры на отечественной выборке. Процедура занимает 1-3 года.
Минимальные требования надёжности: α ≥ 0.70 для групповых исследований; α ≥ 0.80 для индивидуальной диагностики; α ≥ 0.90 для клинических и юридически значимых решений.
Нормирование для России: Зарубежные нормы (США, Европа) не подходят для российской популяции из-за культурных и лингвистических различий. Всегда создавайте отечественные нормы.
Ключевые концепции
Фундаментальные понятия классической теории теста и теории ответа на задание.
CTT — Классическая теория теста
Classical Test TheoryОснована на модели X = T + E. Вся дисперсия наблюдаемых баллов делится на истинную и ошибочную составляющие. Надёжность — доля истинной дисперсии. Простота расчётов делает CTT доступной без специального ПО. Ограничение: параметры теста и испытуемых взаимозависимы. CTT является стандартом в большинстве российских исследований.
IRT — Теория ответа на задание
Item Response TheoryМоделирует вероятность правильного ответа через характеристическую кривую задания (ICC). Параметры инвариантны к выборке — главное преимущество над CTT. Требует специального ПО (R, SPSS, Winsteps) и крупных выборок (от 200-500 чел.). Применяется в ЕГЭ, международных тестах (PISA, TIMSS), адаптивном тестировании.
Валидность теста
Test ValidityВалидность — важнейшая характеристика теста, показывающая, измеряет ли он то, что должен измерять. Надёжность является необходимым, но недостаточным условием валидности: тест может быть надёжным, но невалидным. Современная концепция рассматривает валидность как унитарную характеристику с разными свидетельствами (содержательные, структурные, внешние, последствия).
Стандартизация и нормирование
Standardization & NormsСтандартизация включает унификацию процедуры и разработку нормативных таблиц. Нормы могут быть возрастными (в детской психологии), профессиональными (для отбора персонала), клиническими (для психиатрии). Тип нормы определяет сравнительную группу. Важно: нормы устаревают (эффект Флинна) и требуют периодического обновления.
Советы по разработке психологического теста
Практические рекомендации для создания надёжного и валидного психологического инструмента.
1Начните с чёткого определения конструкта
Перед написанием пунктов точно определите, что именно измеряет тест. Создайте таблицу спецификаций, отражающую все аспекты конструкта. Неопределённость конструкта — главная причина низкой валидности. Используйте теоретические модели и литературный обзор.
2Генерируйте пункты с запасом
Создавайте в 2-3 раза больше пунктов, чем нужно в финальном тесте. Это позволит отобрать лучшие по психометрическим показателям. Формулировки должны быть однозначными, без двойных отрицаний, культурно нейтральными. Избегайте наводящих вопросов и социально желательных ответов.
3Проведите пилотажное исследование
Пилотаж на 30-100 чел. позволяет выявить непонятые инструкции, технические ошибки, пункты с экстремальными показателями трудности (p < 0.15 или p > 0.85). Проведите когнитивные интервью — попросите участников вслух объяснять своё понимание вопросов.
4Рассчитайте психометрические показатели
Для каждого пункта вычислите индекс трудности p и дифференциации d. Исключите пункты с d < 0.20. Рассчитайте коэффициент α Кронбаха, SEM, корреляцию "пункт-тест". Используйте анализ "альфа при исключении пункта" для оптимизации теста.
5Стандартизируйте на репрезентативной российской выборке
Нормативная выборка должна репрезентировать целевую популяцию по полу, возрасту, образованию, региону. Минимальный объём — 200-300 чел. для исследовательских норм, 500+ — для клинических. Обновляйте нормы каждые 10-15 лет или при значительных культурных изменениях.
6Документируйте и публикуйте данные
Подготовьте технический мануал с описанием разработки, психометрическими характеристиками, нормативными таблицами и инструкцией. Публикация в рецензируемом журнале обеспечивает независимую экспертизу. Соблюдайте стандарты РПО (2019) и этический кодекс психолога.
Как пользоваться калькулятором
Пошаговая инструкция для психометрического анализа вашего теста.
Выберите вкладку
Определите, какой аспект нужно рассчитать: надёжность (α Кронбаха), ошибку измерения (SEM), нормирование баллов или дифференцирующую способность заданий.
Введите параметры
Укажите характеристики вашего теста: число пунктов, корреляции, стандартное отклонение, надёжность или баллы верхней и нижней 27%-групп.
Изучите результаты
Калькулятор мгновенно рассчитывает показатели с интерпретацией. Для α Кронбаха показывает уровень надёжности и рекомендуемое число пунктов по формуле Спирмена-Брауна.
Используйте для оптимизации
Экспериментируйте с параметрами для планирования теста: подберите оптимальное число пунктов, оцените ДИ для нужной надёжности, сравните шкалы нормирования.
Часто задаваемые вопросы
Похожие калькуляторы
Калькулятор теории IRT (Раш, 2PL, 3PL)
Расчёт кривых ICC, информационных функций пунктов (IIF) и теста (TIF) по моделям Раша, 2PL и 3PL. Для ЕГЭ, PISA, адаптивного тестирования.
/item-response-theory-calculatorКалькулятор IQ и коэффициента интеллекта
Оценка IQ по баллу теста (Векслер, Равен, Кеттел), расчёт перцентиля и g-фактора. Краткий ориентировочный тест на интеллект. Норма 100±15.
/iq-calculatorКалькулятор профессиональной пригодности
Тест на способности и профессиональную пригодность. Оцените свои вербальные, числовые, логические и пространственные способности для выбора карьеры.
/aptitude-calculatorКалькулятор когнитивной науки: Хик, Фиттс, память и внимание
Когнитивные расчёты онлайн: закон Хика, закон Фиттса, кривая забывания Эббингауза, рабочая память Миллера, когнитивная нагрузка NASA-TLX.
/cognitive-science-calculatorКалькулятор клинической психологии: BDI, STAI, MBI, GAD-7 и PHQ-9
Клинико-психологические шкалы онлайн: депрессия Бека (BDI-II), тревожность Спилбергера (STAI), выгорание Маслач (MBI), стресс PSS-10.
/clinical-psychology-calculatorПсихометрический калькулятор: Z-оценка, IQ, надежность
Профессиональные психометрические расчеты. Перевод сырых баллов в стандартные шкалы (Z, T, IQ), расчет Альфы Кронбаха и нормализация тестов.
/psychometry-calculatorКалькулятор нейропсихологии: MMSE, MoCA, FAB и тест Струпа
Нейропсихологическая оценка онлайн: подсчёт баллов MMSE, MoCA, FAB, тест рисования часов, интерференция Струпа, индекс латерализации.
/neuropsychology-calculatorКалькулятор психологии развития: Эриксон, Эльконин, Пиаже и вехи развития
Расчёты психологии развития: стадии Эриксона, периодизация Эльконина, когнитивное развитие Пиаже, психомоторные вехи, скорректированный возраст.
/developmental-psychology-calculatorКалькулятор психологии здоровья: стресс Холмса-Раэ, копинг и качество жизни
Расчёты психологии здоровья: шкала стресса Холмса-Раэ, модель убеждений о здоровье, стадии Прохазки, копинг Лазаруса, EQ-5D, HLI.
/health-psychology-calculatorКалькулятор судебной психологии: HCR-20, CBCA, PCL-R и вменяемость
Судебно-психологические расчёты: оценка риска рецидива (HCR-20), анализ показаний (CBCA), шкала психопатии (PCL-R), вменяемость по УК РФ.
/forensic-psychology-calculatorКалькулятор психофизики: Вебер-Фехнер, Стивенс, d-prime и время реакции
Психофизические расчёты онлайн: закон Вебера-Фехнера, степенной закон Стивенса, теория обнаружения сигнала (d′), закон Хика.
/psychophysics-calculatorКалькулятор социальной психологии: социометрия, конформизм и групповая динамика
Социально-психологические расчёты онлайн: социометрический индекс, шкала Богардуса, модель Латане, Кендалл W, групповое мышление.
/social-psychology-calculatorКалькулятор педагогической психологии: ЗБР, кривая обучения и SM-2
Расчёты педагогической психологии: зона ближайшего развития (Выготский), кривая обучения, интервальное повторение SM-2, таксономия Блума.
/educational-psychology-calculatorКалькулятор спортивной психологии: Йеркс-Додсон, RPE, выгорание и POMS
Спортивно-психологические расчёты: закон Йеркса-Додсона, шкала Борга (RPE), профиль настроения POMS, выгорание, Mental Toughness.
/sports-psychology-calculatorДневник выгорания и стресса
Дневник стресса и риска эмоционального выгорания на работе. Шкалы МКБ-11 QD85 и Maslach. 16 триггеров, 11 копинг-стратегий. IndexedDB.
/dnevnik-vygoraniya-i-stresa-na-rabote-pwaБыл ли этот калькулятор полезен?
Инструмент справочный — не заменяет эксперта
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Профессиональные решения — медицинские, финансовые, инженерные — должны приниматься только после консультации с квалифицированным специалистом. Не используйте автоматический расчёт как единственное основание для важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут ответственности за прямой или косвенный ущерб, возникший из-за использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию результатов.
