Калькулятор психометрики
и тестологии
Основы психометрики
Психометрика — наука об измерении психологических свойств. Она обеспечивает строгую математическую основу для разработки тестов, оценки их качества и интерпретации результатов. Без психометрических характеристик психологический тест является лишь опросником, а не научным инструментом.
Надёжность
Надёжность показывает, насколько стабильны результаты теста при повторном измерении. Коэффициент альфа Кронбаха измеряет внутреннюю согласованность — степень, в которой все пункты теста измеряют одно и то же конструкт. Приемлемый порог — α ≥ 0.70, для диагностических решений — α ≥ 0.85.
Валидность
Валидность — основной критерий качества теста: измеряет ли он то, для чего предназначен. Различают содержательную валидность (охват конструкта), конструктную (соответствие теоретической модели) и критериальную (связь с внешним критерием). Надёжность — необходимое, но недостаточное условие валидности.
Стандартизация
Стандартизация — процесс создания норм для интерпретации первичных баллов. Нормы разрабатываются на репрезентативной выборке и позволяют сравнить результат конкретного человека с популяцией. Российские тесты должны иметь отечественные нормы — зарубежные нормы неприменимы напрямую.
Возможности калькулятора
Полный психометрический инструментарий для разработки и оценки психологических тестов.
α Кронбаха (внутренняя согласованность)
Расчёт коэффициента альфа Кронбаха по числу пунктов k и средней межпунктовой корреляции. Диаграмма кривой альфа от длины теста. Формула Спирмена-Брауна для планирования длины теста.
SEM — стандартная ошибка измерения
Вычисление SEM = SD × √(1−r). Доверительные интервалы 68% и 95% для истинного балла. Визуализация распределения вероятности истинного балла.
Нормирование баллов
Перевод первичного балла в z, T-балл, стэнайн, процентиль, IQ-шкалу и SAT одновременно. Позиционирование на кривой нормального распределения.
Дифференцирующая способность
Индекс трудности p и индекс дифференциации d по методу 27% групп. Интерпретация и рекомендации по каждому пункту теста.
Конструктная валидность
Оценка структуры теста через конфирматорный факторный анализ. Взаимосвязь надёжности и валидности. Рекомендации по улучшению психометрических характеристик.
Нормы для российской выборки
Ориентация на требования РПО (Российского психологического общества) и российского легислативства. Разработка норм на отечественных выборках.
Теории и стандарты психометрики/ полное руководство
Современная психометрика опирается на две основные теоретические парадигмы: классическую теорию теста (CTT) и теорию ответа на задание (IRT). Для работы с данными тестирования также используют описательную статистику. Российское профессиональное сообщество руководствуется стандартами РПО и международными требованиями к психологическому тестированию.
Классическая теория теста (CTT)
CTT основана на модели: наблюдаемый балл X = истинный балл T + ошибка измерения E. Ключевые характеристики: надёжность как корреляция между параллельными формами, SEM, коэффициент Кронбаха.
X = T + E (модель CTT)α = k̲r̄ / [1 + (k-1)̲r̄] (α Кронбаха)SEM = SD × √(1 - r) (стандартная ошибка)Преимущества CTT: простота расчёта, широкая применимость, не требует специального ПО. Ограничения: характеристики заданий зависят от выборки, характеристики испытуемых — от теста.
IRT — Теория ответа на задание (модели Раша, 2PL, 3PL)
IRT моделирует вероятность правильного ответа как функцию латентной черты испытуемого и параметров задания. Основные модели:
Модель Раша (1PL)
P(θ) = exp(θ-b) / [1 + exp(θ-b)]Один параметр — трудность задания b. Строгая модель, удобна для конструирования шкал (батареи Раша). Широко применяется в образовательном тестировании (ЕГЭ, ОГЭ в России).
Двухпараметрическая модель (2PL)
P(θ) = 1 / [1 + exp(-a(θ-b))]Параметры: a (дифференцирующая способность) и b (трудность). Гибче модели Раша, применяется в психологических тестах.
Трёхпараметрическая модель (3PL)
P(θ) = c + (1-c) / [1 + exp(-a(θ-b))]Добавляет параметр угадывания c. Применяется в тестах с множественным выбором, где случайный ответ возможен.
Типы валидности
Валидность — степень, в которой тест измеряет именно то, для чего предназначен. Различают три основных типа согласно APA Standards (2014):
Содержательная валидность (Content Validity)
Степень охвата тестом всего содержания измеряемого конструкта. Оценивается экспертным путём (коэффициент CVR Лоше) или анализом таблицы спецификаций. Обязательна для тестов достижений и профессиональных экзаменов.
Конструктная валидность (Construct Validity)
Соответствие теста теоретической модели конструкта. Проверяется конфирматорным факторным анализом, мультитрейт-мультиметодными матрицами, дифференциальной валидностью. Ключевой тип в психологии.
Критериальная валидность (Criterion Validity)
Связь результатов теста с внешним критерием. Конкурентная (одновременная) — критерий измеряется сейчас, прогностическая — в будущем. Выражается коэффициентом валидности (обычно корреляция r ≥ 0.30 считается значимой).
Требования к тестам в России (стандарты РПО)
Российское психологическое общество и законодательство предъявляют конкретные требования к психодиагностическим методикам.
Стандарты РПО (2008, редакция 2019)
Требуют документирования психометрических характеристик: надёжность (α ≥ 0.70), конструктная и критериальная валидность, российские нормы на репрезентативной выборке не менее 200 чел. Для клинического применения — нормы на клинических группах.
ГОСТ Р 56827-2015 (психологическое тестирование)
Устанавливает требования к условиям проведения, квалификации психологов, документированию результатов. Обязателен для государственных организаций и образовательных учреждений.
Адаптация зарубежных тестов
Прямой перевод недопустим. Требуются: лингвистическая эквивалентность (обратный перевод), пилотажное исследование, сбор российских норм, подтверждение факторной структуры на отечественной выборке. Процедура занимает 1-3 года.
Минимальные требования надёжности: α ≥ 0.70 для групповых исследований; α ≥ 0.80 для индивидуальной диагностики; α ≥ 0.90 для клинических и юридически значимых решений.
Нормирование для России: Зарубежные нормы (США, Европа) не подходят для российской популяции из-за культурных и лингвистических различий. Всегда создавайте отечественные нормы.
Ключевые концепции
Фундаментальные понятия классической теории теста и теории ответа на задание.
CTT — Классическая теория теста
Classical Test TheoryОснована на модели X = T + E. Вся дисперсия наблюдаемых баллов делится на истинную и ошибочную составляющие. Надёжность — доля истинной дисперсии. Простота расчётов делает CTT доступной без специального ПО. Ограничение: параметры теста и испытуемых взаимозависимы. CTT является стандартом в большинстве российских исследований.
IRT — Теория ответа на задание
Item Response TheoryМоделирует вероятность правильного ответа через характеристическую кривую задания (ICC). Параметры инвариантны к выборке — главное преимущество над CTT. Требует специального ПО (R, SPSS, Winsteps) и крупных выборок (от 200-500 чел.). Применяется в ЕГЭ, международных тестах (PISA, TIMSS), адаптивном тестировании.
Валидность теста
Test ValidityВалидность — важнейшая характеристика теста, показывающая, измеряет ли он то, что должен измерять. Надёжность является необходимым, но недостаточным условием валидности: тест может быть надёжным, но невалидным. Современная концепция рассматривает валидность как унитарную характеристику с разными свидетельствами (содержательные, структурные, внешние, последствия).
Стандартизация и нормирование
Standardization & NormsСтандартизация включает унификацию процедуры и разработку нормативных таблиц. Нормы могут быть возрастными (в детской психологии), профессиональными (для отбора персонала), клиническими (для психиатрии). Тип нормы определяет сравнительную группу. Важно: нормы устаревают (эффект Флинна) и требуют периодического обновления.
Советы по разработке психологического теста
Практические рекомендации для создания надёжного и валидного психологического инструмента.
1Начните с чёткого определения конструкта
Перед написанием пунктов точно определите, что именно измеряет тест. Создайте таблицу спецификаций, отражающую все аспекты конструкта. Неопределённость конструкта — главная причина низкой валидности. Используйте теоретические модели и литературный обзор.
2Генерируйте пункты с запасом
Создавайте в 2-3 раза больше пунктов, чем нужно в финальном тесте. Это позволит отобрать лучшие по психометрическим показателям. Формулировки должны быть однозначными, без двойных отрицаний, культурно нейтральными. Избегайте наводящих вопросов и социально желательных ответов.
3Проведите пилотажное исследование
Пилотаж на 30-100 чел. позволяет выявить непонятые инструкции, технические ошибки, пункты с экстремальными показателями трудности (p < 0.15 или p > 0.85). Проведите когнитивные интервью — попросите участников вслух объяснять своё понимание вопросов.
4Рассчитайте психометрические показатели
Для каждого пункта вычислите индекс трудности p и дифференциации d. Исключите пункты с d < 0.20. Рассчитайте коэффициент α Кронбаха, SEM, корреляцию "пункт-тест". Используйте анализ "альфа при исключении пункта" для оптимизации теста.
5Стандартизируйте на репрезентативной российской выборке
Нормативная выборка должна репрезентировать целевую популяцию по полу, возрасту, образованию, региону. Минимальный объём — 200-300 чел. для исследовательских норм, 500+ — для клинических. Обновляйте нормы каждые 10-15 лет или при значительных культурных изменениях.
6Документируйте и публикуйте данные
Подготовьте технический мануал с описанием разработки, психометрическими характеристиками, нормативными таблицами и инструкцией. Публикация в рецензируемом журнале обеспечивает независимую экспертизу. Соблюдайте стандарты РПО (2019) и этический кодекс психолога.
Как пользоваться калькулятором
Пошаговая инструкция для психометрического анализа вашего теста.
Выберите вкладку
Определите, какой аспект нужно рассчитать: надёжность (α Кронбаха), ошибку измерения (SEM), нормирование баллов или дифференцирующую способность заданий.
Введите параметры
Укажите характеристики вашего теста: число пунктов, корреляции, стандартное отклонение, надёжность или баллы верхней и нижней 27%-групп.
Изучите результаты
Калькулятор мгновенно рассчитывает показатели с интерпретацией. Для α Кронбаха показывает уровень надёжности и рекомендуемое число пунктов по формуле Спирмена-Брауна.
Используйте для оптимизации
Экспериментируйте с параметрами для планирования теста: подберите оптимальное число пунктов, оцените ДИ для нужной надёжности, сравните шкалы нормирования.
Часто задаваемые вопросы
Похожие инструменты
Калькулятор поликарбоната
Расчёт листов поликарбоната на теплицу, навес или козырёк с учётом стыков, крепежа и стоимости
Калькулятор конвертации форматов файлов
Изменение размера при конвертации: BMP vs JPG, WAV vs MP3, RAW vs MP4. Lossless и Lossy сжатие.
Калькулятор конного спорта: калории, содержание, кормление
Калькулятор для конного спорта. Расход калорий, стоимость содержания лошади, весовая нагрузка, дисциплины FEI, расчёт кормления.
Калькулятор управления автопарком
Расчёты автопарка: TCO, расход топлива, размер парка, ТО, водители, лизинг vs покупка
Калькулятор SaaS-метрик: Unit-экономика, MRR, Churn, Runway
Комплексный калькулятор SaaS-метрик: unit-экономика (CAC, LTV, LTV/CAC, ARPU, ARPPU), метрики выручки (MRR, ARR, Quick Ratio), анализ оттока (Churn, NRR, когорты), метрики роста (Rule of 40, T2D3), воронка конверсий и финансовые прогнозы (runway, burn rate).
Калькулятор сечения провода (ПУЭ)
Сечение кабеля по мощности и току. Падение напряжения, медь/алюминий. По ПУЭ 7 для 220В и 380В.
Калькулятор растаможки автомобиля (таможенная пошлина, утильсбор, акциз)
Рассчитайте стоимость растаможки авто при ввозе в Россию. Таможенная пошлина, утилизационный сбор, акциз и НДС для физлиц и юрлиц. Актуальные ставки ФТС.
Калькулятор критериев Рэнсона (панкреатит)
Оценка тяжести острого панкреатита по критериям Рэнсона. При поступлении и через 48 часов. Прогноз летальности.
Геотермальный калькулятор
Расчёты геотермальной энергии: тепловые насосы, градиент, скважины, экономика
Проверка контрастности WCAG
Контрастность цветов по WCAG 2.1 (AA и AAA). Доступность сайта для людей с нарушениями зрения.
Калькулятор срока действия SSL сертификата
Проверка срока действия SSL/TLS сертификата. Рассчитайте дни до истечения, узнайте статус и получите рекомендации по продлению.
Калькулятор сварки
Расчёты сварки: режимы, расход материалов, предварительный нагрев, прочность шва, деформации
Калькулятор кредитного рейтинга (скоринг) и истории
Бесплатный расчет кредитного рейтинга и оценка шансов на кредит. Анализ факторов (просрочки, нагрузка). Рекомендации по улучшению истории.
Калькулятор тепловой завесы
Подбор мощности и длины тепловой завесы для дверных проёмов и ворот.
Калькулятор стоимости создания сайта
Рассчитайте стоимость разработки сайта онлайн. Лендинг, интернет-магазин, корпоративный сайт, маркетплейс. Цены для России 2024-2025, сравнение CMS: Tilda, WordPress, 1С-Битрикс.

Лиана Арифметова
Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».
Отказ от ответственности
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.