Методика расчёта
РРепрезентативная выборка — это часть генеральной совокупности, по структуре и характеристикам повторяющая её настолько точно, что результаты опроса можно с заданной вероятностью переносить на всю популяцию. Минимальный объём такой выборки рассчитывается по формуле, предложенной американским статистиком Уильямом Кохраном в 1963 году в книге Sampling Techniques.
В основе метода — нормальное распределение долей: при достаточном размере выборки распределение оценок этой доли становится приблизительно нормальным, а ширина доверительного интервала зависит только от объёма выборки, ожидаемой дисперсии и выбранного уровня доверия.
Если генеральная совокупность конечна, применяется поправка:
Стандартные значения Z для трёх уровней доверия: 90% → 1,645, 95% → 1,96, 99% → 2,576. Они получаются из таблиц нормального распределения и соответствуют двусторонним квантилям α/2.
Минимальный объём выборки определяется не размером популяции, а требуемой точностью оценки. Для популяций свыше 10 000 человек поправка на конечную совокупность практически не влияет на результат.— Cochran W. G., Sampling Techniques, 3rd ed., 1977
Почему именно формула Кохрана
В российской и зарубежной литературе встречаются три основные формулы расчёта объёма выборки:
- Кохран (1963) — учитывает уровень доверия, ожидаемую долю и погрешность. Применяется в социологии, маркетинге, эпидемиологии.
- Слоним (1960) — упрощённая формула
n = N / (1 + N · e²), не учитывает Z. Подходит только для пилотных и студенческих работ. - В. А. Ядов — российский вариант формулы Кохрана с поправкой на N; результаты совпадают с международной формулой.
Для научной работы — ВКР, диссертации, публикации в реферируемых журналах — рецензенты ожидают именно формулу Кохрана: на неё можно сослаться и в международной, и в российской литературе.
Готовые объёмы выборки для дипломной работы
Таблица показывает минимальное число респондентов при доверии 95% и максимальной дисперсии (p = 0,5). Используйте её как шпаргалку при подготовке методологического раздела работы.
Виды выборок
Объём — не единственный параметр; важен и метод отбора. Кохрановская формула даёт достаточный размер для случайной выборки. Если используется кластерный или квотный отбор, требуется поправка на дизайн-эффект (DEFF).
Простая случайная
Каждый член генеральной совокупности имеет равную вероятность попасть в выборку. Реализуется через генератор случайных чисел или по списку. Базовый метод — служит точкой сравнения для всех остальных.
Стратифицированная
Совокупность делят на страты (пол, возраст, регион), и из каждой страты берут пропорциональную случайную выборку. Снижает ошибку при гетерогенной популяции — стандарт для всероссийских опросов ВЦИОМ, ФОМ, Левада.
Кластерная
Генеральная совокупность делится на кластеры (классы, дома, бригады), часть кластеров отбирается случайно, и опрашиваются все члены отобранных кластеров. Дешевле для географически разбросанных популяций.
Серийная (систематическая)
Из упорядоченного списка отбирают каждого k-го (например, каждого 50-го). Простой способ, но опасен при наличии скрытой периодичности в списке (например, чередование мужчин и женщин).
Типичные ошибки расчёта
- «Берём 10% от генеральной совокупности». Распространённый миф. При N = 100 000 это даст 10 000 человек — избыточно. При N = 50 это даст 5 — недостаточно для любых выводов.
- Игнорирование дизайн-эффекта. Если выборка кластерная, реальный размер должен быть больше расчётного в 1,5–3 раза (зависит от внутрикластерной корреляции).
- Неучёт неответов. Если ожидаемый response rate 30%, выборку нужно умножить на 1/0,3 — пригласить в 3,3 раза больше респондентов.
- Расчёт по «средней» формуле без указания Z. Референт диссертации почти всегда задаёт вопрос «при каком уровне доверия?» — ответ должен быть указан в методологии работы.
- Sampling Techniques (3rd ed.). Cochran W. G.. New York: John Wiley & Sons. 1977.
- Стратегия социологического исследования. Ядов В. А.. М.: Омега-Л. 2007.
- ГОСТ Р ИСО 2859-1-2007 «Статистические методы. Процедуры выборочного контроля по альтернативному признаку». Росстандарт. Стандартинформ. 2007.
- Sampling: How to Select People to Estimate the Probability of an Event. Slovin M. J.. Boston: Houghton Mifflin. 1960.
Подробнее о статистике и нормах оформления — в глоссарии калькулятора.
