Статистический критерий
Статистический критерий — математическое правило, в соответствии с которым принимается или отвергается та или иная статистическая гипотеза с заданным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Определение
Пусть даны выборка [math]\displaystyle{ \mathbf{X} = (X_1,\ldots,X_n) }[/math] из неизвестного совместного распределения [math]\displaystyle{ \mathbb{P}^{\mathbf{X}} }[/math], и семейство статистических гипотез [math]\displaystyle{ H_0,H_1,\ldots }[/math]. Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:
- [math]\displaystyle{ f: \mathbf{X} \to \{H_0,H_1,\ldots\} }[/math].
Таким образом, каждой реализации выборки [math]\displaystyle{ \mathbf{x} = (x_1,\ldots,x_n) }[/math] статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.
Виды критериев
Статистические критерии подразделяются на следующие категории:
- Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: [math]\displaystyle{ H_0: \quad a=a_0 }[/math] — нулевая гипотеза. [math]\displaystyle{ H_1: \quad a\gt a_0 \quad (a\lt a_0) }[/math] или [math]\displaystyle{ a\neq a_0 }[/math] — конкурирующая гипотеза.
- Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать как критерии значимости. Критериями согласия являются:
- Критерий Пирсона
- Критерий Колмогорова
- Критерий Андерсона — Дарлинга
- Критерий Крамера — Мизеса — Смирнова
- Критерий согласия Купера
- Z-тест
- Тест Харке — Бера
- Критерий Шапиро — Уилка
- График нормальности — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.
- Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (то есть проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном анализе для определения наличия зависимостей.
Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.
Непараметрические критерии
Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.
- Q-критерий Розенбаума
- U-критерий Манна — Уитни
- Критерий Уилкоксона
- Критерий Пирсона
- Критерий Колмогорова — Смирнова
- Критерий Вальда-Вольфовица
Параметрические критерии
Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).
- t-критерий Стьюдента
- Критерий Фишера
- Критерий отношения правдоподобия
- Критерий Романовского
Пример статистического критерия
Пусть дана независимая выборка [math]\displaystyle{ \mathbf{X} = (X_1,\ldots,X_n)^{\top} }[/math] из нормального распределения [math]\displaystyle{ \mathcal{N}(\mu,1), \ i=1,\ldots,n }[/math] (здесь [math]\displaystyle{ \mu }[/math] — неизвестный параметр). Пусть имеется две простые гипотезы:
- [math]\displaystyle{ \begin{matrix} H_0: & \mu = 0, \\ H_1: & \mu = 1. \end{matrix} }[/math]
Тогда можно определить следующий статистический критерий:
- [math]\displaystyle{ f(x_1,\ldots,x_n) = \left\{ \begin{matrix} H_0, & \bar{x} \le 0.5 \\ H_1, & \bar{x} \gt 0.5, \end{matrix} \right. }[/math]
где [math]\displaystyle{ \bar{x} = \frac{1}{n}\sum\limits_{i=1}^n x_i }[/math] — выборочное среднее.
См. также
- Проверка статистических гипотез
- Статистическая значимость критерия
- Мощность критерия
- Ошибки первого и второго рода
- Факторный анализ
- Дисперсионный анализ
- Регрессионный анализ
- Ковариационный анализ
- Receiver operating characteristic
- Распределение частот
Литература
- Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. — М.: Госстандарт РФ, 2002. Электронная версия.
В статье не хватает ссылок на источники (см. также рекомендации по поиску). |