Перейти к содержанию

Критерий согласия Пирсона

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Критерий согласия Пирсона или критерий согласия [math]\displaystyle{ \chi^2 }[/math] (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки [math]\displaystyle{ x_1, x_2, ... , x_n }[/math] объёмом [math]\displaystyle{ n }[/math] некоторому теоретическому закону распределения [math]\displaystyle{ F(x,\theta) }[/math].

Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.

Критерий может использоваться при проверке простых гипотез вида

[math]\displaystyle{ H_0: F_n(x)=F(x,\theta) , }[/math]

где [math]\displaystyle{ \theta }[/math] — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

[math]\displaystyle{ H_0 : F_n(x) \in \left\{ F(x,\theta) , \theta \in \Theta \right\} , }[/math]

когда оценка [math]\displaystyle{ \hat \theta }[/math] скалярного или векторного параметра распределения [math]\displaystyle{ F(x,\theta) }[/math] вычисляется по той же самой выборке.

Статистика критерия

Процедура проверки гипотез с использованием критериев типа [math]\displaystyle{ \chi^2 }[/math] предусматривает группирование наблюдений. Область определения случайной величины разбивают на [math]\displaystyle{ k }[/math] непересекающихся интервалов граничными точками

[math]\displaystyle{ x_{(0)}, x_{(1)}, ... , x_{(k-1)}, x_{(k)} , }[/math]

где [math]\displaystyle{ x_{(0)} }[/math] — нижняя грань области определения случайной величины; [math]\displaystyle{ x_{(k)} }[/math] — верхняя грань.

В соответствии с заданным разбиением подсчитывают число [math]\displaystyle{ n_i }[/math] выборочных значений, попавших в [math]\displaystyle{ i }[/math]-й интервал, и вероятности попадания в интервал

[math]\displaystyle{ P_i (\theta )= F(x_{(i)},\theta)- F(x_{(i-1)},\theta) , }[/math]

соответствующие теоретическому закону с функцией распределения [math]\displaystyle{ F(x,\theta) . }[/math]

При этом

[math]\displaystyle{ n=\sum_{i=1} ^k n_i }[/math] и [math]\displaystyle{ \sum_{i=1} ^k P_i (\theta )=1 . }[/math]

При проверке простой гипотезы известны как вид закона [math]\displaystyle{ F(x,\theta) }[/math], так и все его параметры (известен скалярный или векторный параметр [math]\displaystyle{ \theta }[/math]).

В основе статистик, используемых в критериях согласия типа [math]\displaystyle{ \chi^2 }[/math], лежит измерение отклонений [math]\displaystyle{ n_i/n }[/math] от [math]\displaystyle{ P_i (\theta ) }[/math].

Статистика критерия согласия [math]\displaystyle{ \chi^2 }[/math] Пирсона определяется соотношением

[math]\displaystyle{ \chi^{2} = n\sum_{i=1}^{k} \frac {\left( n_i/n - P_i(\theta) \right)^2} {P_i(\theta)} . }[/math]

В случае проверки простой гипотезы, в пределе при [math]\displaystyle{ n \to \infty }[/math] эта статистика подчиняется [math]\displaystyle{ \chi_r^2 }[/math]-распределению с [math]\displaystyle{ r=k-1 }[/math] степенями свободы, если верна проверяемая гипотеза [math]\displaystyle{ H_0 }[/math]. Плотность [math]\displaystyle{ \chi_r^2 }[/math]-распределения, которое является частным случаем гамма-распределения, описывается формулой

[math]\displaystyle{ g(s) = \frac {1} {2^{r/2} \Gamma(r/2)} s^{r/2-1} e^{-s/2} . }[/math]

Проверяемая гипотеза [math]\displaystyle{ H_0 }[/math] отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики [math]\displaystyle{ \chi_n^{2} }[/math] больше критического значения [math]\displaystyle{ \chi_{r,\alpha}^2 , }[/math]

[math]\displaystyle{ P \left( \chi_n^2 \gt \chi_{r,\alpha}^2 \right) = \frac {1} {2^{r/2} \Gamma(r/2)} \int_{\chi_{r,\alpha}^2}^\infty s^{r/2-1} e^{-s/2} ds }[/math]

или достигнутый уровень значимости (p-значение) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) [math]\displaystyle{ \alpha }[/math].

Проверка сложных гипотез

При проверке сложных гипотез, если параметры закона [math]\displaystyle{ F(x,\theta) }[/math] по этой же выборке оцениваются в результате минимизации статистики [math]\displaystyle{ \chi_n^2 }[/math] или по сгруппированной выборке методом максимального правдоподобия, то статистика [math]\displaystyle{ \chi_n^2 }[/math] при справедливости проверяемой гипотезы подчиняется [math]\displaystyle{ \chi_r^2 }[/math]-распределению с [math]\displaystyle{ r=k-m-1 }[/math] степенями свободы, где [math]\displaystyle{ m }[/math] — количество оценённых по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться [math]\displaystyle{ \chi_{k-m-1}^{2} }[/math]-распределением[1]. Более того, распределения статистики при справедливости гипотезы [math]\displaystyle{ H_0 }[/math] будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы[2].

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа [math]\displaystyle{ \chi^2 }[/math][3][4][5][6].

О мощности критерия

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего [math]\displaystyle{ H_0 }[/math], близкие или далёкие от него законы. Если задать конкурирующую гипотезу [math]\displaystyle{ H_1 }[/math] и соответствующий ей некоторый конкурирующий закон [math]\displaystyle{ F_1(x,\theta) }[/math], то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы [math]\displaystyle{ H_0 }[/math] при её справедливости) и вероятности этой ошибки [math]\displaystyle{ \alpha }[/math], но и об ошибке 2-го рода (неотклонении [math]\displaystyle{ H_0 }[/math] при справедливости [math]\displaystyle{ H_1 }[/math]) и вероятности этой ошибки [math]\displaystyle{ \beta }[/math].

Мощность критерия по отношению к конкурирующей гипотезе [math]\displaystyle{ H_1 }[/math] характеризуется величиной [math]\displaystyle{ 1-\beta }[/math]. Критерий тем лучше распознаёт пару конкурирующих гипотез [math]\displaystyle{ H_0 }[/math] и [math]\displaystyle{ H_1 }[/math], чем выше его мощность.

Мощность критерия согласия [math]\displaystyle{ \chi^2 }[/math] Пирсона существенно зависит от способа группирования[7][8] и от выбранного числа интервалов[8][9].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия [math]\displaystyle{ \chi^2 }[/math] Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез[10][8][9].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия [math]\displaystyle{ \chi^2 }[/math] Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет[11][12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия[13].

См. также

Примечания

  1. Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in [math]\displaystyle{ \chi^2 }[/math] test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.
  2. Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик [math]\displaystyle{ \chi^2 }[/math] Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63. Архивировано 24 мая 2015 года.
  3. Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.
  4. Никулин М. С. О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.
  5. Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.
  6. Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.
  7. Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64. Архивировано 29 октября 2013 года.
  8. Перейти обратно: 8,0 8,1 8,2 Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с. Архивировано 30 сентября 2021 года.
  9. Перейти обратно: 9,0 9,1 Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа [math]\displaystyle{ \chi^2 }[/math] // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67. Архивировано 6 сентября 2007 года.
  10. Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.
  11. Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111. Архивировано 29 октября 2013 года.
  12. Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93. Архивировано 29 октября 2013 года.
  13. Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход. — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. Архивировано 29 октября 2013 года. — Раздел 4.9.

Литература

  • Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.

См. также

Ссылки