Доверительный интервал

Довери́тельный интерва́л — термин, используемый в математической статистике при интервальной оценке статистических параметров, более предпочтительной при небольшом объёме выборки, чем точечная. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.

Доверительным называется интервал, в который попадают измеренные в эксперименте значения, соответствующие доверительной вероятности^[1].

Метод доверительных интервалов разработал американский статистик Ежи Нейман, исходя из идей английского статистика Рональда Фишера^{[ссылка 1]}.

Определение

Доверительным интервалом параметра [math]\displaystyle{ \theta }[/math] распределения случайной величины [math]\displaystyle{ X }[/math] с уровнем доверия [math]\displaystyle{ p }[/math]^{[примечание 1]}, порождённым выборкой [math]\displaystyle{ (x_1,\ldots,x_n) }[/math], называется интервал с границами [math]\displaystyle{ l(x_1,\ldots,x_n) }[/math] и [math]\displaystyle{ u(x_1,\ldots,x_n) }[/math], которые являются реализациями случайных величин [math]\displaystyle{ L(X_1,\ldots,X_n) }[/math] и [math]\displaystyle{ U(X_1,\ldots,X_n) }[/math], таких, что

[math]\displaystyle{ \mathbb{P}(L \leqslant \theta \leqslant U)=p }[/math].

Граничные точки доверительного интервала [math]\displaystyle{ l }[/math] и [math]\displaystyle{ u }[/math] называются доверительными пределами^[2].

Вероятность, с которой в условиях данного эксперимента полученные экспериментальные данные можно считать надежными (достоверными), называют доверительной вероятностью или надежностью. Величина доверительной вероятности определяется характером производимых измерений. При выполнении учебных лабораторных работ в курсе общей физики доверительная вероятность обычно считается равной 95 %.

Толкование доверительного интервала, основанное на интуиции, будет следующим: если уровень доверия [math]\displaystyle{ p }[/math] велик (скажем, 0,95 или 0,99), то доверительный интервал почти наверняка содержит истинное значение [math]\displaystyle{ \theta }[/math]^{[ссылка 2]}.

Еще одно истолкование понятия доверительного интервала: его можно рассматривать как интервал значений параметра [math]\displaystyle{ \theta }[/math], совместимых с опытными данными и не противоречащих им.

Более точное, хоть также не совсем строгое, толкование доверительного интервала с уровнем доверия, скажем, 95 %, состоит в следующем. Если провести очень большое количество независимых экспериментов с аналогичным построением доверительного интервала, то в 95 % экспериментов доверительный интервал будет содержать оцениваемый параметр [math]\displaystyle{ \theta }[/math] (то есть будет выполняться [math]\displaystyle{ L \leqslant \theta \leqslant U }[/math]), а в оставшихся 5 % экспериментов доверительный интервал не будет содержать [math]\displaystyle{ \theta }[/math].

Примеры

Байесовский доверительный интервал

В байесовской статистике существует схожее, но отличающееся в некоторых ключевых деталях определение доверительного интервала^[англ.]. Здесь оцениваемый параметр [math]\displaystyle{ \theta }[/math] сам считается случайной величиной с некоторым заданным априорным распределением (в простейшем случае — равномерным), а выборка [math]\displaystyle{ X }[/math] фиксирована (в классической статистике всё в точности наоборот). Байесовский [math]\displaystyle{ p }[/math]-доверительный интервал — это интервал [math]\displaystyle{ [L, U] }[/math], покрывающий значение параметра [math]\displaystyle{ \theta }[/math] с апостериорной вероятностью [math]\displaystyle{ p }[/math]:

[math]\displaystyle{ \mathbb{P}(L \leqslant \theta \leqslant U | X) = p }[/math].

Как правило, классический и байесовский доверительные интервалы различаются. В англоязычной литературе байесовский доверительный интервал принято называть термином credible interval, а классический — confidence interval.

См. также

Толерантный интервал

Примечания

↑ Кравченко Н. С., Ревинская О. Г. Методы обработки результатов измерений и оценки погрешностей в учебном лабораторном практикуме. — Томск: Издательство Томского политехнического университета, 2011. — С. 18. — 88 с. Архивная копия от 5 октября 2019 на Wayback Machine
↑ Закс, 1975, с. 635.

↑ величину, дополняющую доверительную вероятность до единицы, обычно обозначают [math]\displaystyle{ \alpha }[/math]

Источники

↑ Гмурман В. Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 9-е изд. — М.: Высшая школа, 2003. — 479 с. — ISBN 5-06-004214-6
↑ Справочник по прикладной статистике. В 2-х т. Т. 1: Пер. с англ. / Под ред. Э. Ллойда, У. Ледермана, Ю. Н. Тюрина. — М.: Финансы и статистика, 1989. — 510 с. — ISBN 5-279-00245-3 (Определение 4.2.1.; стр. 149.)

Литература

Ш. Закс. Теория статистических выводов. — М.: Мир, 1975. — 776 с.

[1] Кравченко Н. С., Ревинская О. Г. Методы обработки результатов измерений и оценки погрешностей в учебном лабораторном практикуме. — Томск: Издательство Томского политехнического университета, 2011. — С. 18. — 88 с. Архивная копия от 5 октября 2019 на Wayback Machine

[_cb26cbdf6ef0f3ec-4] Закс, 1975, с. 635.

[3] величину, дополняющую доверительную вероятность до единицы, обычно обозначают [math]\displaystyle{ \alpha }[/math]

[2] Гмурман В. Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 9-е изд. — М.: Высшая школа, 2003. — 479 с. — ISBN 5-06-004214-6

[5] Справочник по прикладной статистике. В 2-х т. Т. 1: Пер. с англ. / Под ред. Э. Ллойда, У. Ледермана, Ю. Н. Тюрина. — М.: Финансы и статистика, 1989. — 510 с. — ISBN 5-279-00245-3 (Определение 4.2.1.; стр. 149.)

[1]

[ссылка 1]

[примечание 1]

[2]

[ссылка 2]