Доверительный интервал
Довери́тельный интерва́л — термин, используемый в математической статистике при интервальной оценке статистических параметров, более предпочтительной при небольшом объёме выборки, чем точечная. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
Доверительным называется интервал, в который попадают измеренные в эксперименте значения, соответствующие доверительной вероятности[1].
Метод доверительных интервалов разработал американский статистик Ежи Нейман, исходя из идей английского статистика Рональда Фишера[ссылка 1].
Определение
Доверительным интервалом параметра [math]\displaystyle{ \theta }[/math] распределения случайной величины [math]\displaystyle{ X }[/math] с уровнем доверия [math]\displaystyle{ p }[/math][примечание 1], порождённым выборкой [math]\displaystyle{ (x_1,\ldots,x_n) }[/math], называется интервал с границами [math]\displaystyle{ l(x_1,\ldots,x_n) }[/math] и [math]\displaystyle{ u(x_1,\ldots,x_n) }[/math], которые являются реализациями случайных величин [math]\displaystyle{ L(X_1,\ldots,X_n) }[/math] и [math]\displaystyle{ U(X_1,\ldots,X_n) }[/math], таких, что
- [math]\displaystyle{ \mathbb{P}(L \leqslant \theta \leqslant U)=p }[/math].
Граничные точки доверительного интервала [math]\displaystyle{ l }[/math] и [math]\displaystyle{ u }[/math] называются доверительными пределами[2].
Вероятность, с которой в условиях данного эксперимента полученные экспериментальные данные можно считать надежными (достоверными), называют доверительной вероятностью или надежностью. Величина доверительной вероятности определяется характером производимых измерений. При выполнении учебных лабораторных работ в курсе общей физики доверительная вероятность обычно считается равной 95 %.
Толкование доверительного интервала, основанное на интуиции, будет следующим: если уровень доверия [math]\displaystyle{ p }[/math] велик (скажем, 0,95 или 0,99), то доверительный интервал почти наверняка содержит истинное значение [math]\displaystyle{ \theta }[/math][ссылка 2].
Еще одно истолкование понятия доверительного интервала: его можно рассматривать как интервал значений параметра [math]\displaystyle{ \theta }[/math], совместимых с опытными данными и не противоречащих им.
Более точное, хоть также не совсем строгое, толкование доверительного интервала с уровнем доверия, скажем, 95 %, состоит в следующем. Если провести очень большое количество независимых экспериментов с аналогичным построением доверительного интервала, то в 95 % экспериментов доверительный интервал будет содержать оцениваемый параметр [math]\displaystyle{ \theta }[/math] (то есть будет выполняться [math]\displaystyle{ L \leqslant \theta \leqslant U }[/math]), а в оставшихся 5 % экспериментов доверительный интервал не будет содержать [math]\displaystyle{ \theta }[/math].
Примеры
- Доверительный интервал для математического ожидания нормальной выборки.
- Доверительный интервал для дисперсии нормальной выборки.
Байесовский доверительный интервал
В байесовской статистике существует схожее, но отличающееся в некоторых ключевых деталях определение доверительного интервала[англ.]. Здесь оцениваемый параметр [math]\displaystyle{ \theta }[/math] сам считается случайной величиной с некоторым заданным априорным распределением (в простейшем случае — равномерным), а выборка [math]\displaystyle{ X }[/math] фиксирована (в классической статистике всё в точности наоборот). Байесовский [math]\displaystyle{ p }[/math]-доверительный интервал — это интервал [math]\displaystyle{ [L, U] }[/math], покрывающий значение параметра [math]\displaystyle{ \theta }[/math] с апостериорной вероятностью [math]\displaystyle{ p }[/math]:
- [math]\displaystyle{ \mathbb{P}(L \leqslant \theta \leqslant U | X) = p }[/math].
Как правило, классический и байесовский доверительные интервалы различаются. В англоязычной литературе байесовский доверительный интервал принято называть термином credible interval, а классический — confidence interval.
См. также
Примечания
- ↑ Кравченко Н. С., Ревинская О. Г. Методы обработки результатов измерений и оценки погрешностей в учебном лабораторном практикуме. — Томск: Издательство Томского политехнического университета, 2011. — С. 18. — 88 с. Архивная копия от 5 октября 2019 на Wayback Machine
- ↑ Закс, 1975, с. 635.
- ↑ величину, дополняющую доверительную вероятность до единицы, обычно обозначают [math]\displaystyle{ \alpha }[/math]
- Источники
- ↑ Гмурман В. Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 9-е изд. — М.: Высшая школа, 2003. — 479 с. — ISBN 5-06-004214-6
- ↑ Справочник по прикладной статистике. В 2-х т. Т. 1: Пер. с англ. / Под ред. Э. Ллойда, У. Ледермана, Ю. Н. Тюрина. — М.: Финансы и статистика, 1989. — 510 с. — ISBN 5-279-00245-3 (Определение 4.2.1.; стр. 149.)
Литература
- Ш. Закс. Теория статистических выводов. — М.: Мир, 1975. — 776 с.
В статье не хватает ссылок на источники (см. также рекомендации по поиску). |