Перейти к содержанию

Последовательный статистический критерий

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Последовательный статистический критерий — последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе.

Пусть наблюдению в статистическом эксперименте доступна случайная величина [math]\displaystyle{ \displaystyle X }[/math] с неизвестным (полностью или частично) распределением [math]\displaystyle{ \mathbb P }[/math] (формально, в математической нотации, [math]\displaystyle{ X:\Omega\mapsto \mathbb R }[/math], где вероятностное пространство [math]\displaystyle{ \Omega }[/math] снабжено [math]\displaystyle{ \sigma }[/math]-алгеброй событий [math]\displaystyle{ \mathcal F }[/math], и [math]\displaystyle{ \displaystyle X }[/math] измерима относительно Борелевской [math]\displaystyle{ \sigma }[/math]-алгебры).

Пусть проверяется нулевая гипотеза [math]\displaystyle{ H_0:\, \mathbb P\in \mathcal P_0 }[/math] против альтернативы [math]\displaystyle{ H_1:\, \mathbb P\in \mathcal P_1 }[/math].

На каждом этапе [math]\displaystyle{ i\geq 1 }[/math] статистического эксперимента, независимо от других этапов, наблюдается случайная величина [math]\displaystyle{ \displaystyle X_i }[/math] — копия [math]\displaystyle{ \displaystyle X }[/math], до тех пор пока [math]\displaystyle{ i\leq \nu }[/math], где [math]\displaystyle{ \displaystyle\nu }[/math] — некоторый (случайный) момент остановки. Последовательный статистический критерий — это пара [math]\displaystyle{ (\nu,\delta) }[/math], где [math]\displaystyle{ \displaystyle \delta }[/math] — любая функция от [math]\displaystyle{ (X_1,\dots,X_\nu) }[/math], принимающая значение 0 или 1 (решение, соответственно, в пользу нулевой [math]\displaystyle{ H_0 }[/math] или альтернативной [math]\displaystyle{ H_1 }[/math] гипотезы).

Этому определению может быть придан формальный смысл с помощью понятия момента остановки относительно последовательности [math]\displaystyle{ \sigma }[/math]-алгебр [math]\displaystyle{ \mathcal F_n=\sigma(X_1,X_2,\dots X_n) }[/math], порожденных случайными величинами [math]\displaystyle{ X_1,X_2,\dots X_n }[/math], [math]\displaystyle{ n=1,2,\dots }[/math]. Тогда решающая функция [math]\displaystyle{ \displaystyle \delta }[/math] должна быть измеримой относительно [math]\displaystyle{ \sigma }[/math]-алгебры [math]\displaystyle{ \mathcal F_\nu }[/math] событий, предшествующих моменту [math]\displaystyle{ \nu }[/math]: [math]\displaystyle{ \mathcal F_\nu=\{A\in \mathcal F:A\cap\{\nu\leq n\}\in\mathcal F_n\} }[/math].

Функция мощности критерия [math]\displaystyle{ (\nu,\delta) }[/math] в "точке" [math]\displaystyle{ \mathbb P }[/math] определяется как [math]\displaystyle{ \beta(\mathbb P;\nu,\delta)=\mathbb P(\delta=1) }[/math]. Если [math]\displaystyle{ \mathbb P\in\mathcal P_0 }[/math], то [math]\displaystyle{ \beta(\mathbb P;\nu,\delta) }[/math] называется вероятностью ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она верна). Если [math]\displaystyle{ \mathbb P\in\mathcal P_1 }[/math], то [math]\displaystyle{ \mathbb P(\delta=0) }[/math] называется вероятностью ошибки второго рода (вероятность принять нулевую гипотезу, когда она неверна).

Рандомизированные последовательные критерии

Рандомизированный последовательный критерий проверки гипотез может быть определен как пара [math]\displaystyle{ \displaystyle(\psi,\phi) }[/math], где [math]\displaystyle{ \psi=(\psi_1,\psi_2,\dots,) }[/math], [math]\displaystyle{ \phi=(\phi_1,\phi_2,\dots,) }[/math], и [math]\displaystyle{ \psi_n=\psi_n(X_1,\dots,X_n) }[/math], [math]\displaystyle{ \phi_n=\phi_n(X_1,\dots,X_n) }[/math] - (измеримые) функции, принимающие значения между 0 и 1, [math]\displaystyle{ n=1,2,\dots }[/math]. На каждом этапе [math]\displaystyle{ n\geq 1 }[/math] (если эксперимент до него дошел) [math]\displaystyle{ \psi_n(X_1,\dots,X_n) }[/math] интерпретируется как вероятность остановится на этом этапе, без проведения дальнейших наблюдений, а [math]\displaystyle{ \phi_n(X_1,\dots,X_n) }[/math] - как вероятность отвергнуть нулевую гипотезу, если остановка на этом этапе произошла.

[math]\displaystyle{ \psi=(\psi_1,\psi_2,\dots,) }[/math] называется рандомизированным правилом остановки, а [math]\displaystyle{ \phi=(\phi_1,\phi_2,\dots,) }[/math] - рандомизированным правилом принятия решения.

Если все [math]\displaystyle{ \displaystyle\psi_n }[/math] принимают только значения 0 (продолжение наблюдений) и 1 (остановка), то правило остановки [math]\displaystyle{ \displaystyle\psi }[/math] определяет нерандомизированный момент остановки [math]\displaystyle{ \nu=\min\{n:\psi_n(X_1,\dots,X_n)=1\} }[/math]. Аналогично, если все [math]\displaystyle{ \displaystyle\phi_n }[/math] принимают только значения 0 (принятие нулевой гипотезы) и 1 (отвержение нулевой гипотезы), то правило принятия решения [math]\displaystyle{ \displaystyle\phi }[/math] определяет нерандомизированную решающую функцию: [math]\displaystyle{ \displaystyle\delta=\phi_n }[/math], если [math]\displaystyle{ \displaystyle\psi_n=1 }[/math].

Функция мощности критерия [math]\displaystyle{ (\psi,\phi) }[/math] в "точке" [math]\displaystyle{ \mathbb P }[/math] определяется как [math]\displaystyle{ \beta(\mathbb P;\psi,\phi)=\sum_{i=1}^\infty\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i\phi_i }[/math], где [math]\displaystyle{ \mathbb E }[/math] - математическое ожидание относительно [math]\displaystyle{ \mathbb P }[/math]. Если [math]\displaystyle{ \mathbb P\in \mathcal P_0 }[/math], то [math]\displaystyle{ \beta(\mathbb P;\psi,\phi) }[/math] - вероятность ошибки первого рода. Если [math]\displaystyle{ \mathbb P\in \mathcal P_1 }[/math], то вероятность ошибки второго рода равна [math]\displaystyle{ \mathbb P(\nu\lt \infty)-\beta(\mathbb P;\psi,\phi) }[/math], где [math]\displaystyle{ \mathbb P(\nu\lt \infty)=\sum_{i=1}^\infty\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i }[/math]. Соответственно, средний объем выборки при использовании правила остановки [math]\displaystyle{ \psi }[/math] определяется как [math]\displaystyle{ E\nu=\sum_{i=1}^\infty i\mathbb E(1-\psi_1)\dots(1-\psi_{i-1})\psi_i }[/math], если [math]\displaystyle{ \mathbb P(\nu\lt \infty)=1 }[/math] (в противном случае [math]\displaystyle{ E\nu=\infty }[/math]).

Пример

Последовательный критерий отношения вероятностей (критерий Вальда)

Ссылки

  • Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки — М.: Наука, 1976.
  • Ghosh, M., Mukhopadhyay, N., and Sen, P.K. Sequential Estimation, New York: Wiley, 1997.