Тест Уайта

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Тест Уайта (англ. White test) — универсальная процедура тестирования гетероскедастичности случайных ошибок линейной регрессионной модели, не налагающая особых ограничений на структуру гетероскедастичности, предложенная Уайтом в 1980 г. Тест является асимптотическим.

Сущность и процедура теста

Пусть имеется линейная регрессия:

[math]\displaystyle{ y_t=x^T_tb+\varepsilon_t }[/math]

Необходимо проверить гетероскедастичность случайных ошибок модели [math]\displaystyle{ \varepsilon }[/math]. Тест использует остатки регрессии, оценённой с помощью обычного метода наименьших квадратов. Для теста оценивается (также обычным МНК) вспомогательная регрессия квадратов этих остатков на все регрессоры (включая константу, даже если её не было в исходной модели), их квадраты и попарные произведения:

[math]\displaystyle{ e^2_t=a_0+a^Tx_t+x^T_tAx_t+u_t }[/math]

[math]\displaystyle{ e_t }[/math] — остатки регрессии;

[math]\displaystyle{ x_t }[/math] — факторы исходной регрессии;

[math]\displaystyle{ a_0, a, A }[/math] — параметры вспомогательной регрессии — соответственно константа, вектор линейных коэффициентов и матрица коэффициентов при квадратах и попарных произведениях факторов.

[math]\displaystyle{ u_t }[/math]-случайная ошибка вспомогательной модели.

В данной записи без ограничения общности матрицу [math]\displaystyle{ A }[/math] можно считать треугольной. В другом варианте теста в модель не включаются попарные произведения, тогда матрица [math]\displaystyle{ A }[/math] - диагональная.

В тесте проверяется нулевая гипотеза об отсутствии гетероскедастичности (то есть ошибки модели предполагаются гомоскедастичными — с постоянной дисперсией). В таком случае вспомогательная регрессия должна быть незначимой. Для проверки этой гипотезы используется LM-статистика [math]\displaystyle{ LM=nR^2 }[/math], где [math]\displaystyle{ R^2 }[/math]коэффициент детерминации вспомогательной регрессии, [math]\displaystyle{ n }[/math]-количество наблюдений. При отсутствии гетероскедастичности данная статистика имеет асимптотическое распределение [math]\displaystyle{ \chi^2(N-1) }[/math], где [math]\displaystyle{ N }[/math] - количество параметров вспомогательной регрессии. Следовательно, если значение статистики больше критического значения этого распределения для заданного уровня значимости, то нулевая гипотеза отвергается, то есть имеется гетероскедастичность. В противном случае гетероскедастичность признаётся незначимой (случайные ошибки скорее всего гомоскедастичны).

Статистические программы часто кроме собственно статистики [math]\displaystyle{ nR^2 }[/math] выводят также и F-статистику для проверки аналогичной гипотезы, которая имеет асимптотическое распределение Фишера [math]\displaystyle{ F(N-1,n-N) }[/math]

См. также

Литература