Модель упорядоченного выбора

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Модель упорядоченного выбора (упорядоченная регрессия, англ. ordered choice) — применяемая в эконометрике модель с упорядоченной (с ранжированными значениями) дискретной зависимой переменной, в качестве которой могут выступать, например, оценки чего-либо по пятибалльной шкале, рейтинги компаний и т. д. В рамках данной модели предполагается, что количество значений зависимой переменной конечно.

Сущность модели

Пусть [math]\displaystyle{ y }[/math] — наблюдаемая дискретная переменная с [math]\displaystyle{ q }[/math] возможными упорядоченными значениями, которые для упрощения можно принять равными целым числам от [math]\displaystyle{ 0 }[/math] до [math]\displaystyle{ q-1 }[/math] (или от [math]\displaystyle{ 1 }[/math] до [math]\displaystyle{ q }[/math]). Пусть также [math]\displaystyle{ x }[/math]-вектор факторов, влияющих на значение зависимой переменной. Предполагается, что существует «обычная» (недискретная) скрытая переменная [math]\displaystyle{ y^* }[/math], также зависящая от этих факторов, в зависимости от значений которой зависимая переменная принимает те или иные значения. Соответственно необходимо определить (их можно либо задать априорно, либо оценить вместе с другими параметрами модели) несколько пороговых значений скрытой переменной следующим образом:

[math]\displaystyle{ y= \begin{cases} 1, y^*\leqslant c_1\\ 2, c_1 \lt y^*\leqslant c_2\\ 3, c_2 \lt y^*\leqslant c_3\\ ...\\ q, y^*\gt c_{q-1} \end{cases} }[/math]

Соответственно, если обозначить [math]\displaystyle{ p_i=P(y=i|X=x) }[/math], [math]\displaystyle{ i=1...q }[/math], то

[math]\displaystyle{ p_i =P(c_{i-1} \lt y^*\leqslant c_i) }[/math].

где [math]\displaystyle{ c_0=-\infty }[/math], [math]\displaystyle{ c_q=\infty }[/math].

Для скрытой переменной предполагается обычная линейная модель регрессии по факторам модели: [math]\displaystyle{ y^*=x^Tb+\varepsilon }[/math]. Обозначим интегральную функцию распределения случайной ошибки этой модели через [math]\displaystyle{ F }[/math]. Тогда

[math]\displaystyle{ p_i =P(c_{i-1} \lt y^*\leqslant c_i)=P(c_{i-1}- x^Tb\lt \varepsilon \leqslant c_i-x^Tb)=F(c_i-x^Tb)-F(c_{i-1}-x^Tb) }[/math]

С учетом того, что [math]\displaystyle{ F(c_0-x^Tb)=0 }[/math], [math]\displaystyle{ F(c_q-x^Tb)=1 }[/math] фактически модель упорядоченного выбора можно записать следующим образом:

[math]\displaystyle{ \begin{cases} p_1=F(c_1-x^Tb)\\ p_2= F(c_2-x^Tb)-F(c_1-x^Tb)\\ p_3= F(c_3-x^Tb)-F(c_2-x^Tb)\\ ...\\ p_q=1-F(c_{q-1}-x^Tb) \end{cases} }[/math]

В качестве распределения [math]\displaystyle{ F }[/math] обычно используют либо нормальное распределение (упорядоченный пробит), либо логистическое распределение (упорядоченный логит)

Оценка параметров

Оценка параметров модели (включая пороговые значения) производится обычно методом максимального правдоподобия. Логарифмическая функция правдоподобия равна:

[math]\displaystyle{ l(b,c)=\sum^q_{i=1}\sum_{\forall t , y_t=i}\ln p_i(x_t) }[/math]

Максимизация этой функции по неизвестным параметрам b и c и позволяет найти соответствующие оценки ММП.

См. также