Функция распределения

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
Функции распределения

Фу́нкция распределе́ния (en: distribution function of a random variable [math]\displaystyle{ X }[/math]; cumulative distribution function; cdf; fr:fonction de d’une variable [math]\displaystyle{ X }[/math]) в теории вероятностей — функция, характеризующая распределение случайной величины или случайного вектора; функция , задающая вероятность события [math]\displaystyle{ (-\infty,x] }[/math]. Полуинтервал [math]\displaystyle{ (-\infty,x] }[/math] представляет собой множество всех значений менее [math]\displaystyle{ x }[/math], включая [math]\displaystyle{ x }[/math].

При соблюдении известных условий (см. ниже) функция распределения полностью определяет случайную величину. Поэтому, используя функцию распределения мы можем найти функцию вероятности дискретной случайной величины.

Определение

Пусть дано вероятностное пространство [math]\displaystyle{ (\Omega,\mathcal{F},\mathbb{P}) }[/math], и на нём определена случайная величина [math]\displaystyle{ X }[/math] с распределением [math]\displaystyle{ \mathbb{P}^X }[/math]. Тогда функцией распределения случайной величины [math]\displaystyle{ X }[/math] называется функция [math]\displaystyle{ F_X\colon\mathbb{R} \to [0,1] }[/math], задаваемая формулой:

[math]\displaystyle{ F_X(x) = \mathbb{P}( X \leqslant x ) \equiv \mathbb{P}^X\left((-\infty, x]\right) }[/math].

То есть функцией распределения (вероятностей) случайной величины [math]\displaystyle{ X }[/math] называют функцию [math]\displaystyle{ F(x) }[/math], значение которой в точке [math]\displaystyle{ x }[/math] равно вероятности события [math]\displaystyle{ \{X \leqslant x\} }[/math], то есть события, состоящего только из тех элементарных исходов, для которых [math]\displaystyle{ X(\omega) \leqslant x }[/math].

Свойства

  • [math]\displaystyle{ F_X }[/math] непрерывна справа[1]:
    [math]\displaystyle{ \lim\limits_{\varepsilon \to 0+} F_X(x+\varepsilon) = F_X(x) }[/math]
  • [math]\displaystyle{ F_X }[/math] не убывает на всей числовой прямой.
  • [math]\displaystyle{ \lim\limits_{x \to -\infty} F_X(x) = 0 }[/math].
  • [math]\displaystyle{ \lim\limits_{x \to +\infty} F_X(x) = 1 }[/math].
  • Распределение случайной величины [math]\displaystyle{ \mathbb{P}^X }[/math] однозначно определяет функцию распределения.
    • Верно и обратное: если функция [math]\displaystyle{ F(x) }[/math] удовлетворяет четырём перечисленным выше свойствам, то существует вероятностное пространство и определённая на нём случайная величина, такая что [math]\displaystyle{ F(x) }[/math] является её функцией распределения.
  • По определению непрерывности справа, функция [math]\displaystyle{ F_X }[/math] имеет правый предел [math]\displaystyle{ F_X(x+) }[/math] в любой точке [math]\displaystyle{ x\in \mathbb{R} }[/math], и он совпадает со значением функции [math]\displaystyle{ F_X(x) }[/math] в этой точке.
    • В силу неубывания, функция [math]\displaystyle{ F_X }[/math] также имеет и левый предел [math]\displaystyle{ F_X(x-) }[/math] в любой точке [math]\displaystyle{ x\in \mathbb{R} }[/math], который может не совпадать со значением функции. Таким образом, функция [math]\displaystyle{ F_X }[/math] либо непрерывна в точке, либо имеет в ней разрыв первого рода.

Тождества

Из свойств вероятности следует, что [math]\displaystyle{ \forall x \in \mathbb{R},\; \forall a,b\in \mathbb{R} }[/math], таких что [math]\displaystyle{ a \lt b }[/math]:

  • [math]\displaystyle{ \mathbb{P}(X \gt x ) = 1 - F_X(x) }[/math];
  • [math]\displaystyle{ \mathbb{P}(X \lt x ) = F_X(x-) }[/math];
  • [math]\displaystyle{ \mathbb{P}(X \geqslant x ) = 1 - F_X(x-) }[/math];
  • [math]\displaystyle{ \mathbb{P}( X = x ) = F_X(x) - F_X(x-) }[/math];
  • [math]\displaystyle{ \mathbb{P}(a \lt X \leqslant b ) = F_X(b) - F_X(a) }[/math];
  • [math]\displaystyle{ \mathbb{P}(a \leqslant X \leqslant b) = F_X(b) - F_X(a-) }[/math];
  • [math]\displaystyle{ \mathbb{P}(a \lt X \lt b ) = F_X(b-) - F_X(a) }[/math];
  • [math]\displaystyle{ \mathbb{P}(a \leqslant X \lt b ) = F_X(b-) - F_X(a-) }[/math];

Примеры

Начинающий токарь вытачивает в день пять деталей. Пусть случайная величина [math]\displaystyle{ X }[/math] обозначает количество деталей выточенных с браком. Таким образом, случайная величина может приобретать значения [math]\displaystyle{ {0; 1; 2; 3; 4; 5} }[/math]. Предположим, что вероятности распределены следующим образом:

[math]\displaystyle{ P(X=0)=0,730; }[/math] [math]\displaystyle{ P(X=1)=0,150; }[/math] [math]\displaystyle{ P(X=2)=0,080; }[/math] [math]\displaystyle{ P(X=3)=0.021; }[/math] [math]\displaystyle{ P(X=4)=0,017; }[/math] [math]\displaystyle{ P(X=5)=0.002 }[/math]

Предположим, нам необходимо определить, какова вероятность, что начинающий токарь выточит две или меньше деталей с браком [math]\displaystyle{ (P(X \leqslant 2)= ?) }[/math]. Событие [math]\displaystyle{ X \leqslant 2 }[/math] это сумма случайных событий [math]\displaystyle{ X=0; X=1; X=2 }[/math]. Эти три события не пересекаются и взаимно исключают друг друга. Следовательно,

[math]\displaystyle{ P(X \leqslant 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,730 + 0,150 + 0,080 = 0,960 }[/math]

Таким образом, вероятность, что начинающий токарь допустит брак не больше чем в двух даталях составляет [math]\displaystyle{ 0,960 }[/math]. Или по другому, вероятность того, что токарь изготовит из пяти деталей три без брака - [math]\displaystyle{ 0,960 }[/math].

Вероятность, что начинающий токарь допустит брак не больше чем в одной датали составляет:

[math]\displaystyle{ P(X \leqslant 1) = P(X = 0) + P(X = 1) = 0,730 + 0,150 = 0,880 }[/math]

Зная функцию распределения для [math]\displaystyle{ P(X \leqslant 1) }[/math] и [math]\displaystyle{ P(X \leqslant 2) }[/math] мы можем найти функцию вероятности для дискретной случайной величины [math]\displaystyle{ X=2 }[/math], то есть определить вероятность того что токарь сделает две детали с браком

[math]\displaystyle{ P(X = 2) = P(X \leqslant 2) - P(X \leqslant 1) = 0,960-0,880 = 0,080 }[/math]

[math]\displaystyle{ F_X(x) = \begin{cases} 0 &:\ x \lt 0\\ 0,730 &:\ 0 \le x \lt 1\ (вероятность,\ что\ все\ детали\ будут\ без\ брака) \\ 0,880 &:\ 1 \le x \lt 2\ (вероятность,\ что\ брак\ будет\ не\ больше\ чем\ в\ одной\ детали)\\ 0,960 &:\ 2 \le x \lt 3\ (вероятность,\ что\ брак\ будет\ не\ больше\ чем\ в\ двух\ деталях)\\ 0,981 &:\ 3 \le x \lt 4\ (вероятность,\ что\ брак\ будет\ не\ больше\ чем\ в\ трех\ деталях)\\ 0,998 &:\ 4 \le x \lt 5\ (вероятность,\ что\ брак\ будет\ не\ больше\ чем\ в\ четырех\ деталях)\\ 1 &:\ 5 \le x\ (вероятность,\ что\ брак\ будет\ не\ больше\ чем\ в\ пяти\ деталях) \end{cases} }[/math]

Дискретные и непрерывные распределения

Является ли функция рапределения дискретной или непрерывной, зависит от того, является ли случайная величина, соответственно, дискретной или непрерывной. Такая связь функции распределения и случайно величины дает возможность определить непрерывную случайную величина через функцию распределения.

Случайная величина [math]\displaystyle{ X }[/math] является непрерывной если функция распределения [math]\displaystyle{ P(x) }[/math] для [math]\displaystyle{ x }[/math] является непрерывной. Случайная величина [math]\displaystyle{ X }[/math] является дискретной если функция распределения [math]\displaystyle{ P(x) }[/math] для [math]\displaystyle{ x }[/math] является дискретной.

Дискретные распределения

Если случайная величина [math]\displaystyle{ X }[/math] дискретна, то есть её распределение однозначно задаётся функцией вероятности

[math]\displaystyle{ \mathbb{P}(X = x_i) = p_i,\; i=1,2,\ldots }[/math],

то функция распределения [math]\displaystyle{ F_X }[/math] этой случайной величины кусочно-постоянна и может быть записана как:

[math]\displaystyle{ F_X(x) = \sum\limits_{i\colon x_i \leqslant x} p_i }[/math].

Эта функция непрерывна во всех точках [math]\displaystyle{ x\in \mathbb{R} }[/math], таких что [math]\displaystyle{ x \not= x_i,\; \forall i }[/math], и имеет разрыв первого рода в точках [math]\displaystyle{ x = x_i,\; \forall i }[/math].

Непрерывные распределения

Распределение [math]\displaystyle{ \mathbb{P}^X }[/math] называется непрерывным, если такова его функция распределения [math]\displaystyle{ F_X }[/math]. В этом случае:

[math]\displaystyle{ \mathbb{P}(X = x) = 0,\; \forall x \in \mathbb{R} }[/math],

и

[math]\displaystyle{ F_X(x-0) = F_X(x),\; \forall x \in \mathbb{R} }[/math],

а следовательно формулы имеют вид:

[math]\displaystyle{ \mathbb{P}(X \in |a,b|) = F_X(b) - F_X(a) }[/math],

где [math]\displaystyle{ |a,b| }[/math] означает любой интервал, открытый или закрытый, конечный или бесконечный.

Абсолютно непрерывные распределения

Распределение [math]\displaystyle{ \mathbb{P}^X }[/math] называется абсолютно непрерывным, если существует неотрицательная почти всюду (относительно меры Лебега) функция [math]\displaystyle{ f_X(x) }[/math], такая что:

[math]\displaystyle{ F_X(x) = \int\limits_{-\infty}^x\!f_X(t)\, dt }[/math].

Функция [math]\displaystyle{ f_X }[/math] называется плотностью распределения. Известно, что функция абсолютно непрерывного распределения непрерывна, и, более того, если [math]\displaystyle{ f_X \in C(\mathbb{R}) }[/math], то [math]\displaystyle{ F_X \in \mathcal{D}(\mathbb{R}) }[/math], и

[math]\displaystyle{ \frac{d}{dx}F_X(x) = f_X(x),\; \forall x \in \mathbb{R} }[/math].

Вариации и обобщения

Иногда в российской литературе берётся такое определение функции распределения:

[math]\displaystyle{ F_X(x) = \mathbb{P}( X \lt x ) \equiv \mathbb{P}^X\left((-\infty, x)\right) }[/math].

Определённая так функция распределения будет непрерывна слева, а не справа.

Многомерные функции распределения

Пусть [math]\displaystyle{ (\Omega,\mathcal{F},\mathbb{P}) }[/math] фиксированное вероятностное пространство, и [math]\displaystyle{ X=(X_1,\ldots,X_n)\colon\Omega \to \mathbb{R}^n }[/math] — случайный вектор. Тогда распределение [math]\displaystyle{ \mathbb{P}^X }[/math], называемое распределением случайного вектора [math]\displaystyle{ X }[/math] или совместным распределением случайных величин [math]\displaystyle{ X_1,\ldots,X_n }[/math], является вероятностной мерой на [math]\displaystyle{ \mathbb{R}^n }[/math]. Функция этого распределения [math]\displaystyle{ F_X\colon\mathbb{R}^n \to [0,1] }[/math] задаётся по определению следующим образом:

[math]\displaystyle{ F_X(x_1,\ldots,x_n) = \mathbb{P}(X_1 \leqslant x_1 ,\ldots, X_n \leqslant x_n) \equiv \mathbb{P}^X \left(\prod\limits_{i=1}^n (-\infty,x_i]\right) }[/math],

где [math]\displaystyle{ \prod }[/math] в данном случае обозначает декартово произведение множеств.

Свойства многомерных функций распределения аналогичны одномерному случаю. Также сохраняется взаимно-однозначное соответствие между распределениями на [math]\displaystyle{ \mathbb{R}^n }[/math] и многомерными функциями распределения. Однако, формулы для вычисления вероятностей существенно усложняются, и потому функции распределения редко используются для [math]\displaystyle{ n \gt 1 }[/math].

Литература

  • ГОСТ Р ИСО 3534-1-2019 Статистические методы. Словарь и условные обозначения. Часть 1. Общие статистические термины и термины, используемые в теории вероятностей

См. также

Примечания

  1. Ширяев, А. Н. Вероятность. — М.: Наука, 1980. — С. 45, 166.