Дисперсия случайной величины
Надстрочный текст
Диспе́рсия случа́йной величины́ (en:variance) — мера разброса значений случайной величины относительно её математического ожидания. Обозначается [math]\displaystyle{ D[X] }[/math] в русской литературе и [math]\displaystyle{ \operatorname{Var}(X) }[/math] (англ. variance) в зарубежной. В статистике часто употребляется обозначение [math]\displaystyle{ \sigma_X^2 }[/math] или [math]\displaystyle{ \displaystyle \sigma^2 }[/math].
Квадратный корень из дисперсии, равный [math]\displaystyle{ \displaystyle \sigma }[/math], называется среднеквадратическим отклонением, стандартным отклонением или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах, что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.
Из неравенства Чебышёва следует, что вероятность того, что значения случайной величины отстоят от математического ожидания этой случайной величины более чем на [math]\displaystyle{ k }[/math] стандартных отклонений, составляет менее [math]\displaystyle{ 1/k^2 }[/math]. В специальных случаях оценка может быть усилена. Так, например, как минимум в 95 % случаев значения случайной величины, имеющей нормальное распределение, удалены от её среднего не более чем на два стандартных отклонения, а в примерно 99,7 % — не более чем на три.
Определение
Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
Пусть [math]\displaystyle{ X }[/math] — случайная величина, определённая на некотором вероятностном пространстве. Тогда дисперсией называется
- [math]\displaystyle{ \displaystyle \sigma^2 = D[X] = \mathbb{E}\left[\big(X - \mathbb{E}[X]\big)^2\right], }[/math]
где символ [math]\displaystyle{ \mathbb{E} }[/math] обозначает математическое ожидание[1][2].
Замечания
- Если случайная величина [math]\displaystyle{ X }[/math] дискретная, то
- [math]\displaystyle{ D[X] = \sum^{n}_{i=1} {p_i (x_i-\mathbb{E}[X])^2}, }[/math]
- [math]\displaystyle{ D[X] = \frac{1}{2}\sum^{n}_{i=1} \sum^{n}_{j=1}{p_ip_j (x_i-x_j)^2} = \sum^{n}_{i=1} \sum^{n}_{j=i+1}{p_ip_j (x_i-x_j)^2}, }[/math]
где [math]\displaystyle{ x_i }[/math] — [math]\displaystyle{ i }[/math]-ое значение случайной величины, [math]\displaystyle{ p_i=P(X=x_i) }[/math] — вероятность того, что случайная величина принимает значение [math]\displaystyle{ x_i }[/math], [math]\displaystyle{ n }[/math] — количество значений, которые принимает случайная величина.
Пусть [math]\displaystyle{ Y }[/math] - случайная величина, независимая от [math]\displaystyle{ X }[/math], но с тем же самым распределением. Тогда [math]\displaystyle{ P(Y=x_i)=p_i }[/math], [math]\displaystyle{ \mathbb{E}[Y]=\mathbb{E}[X] }[/math], [math]\displaystyle{ D[Y]=D[X] }[/math] и
- [math]\displaystyle{ D[X-Y] = D[X] + D[Y] = 2D[X] }[/math]
- [math]\displaystyle{ D[X-Y] = \mathbb{E}[(X-Y)^2] - \mathbb{E}[X-Y]^2 = \mathbb{E}[(X-Y)^2] = \sum_{i=1}^n \sum_{j=1}^n p_i p_j (x_i - x_j)^2 }[/math]
Сопоставляя две эти формулы, получаем нужное равенство.
- Если случайная величина [math]\displaystyle{ X }[/math] непрерывна, то:
- [math]\displaystyle{ D[X] = \int\limits^{+\infty}_{-\infty} {(x-\mathbb{E}[X])^2f(x)dx} }[/math]
- [math]\displaystyle{ D[X] = \frac{1}{2}\int\limits^{+\infty}_{-\infty}\int\limits^{+\infty}_{-\infty} (x_2-x_1)^2{f(x_1)f(x_2)dx_1dx_2} }[/math],
где [math]\displaystyle{ f(x) }[/math] — плотность вероятности случайной величины.
- В силу линейности математического ожидания справедлива формула:
- [math]\displaystyle{ D[X] = \mathbb{E}[X^2] - \left(\mathbb{E}[X]\right)^2 }[/math]
- Дисперсия является вторым центральным моментом случайной величины.
- Дисперсия может быть бесконечной.
- Дисперсия может быть вычислена с помощью производящей функции моментов [math]\displaystyle{ U(t) }[/math]:
- [math]\displaystyle{ D[X] = \mathbb{E}[X^2] - \left(\mathbb{E}[X]\right)^2 = U''(0) - \left(U'(0)\right)^2. }[/math]
- Дисперсия целочисленной случайной величины может быть вычислена с помощью производящей функции последовательности.
- Формула для вычисления смещённой оценки дисперсии случайной величины [math]\displaystyle{ X }[/math] по последовательности реализаций этой случайной величины: [math]\displaystyle{ X_1... X_n }[/math] имеет вид:
- [math]\displaystyle{ {\overline S}^2=\frac{1}{n}\sum\limits_{i=1}^n(X_i - \overline X)^2 }[/math], где [math]\displaystyle{ {\overline X}=\frac{1}{n} \sum\limits_{i=1}^n X_i }[/math] — выборочное среднее (несмещённая оценка [math]\displaystyle{ \mathbb{E}[X] }[/math]).
- Для получения несмещённой оценки дисперсии случайной величины значение [math]\displaystyle{ {\overline S}^2 }[/math] необходимо умножить на [math]\displaystyle{ \frac{n}{n - 1} }[/math]. Несмещённая оценка имеет вид:
- [math]\displaystyle{ \widetilde{S}^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar X)^2 }[/math]
Свойства
- Дисперсия любой случайной величины неотрицательна: [math]\displaystyle{ D[X] \geqslant 0; }[/math]
- Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;
- Если случайная величина равна константе, то её дисперсия равна нулю: [math]\displaystyle{ D[a] = 0. }[/math] Верно и обратное: если [math]\displaystyle{ D[X]=0, }[/math] то [math]\displaystyle{ X = \mathbb{E}[X] }[/math] почти всюду.
- Дисперсия суммы двух случайных величин равна:
- [math]\displaystyle{ D[X + Y] = D[X] + D[Y] + 2\,\text{cov}(X, Y) }[/math], где [math]\displaystyle{ \text{cov}(X, Y) }[/math] — их ковариация.
- Для дисперсии произвольной линейной комбинации нескольких случайных величин имеет место равенство:
- [math]\displaystyle{ D\left[\sum_{i=1}^n c_i X_i\right] = \sum_{i=1}^n c_i^2 D[X_i] + 2 \sum_{1 \leqslant i \lt j \leqslant n} c_i c_j\, \text{cov}(X_i, X_j) }[/math], где [math]\displaystyle{ c_i \in \R }[/math].
- В частности, [math]\displaystyle{ D[X_1 + \ldots + X_n] = D[X_1] + \ldots + D[X_n] }[/math] для любых независимых или некоррелированных случайных величин, так как их ковариации равны нулю.
- [math]\displaystyle{ D\left[aX\right] = a^2D[X] }[/math]
- [math]\displaystyle{ D\left[-X\right] = D[X] }[/math]
- [math]\displaystyle{ D\left[X+b\right] = D[X] }[/math]
- Если [math]\displaystyle{ X = X(\omega, \tau) }[/math] — случайная величина от пары элементарных событий (случайная величина на декартовом произведении вероятностных пространств), то
- [math]\displaystyle{ D_{(\omega,\tau)}[X] = \mathbb{E}_{\omega}[D_{\tau}[X]] + D_{\omega}[\mathbb{E}_{\tau}[X]] }[/math]
Условная дисперсия
Наряду с условным математическим ожиданием [math]\displaystyle{ \mathbb{E}[X|Y] }[/math] в теории случайных процессов используется условная дисперсия случайных величин [math]\displaystyle{ D[X|Y] }[/math].
Условной дисперсией случайной величины [math]\displaystyle{ X }[/math] относительно случайной величины [math]\displaystyle{ Y }[/math] называется случайная величина:
- [math]\displaystyle{ D[X|Y] = \mathbb{E}[(X-\mathbb{E}[X|Y])^2|Y] = \mathbb{E}[X^2|Y] - \mathbb{E}[X|Y]^2 }[/math].
Её свойства:
- условная дисперсия относительно случайной величины [math]\displaystyle{ Y }[/math] является Y-измеримой случайной величиной (то есть измерима относительно сигма-алгебры, порождённой случайной величиной [math]\displaystyle{ Y }[/math]);
- условная дисперсия неотрицательна: [math]\displaystyle{ D[X|Y]\geqslant 0 }[/math];
- условная дисперсия [math]\displaystyle{ D[X|Y] }[/math] равна нулю тогда и только тогда, когда [math]\displaystyle{ X = \mathbb{E}[X|Y] }[/math] почти наверное, то есть тогда и только тогда, когда [math]\displaystyle{ X }[/math] совпадает почти наверное с некоторой Y-измеримой величиной (а именно, с [math]\displaystyle{ \mathbb{E}[X|Y] }[/math]);
- обычная дисперсия также может быть представлена как условная: [math]\displaystyle{ D[X] = D[X|1] }[/math];
- если величины [math]\displaystyle{ X }[/math] и [math]\displaystyle{ Y }[/math] независимы, случайная величина [math]\displaystyle{ D[X|Y] }[/math] является константой, равной [math]\displaystyle{ D[X] }[/math];
- если [math]\displaystyle{ X, Y }[/math] — две числовые случайные величины, то
- [math]\displaystyle{ D[X] = \mathbb{E}[D[X|Y]] + D[\mathbb{E}[X|Y]], }[/math]
- откуда, в частности, следует, что дисперсия условного математического ожидания [math]\displaystyle{ \mathbb{E}[X|Y] }[/math] всегда меньше или равна дисперсии исходной случайной величины [math]\displaystyle{ X }[/math].
Пример
Пусть случайная величина [math]\displaystyle{ \displaystyle X }[/math] имеет стандартное непрерывное равномерное распределение на [math]\displaystyle{ \displaystyle [0,1] }[/math], то есть её плотность вероятности задана равенством
- [math]\displaystyle{ f_X(x) = \left\{ \begin{matrix} 1, & x\in [0,1] \\ 0, & x \not\in [0,1]. \end{matrix} \right. }[/math]
Тогда математическое ожидание квадрата случайной величины равно
- [math]\displaystyle{ \mathbb{E}\left[X^2\right] = \int\limits_0^1\!x^2\, dx = \left. \frac{x^3}{3}\right\vert_0^1 = \frac{1}{3} }[/math],
и математическое ожидание случайной величины равно
- [math]\displaystyle{ \mathbb{E}\left[X\right] = \int\limits_0^1\! x\, dx = \left. \frac{x^2}{2}\right\vert_0^1 = \frac{1}{2} }[/math]
Дисперсия случайной величины равна
- [math]\displaystyle{ D[X] = \mathbb{E}\left[X^2\right] - (\mathbb{E}[X])^2 = \frac{1}{3} - \left(\frac{1}{2}\right)^2 = \frac{1}{12} }[/math]
См. также
- Среднеквадратическое отклонение
- Моменты случайной величины
- Ковариация
- Выборочная дисперсия
- Независимость (теория вероятностей)
- Скедастичность
- Абсолютное отклонение
- Дельта-метод
Примечания
- ↑ Колмогоров А. Н. Глава IV. Математические ожидания; §3. Неравенство Чебышева // Основные понятия теории вероятностей. — 2-е изд. — М.: Наука, 1974. — С. 63—65. — 120 с.
- ↑ Боровков А. А. Глава 4. Числовые характеристики случайных величин; §5. Дисперсия // Теория вероятностей. — 5-е изд. — М.: Либроком, 2009. — С. 93—94. — 656 с.
Литература
- ГОСТ Р 50779.10-2000 (ИСО 3534-1-93) Группа Т59 ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ Статистические методы ВЕРОЯТНОСТЬ И ОСНОВЫ СТАТИСТИКИ Термины и определения Statistical methods. Probability and general statistical terms. Terms and definitions ОКС 01.040.03 03.120.30 ОКСТУ 0011
- Гурский Д., Турбина Е. Mathcad для студентов и школьников. Популярный самоучитель. — СПб.: Питер, 2005. — С. 340. — ISBN 5469005259.
- Орлов А. И. Дисперсия случайной величины // Математика случая: Вероятность и статистика — основные факты. — М.: МЗ-Пресс, 2004.