分散とは
分散(variance)とは、確率変数の値が期待値のまわりでどの程度ばらついているかを表す指標です。
確率変数 \( X \) の分散は、次のように定義されます[1]分散を \( \mathrm{Var}(X) \) と表す場合もあります。。
\[
V[X] = E\bigl[(X-E[X])^2\bigr]
\]
この式は、「期待値からの偏差の二乗の期待値」を意味します。

期待値
期待値とは期待値(expected value)とは、確率変数の理論的な平均値を表します。離散型確率変数の期待値離散型確率変数 \( X \) がとりうる値を \( x \)、確率質量関数を \( p(x) = P(X = x) \) とす...
展開すると、次のように書けます。
\[
V[X] = E[X^2]-(E[X])^2
\]
この形は、実際の計算でよく用いられます。
標準偏差との関係
分散の平方根を標準偏差(standard deviation)と呼びます。分散が「ばらつきの2乗平均」であるのに対し、標準偏差は元の単位に戻した「ばらつきの平均的な大きさ」を表します。
\[
\sigma = \sqrt{V[X]}
\]
分散の公式
- 係数[2]「スケーリング性」と呼ばれる性質です。: \( V[aX] = a^2 V[X] \)
- 定数: \( V[c] = 0 \)
確率変数が独立でない場合も成り立つ公式
- 確率変数の和[3]\(\mathrm{Cov}(X, Y)\) は \(X, Y\) の共分散で、\(X, Y\) が独立な場合 \(\mathrm{Cov}(X, Y)=0\) です。: \( V[X + Y] = V[X] + V[Y] + 2\,\mathrm{Cov}(X, Y) \)
- 確率変数の積: \(
V[XY] = E[X^2]E[Y^2]-(E[X]E[Y])^2 \\
\qquad \qquad \qquad + 2\,E[X]E[Y]\mathrm{Cov}(X, Y) + (\mathrm{Cov}(X, Y))^2
\) - 確率変数の和[4]「加法性」と呼ばれる性質です。: \( V[X + Y] = V[X] + V[Y] \)
- 確率変数の積: \( V[XY] = E[X^2]E[Y^2]-(E[X]E[Y])^2 \)