母分散とは
確率変数 \(X\) の理論上の分散を、母分散(population variance)と呼びます。
\[
\sigma^2 = V[X] = E[(X-\mu)^2]
\]

標本分散とは
得られた標本 \( x_1, x_2, \dots, x_n \) を元に、次のようにして計算される値を標本分散(sample variance)と呼びます。
\[
s_n^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2
\]
ここで、\(\displaystyle \bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i\) は標本平均です。

標本分散は、データのばらつきを表す最も基本的な数値として、記述統計の立場で定義されました。[1]推測統計における母分散の最尤推定は、記述統計における標本分散に一致することが知られています。
不偏分散
母分散を推定するために標本分散を用いると平均的に小さく見積もられるため、不偏分散(unbiased variance)と呼ばれる次の補正値が用いられます。[2]推測統計において、不偏分散を標本分散と呼ぶ場合があり注意が必要です。
\[
s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2
\]
母分散と標本分散・不偏分散の関係
母平均 \(\mu\)、母分散 \(\sigma^2\) を持つ分布から独立に \(n\) 個の確率変数 \(X_1,\dots,X_n\) を取り出すとき、その標本平均および標本分散を次のように定義します。
\[
\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i,\quad
S_n^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^2
\]
標本分散の期待値は、期待値の線形性および分散の性質より次のように計算できます。
\[
\begin{aligned}
E[S_n^2]
&= E\!\left[\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^2\right] \\[6pt]
&= \frac{1}{n}\,E\!\left[\sum_{i=1}^{n}(X_i-\mu)^2-n(\bar{X}-\mu)^2\right] \\[6pt]
&= \frac{1}{n}\sum_{i=1}^{n}E[(X_i-\mu)^2]-E[(\bar{X}-\mu)^2] \\[6pt]
&= \frac{1}{n}\,n\sigma^2-V[\bar{X}] \\[6pt]
&= \sigma^2-\frac{\sigma^2}{n} \\[6pt]
&= \frac{n-1}{n}\,\sigma^2 \\[6pt]
\end{aligned}
\]
したがって、標本分散 \(S_n^2\) は平均的に母分散を小さく見積もることがわかります。
次に、不偏分散を次のように定義します。
\[
S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2
\]
不偏分散の期待値も同様に、次のように計算できます。
\[
\begin{aligned}
E[S^2]
&= E\!\left[\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2\right] \\[6pt]
&= \frac{1}{n-1}\,E\!\left[\sum_{i=1}^{n}(X_i-\mu)^2-n(\bar{X}-\mu)^2\right] \\[6pt]
&= \frac{1}{n-1}\,\Bigl(n\sigma^2-n\,V[\bar{X}]\Bigr) \\[6pt]
&= \frac{1}{n-1}\,\Bigl(n\sigma^2-n\,\frac{\sigma^2}{n}\Bigr) \\[6pt]
&= \frac{1}{n-1}\,(n-1)\sigma^2 \\[6pt]
&= \sigma^2
\end{aligned}
\]
以上より、不偏分散の期待値は母分散に等しいことが証明されます。[3]このような性質を「不偏性」と呼びます。不偏性を持つ分散であるため、記述統計における標本分散と区別して「不偏分散」と呼ばれます。
\[
E[S^2] = \sigma^2
\]