まくろぐ
更新: / 作成:

推測統計で使う「分散」や「標準偏差」、「誤算」といった用語のまとめです。 日本語むずかしい。

母集団の統計量

用語記号説明
母平均\( \mu \)母集団の平均値(真の平均)
母分散\( \sigma^2 \)母集団の分散(散らばり具合)。有限母集団から計算した分散
母標準偏差\( \sigma \)母集団の標準偏差

標本の統計量

用語記号説明
標本サイズ\( n \)標本の中にいくつデータがあるか(標本の大きさ)
標本数標本自体がいくつあるか(≠ 標本サイズ)
標本平均\( \bar{x} \)標本から計算した平均
\( \bar{x} = \frac{\sum{x_i}}{n} \)
標本分散\( s^2 \)標本から計算した分散
\( s^2 = \frac{\sum{(x_i - \bar{x})^2}}{n} \)
標本標準偏差\( s \)標本から計算した標準偏差
\( s = \sqrt{s^2} = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n}} \)

標本平均 \( \bar{x} \) を使った推測

用語記号説明
標本分布標本平均 \( \bar{x} \) の分布。
標本誤差標本データを使って母集団の統計量を推測する際に発生する誤差。
標本誤差分散\( s_\bar{x}^2 \)標本平均 \( \bar{x} \) の分散。複数の標本を集めたとき、それぞれの標本平均 \( \bar{x} \) がどの程度ばらついているか(標本分布のばらつき)を示す。標本サイズ \( n \) が十分に大きいときは(目安は \( n \geq 30 \))、母分散 \( \sigma^2 \) = 標本分散 \( s^2 \) とみなして、\( s_\bar{x}^2 = \frac{s^2}{n} \) となる。
標本標準誤差
(標準誤差SE)
\( s_\bar{x} \)標本平均 \( \bar{x} \) の標準偏差。SE: Standard Error。標準誤差SE(および標本誤差分散)は、推定量のバラツキを表し、標準誤差 SE が小さいほど精度が高いことを示す。
\( s_\bar{x} = \sqrt{s_\bar{x}^2} = \frac{s}{\sqrt{n}} \)(\( n \) が十分に大きいとき)
誤差分散\( \sigma_\bar{x}^2 \)標本平均 \( \bar{x} \) の分散の理論値で、通常は未知。
\( \sigma_\bar{x}^2 = \frac{\sigma^2}{n} \)
標本サイズが大きくなると、標本誤差分散 \( s_\bar{x}^2 \) は、この \( \sigma_\bar{x}^2 \) に近づく。
標準誤差\( \sigma_\bar{x} \)標本平均 \( \bar{x} \) の標準偏差の理論値で、通常は未知。
\( \sigma_\bar{x} = \frac{\sigma}{\sqrt{n}} \)
標本サイズが大きくなると、標本標準誤差(標準誤差SE) \( s_\bar{x} \) は、この \( \sigma_\bar{x} \) に近づく。
不偏分散\( \hat{\sigma}^2 \)母分散が未知のときに母分散の代わりに使う、標本から計算する分散。
\( \hat{\sigma}^2 = \frac{\sum{(x_i - \bar{x})^2}}{n-1} \)
不偏標準偏差\( \hat{\sigma} \)母標準偏差が未知のときに母標準偏差の代わりに使う、標本から計算する標準偏差。
\( \hat{\sigma} = \sqrt{\hat{\sigma}^2} = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n-1}} \)
不偏誤差分散\( \hat{\sigma}_\bar{x}^2 \)\( \hat{\sigma}_\bar{x}^2 = \frac{\hat{\sigma}^2}{n} = \frac{s^2}{n-1} \)
不偏標準誤差\( \hat{\sigma}_\bar{x} \)\( \hat{\sigma}_\bar{x} = \frac{\hat{\sigma}}{\sqrt{n}} = \frac{s}{\sqrt{n-1}} \)

ポイント:

  • 「誤差」 と付いたら、標本平均 \( \bar{x} \) の分散について述べています(標本分布のバラツキ)。
  • 「不偏」 と付いたら、標本を使って母集団の値(母分散など)の代替値を計算しています。

関連記事

まくろぐ
サイトマップまくへのメッセージ