推測統計で使う「分散」や「標準偏差」、「誤算」といった用語のまとめです。 日本語むずかしい。
母集団の統計量
用語 | 記号 | 説明 |
---|---|---|
母平均 | \( \mu \) | 母集団の平均値(真の平均) |
母分散 | \( \sigma^2 \) | 母集団の分散(散らばり具合)。有限母集団から計算した分散 |
母標準偏差 | \( \sigma \) | 母集団の標準偏差 |
標本の統計量
用語 | 記号 | 説明 |
---|---|---|
標本サイズ | \( n \) | 標本の中にいくつデータがあるか(標本の大きさ) |
標本数 | ─ | 標本自体がいくつあるか(≠ 標本サイズ) |
標本平均 | \( \bar{x} \) | 標本から計算した平均 \( \bar{x} = \frac{\sum{x_i}}{n} \) |
標本分散 | \( s^2 \) | 標本から計算した分散 \( s^2 = \frac{\sum{(x_i - \bar{x})^2}}{n} \) |
標本標準偏差 | \( s \) | 標本から計算した標準偏差 \( s = \sqrt{s^2} = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n}} \) |
標本平均 \( \bar{x} \) を使った推測
用語 | 記号 | 説明 |
---|---|---|
標本分布 | ─ | 標本平均 \( \bar{x} \) の分布。 |
標本誤差 | ─ | 標本データを使って母集団の統計量を推測する際に発生する誤差。 |
標本誤差分散 | \( s_\bar{x}^2 \) | 標本平均 \( \bar{x} \) の分散。複数の標本を集めたとき、それぞれの標本平均 \( \bar{x} \) がどの程度ばらついているか(標本分布のばらつき)を示す。標本サイズ \( n \) が十分に大きいときは(目安は \( n \geq 30 \))、母分散 \( \sigma^2 \) = 標本分散 \( s^2 \) とみなして、\( s_\bar{x}^2 = \frac{s^2}{n} \) となる。 |
標本標準誤差 (標準誤差SE) | \( s_\bar{x} \) | 標本平均 \( \bar{x} \) の標準偏差。SE: Standard Error。標準誤差SE(および標本誤差分散)は、推定量のバラツキを表し、標準誤差 SE が小さいほど精度が高いことを示す。 \( s_\bar{x} = \sqrt{s_\bar{x}^2} = \frac{s}{\sqrt{n}} \)(\( n \) が十分に大きいとき) |
母誤差分散 | \( \sigma_\bar{x}^2 \) | 標本平均 \( \bar{x} \) の分散の理論値で、通常は未知。 \( \sigma_\bar{x}^2 = \frac{\sigma^2}{n} \) 標本サイズが大きくなると、標本誤差分散 \( s_\bar{x}^2 \) は、この \( \sigma_\bar{x}^2 \) に近づく。 |
母標準誤差 | \( \sigma_\bar{x} \) | 標本平均 \( \bar{x} \) の標準偏差の理論値で、通常は未知。 \( \sigma_\bar{x} = \frac{\sigma}{\sqrt{n}} \) 標本サイズが大きくなると、標本標準誤差(標準誤差SE) \( s_\bar{x} \) は、この \( \sigma_\bar{x} \) に近づく。 |
不偏分散 | \( \hat{\sigma}^2 \) | 母分散が未知のときに母分散の代わりに使う、標本から計算する分散。 \( \hat{\sigma}^2 = \frac{\sum{(x_i - \bar{x})^2}}{n-1} \) |
不偏標準偏差 | \( \hat{\sigma} \) | 母標準偏差が未知のときに母標準偏差の代わりに使う、標本から計算する標準偏差。 \( \hat{\sigma} = \sqrt{\hat{\sigma}^2} = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n-1}} \) |
不偏誤差分散 | \( \hat{\sigma}_\bar{x}^2 \) | \( \hat{\sigma}_\bar{x}^2 = \frac{\hat{\sigma}^2}{n} = \frac{s^2}{n-1} \) |
不偏標準誤差 | \( \hat{\sigma}_\bar{x} \) | \( \hat{\sigma}_\bar{x} = \frac{\hat{\sigma}}{\sqrt{n}} = \frac{s}{\sqrt{n-1}} \) |
ポイント:
- 「誤差」 と付いたら、標本平均 \( \bar{x} \) の分散について述べています(標本分布のバラツキ)。
- 「不偏」 と付いたら、標本を使って母集団の値(母分散など)の代替値を計算しています。