標本平均が従う分布の平均と分散、意外と簡単に導出できちゃいます![証明]

標本平均が従う分布のサムネ

平均μμ、分散σ2σ^2の正規分布からnn個とったとった標本平均が従う分布は、平均μμ、分散σ2n\frac{\sigma^2}{n}の正規分布ですよね。

これは、統計学を勉強していると非常に多くの場面で出てきますよね。

この記事では、なぜそうなるのかを解説していますので、理解を深めるのに活用していただければと思います。

目次

標本平均が従う分布

まずは、正規分布からサンプリングした標本で計算した標本平均は、正規分布に従うことを証明します。

確率変数が従う分布の平均は期待値と同じ意味なので、ここでは、確率分布の平均を期待値と表現します。

期待値E[X]E[X]μμ、分散V[X]V[X]σ2σ^2の正規母集団から、nnことった標本平均X\bar{X}は、母集団から最初にとるデータX1X_1からnn番目にとるデータXnX_nまでを全て足してnnで割って計算しますよね。

この時、母集団からどのデータがとられるかは決まっていないので、X1X_1からXnX_nは全て確率変数になります。

そして、その確率変数X1X_1からXnX_nが従う分布は、期待値E[X]E[X]μμ、分散V[X]V[X]σ2σ^2の正規分布ですよね。

また、X1X_1からXnX_nが確率変数ということは、標本平均X\bar{X}は決まった値をとるわけではないということなので、X\bar{X}もまた確率変数ですね。

ここで、正規分布には『再生性』という性質があります。

正規分布の再生性とは、互いに独立な2つの確率変数が正規分布に従う時、確率変数の和は正規分布に従う」という性質です。

つまり、X1X_1X2X_2は独立なので、X1X_1X2X_2は正規分布に従い、X1X_1X2X_2X3X_3は独立なので、X1X_1X2X_2+X3X_3も正規分布に従います。

同じようにして、X1X_1からXnX_nまでを足した確率変数は正規分布に従います。

それをnnで割っただけの標本平均は、もちろん正規分布に従います。

では、期待値がいくつで分散がいくつの正規分布に従うのでしょうか?

次は、それを、期待値と分散の性質を使って求めてみましょう。

期待値と分散の性質

期待値と分散の性質の代表的なものはこれらですが、この中から、赤枠の4つを使えば、標本平均が従う分布の期待値と分散を求めることができます。

標本平均の期待値

まずは、標本平均X\bar{X}の期待値を考えてみましょう。

この2つの性質を使って、標本平均の期待値の式は、このように変換できます。

ここで、X1X_1からXnX_nは、いずれも母集団から1ことった時の結果であり、母集団のいずれかの値をとる確率変数であるため、全て確率変数XXと等しいですよね。

よって、このように、標本平均の期待値は母集団の期待値と等しくなることが証明できました。

標本平均の分散

続いて、標本平均X\bar{X}の分散を考えてみましょう。

この2つの性質を使って、標本平均の分散の式は、このように変換できます。

ここで、X1X_1からXnX_nは、いずれも母集団から1ことった時の結果であり、母集団のいずれかの値をとる確率変数であるため、全て確率変数XXと等しいですよね。

よって、このように、標本平均の分散は母集団の分散÷nnとなることが証明できました。

標本平均が従う分布

ここで、最初に、母集団の期待値E[X]E[X]μμ、分散V[X]V[X]σ2σ^2と定義していたので、E[X]E[\bar{X}]μμV[X]V[\bar{X}]σ2n\frac{\sigma^2}{n}になります。

このように、標本平均は、期待値μμ、分散σ2n\frac{\sigma^2}{n}の正規分布に従う、ということが証明できました。

標本平均が従う分布の重要性

標本平均が従う分布がわかれば、標本をとった元の分布の、母平均の検定や母平均の区間推定ができます。

母平均の検定を行う際には、標本平均が従う分布の平均と分散が必要ですよね。

母平均の区間推定を行う際には、標本平均が従う分布の分散が必要ですよね。

このように、母平均の検定や区間推定を行うためには、標本平均が従う分布がわかっている必要があります

だから、「平均𝝁\boldsymbol{μ}、分散𝝈2\boldsymbol{σ^2}の正規分布から𝒏\boldsymbol{n}個とったとった標本平均は、平均𝝁\boldsymbol{μ}、分散𝝈2𝒏\boldsymbol{\frac{\sigma^2}{n}}の正規分布に従う」というのは、統計学を勉強する上で、非常に重要なんです。

まとめ

標本平均が従う分布の平均と分散は、期待値と分散の性質を用いて、このように証明することができます。

標本平均が従う分布の平均と分散は、標本をとった元の分布の、母平均の検定や母平均の区間推定をする際に必要なので、非常に重要です。

この記事のYouTube動画はこちら

この記事を書いた人

データサイエンスLab.

◆製造業で働くデータサイエンティスト
◆データサイエンス系YouTuber
◆QC検定1級ホルダー(成績上位合格)

統計学や機械学習などのデータサイエンス系の知識を発信しています。
初心者でもわかりやすく、かつ、本質の理解が促される解説が強みです。

この記事が役に立ったらシェアしてね
  • URLをコピーしました!
目次