統計的仮説検定には、母平均の検定・母比率の検定・母分散の検定など、さまざまな種類があります。
この記事ではその中でも 「母分散が既知の場合の母平均の検定」 を、初心者でも理解しやすいように図解を交えて解説します。
母分散既知の母平均の検定は、統計的仮説検定の中でもシンプルで考え方をつかみやすいです。
そのため、まずはこのケースで検定の基本的な流れをマスターするのがおすすめです。
なお、この内容は高校数学で学ぶ「標本平均の分布」や「正規分布」の知識だけで理解できる内容なので、統計を初めて学ぶ人や、数学の基礎を確認しながら進めたい人にも取り組みやすいテーマです。
この記事を読むと、次のことがわかります。
- 母分散既知の場合の母平均の検定とは何か
- 標本平均が従う分布を使って検定統計量を求める方法
- p値の読み方と判断基準
- 母分散未知の場合の母平均の検定との違い
統計検定・QC検定・データ分析の実務にも役立つ内容です。
はじめに
100g入りの製品があったとします。
Aさんは、この製品が大好きで毎日のように購入しているのですが、最近、この製品の内容量が100gよりも少なくなったように感じています。

そこで、この製品の内容量が100gよりも少ないかどうかを統計的仮説検定で確かめることにしました。
仮説検定の考え方
仮説検定は、『証明したいことと逆のことを仮説において、その仮説が矛盾していることを主張することで、間接的に、証明したいことが正しいことを主張する』という考え方です。

証明したいのは「100gよりも少ない」なので、「100gである」を仮説におきます。
仮説を否定することを前提とするため、この仮説のことを帰無仮説と言います。
また、証明したいこと(つまり、帰無仮説と反対の仮説のこと)を対立仮説と言います。
サンプルサイズ1の場合
まずは、サンプルサイズ1の場合を考えてみましょう。

この製品、過去は、平均が100、分散が4の正規分布に従っていたとしましょう。
帰無仮説は「100gだ(過去から変わっていない)」なので、これは、帰無仮説が正しいと仮定したときの母集団の分布ということですね。
1つの標本の重さが98gだったとします。
平均100、分散4の母集団から1つ標本をとってきたとき、その標本は、100付近である確率が高く、100から離れたところの確率は低いですよね。
だから、98gがレアであることを示せば、帰無仮説の矛盾を主張できますよね。
よって、『98g』がどれだけレアであるかを示しましょう。
正規分布は、標準化して標準正規分布にすることで、どんな確率でもわかります。
標準化の式に当てはめて計算すれば、98が標準正規分布では-1に相当することがわかります。

標準正規分布で-1よりも小さい確率は、標準正規分布の確率が全て記されている標準正規分布表から、0.1587と読み取れます。

これはつまり、もし、帰無仮説(製品の内容量が過去の分布と変わっていない)が正しいなら、「98g以下」という観測結果は、15.87%の確率で起こります、ということを示しています。
この確率のことをp値と言います。
一般的に、レアかどうかは、p値が5%よりも大きいか小さいかで議論します。
今回は、p値が5%よりも大きいので、残念ながら、この結果をもって帰無仮説が矛盾していることは主張できません。
帰無仮説の矛盾を主張できず、帰無仮説を否定できない状況のことを、帰無仮説を受容するという風に表現します。


標本平均を使用した場合
1つの製品の情報を用いて検定した結果、残念ながら帰無仮説の矛盾を主張することはできませんでした。
Aさんは、今度は複数の製品を標本として検定してみることにしました。
1つの製品だけの場合、偶然、自分に不利な標本が得られた可能性もありますもんね。
複数の製品をサンプリングして、平均を計算し、その平均が帰無仮説と矛盾しないかどうかをチェックする、という作戦です。
平均をとることによるメリットは、ばらつきが小さくなることです。
平均をとるとばらつきが小さくなる理由
分布の裾は、発生確率は低いですよね。

この分布から複数の製品をとってきた平均値が、この値相当になる時というのは、発生確率が低い分布の裾周辺から何度も製品をとってきた時です。
製品を1ことって、この値になる確率よりも、複数の製品の平均値がこの値になる確率のほうが低いはずですよね。
また、分布の中央は、発生確率は高いですよね。

この分布から複数の製品をとってきた時、中央付近が最も選ばれるはずです。
複数の製品の中に、分布の裾のものが少々含まれていたとしても、大部分が分布の中央付近であれば、標本平均は中央付近になります。
よって、製品を1ことって中央付近になる確率よりも、複数の製品で計算される標本平均が中央付近になる確率のほうが高いはずですよね。
したがって、標本平均が従う分布は、元の分布よりも裾引きが少なくなってスマートになります。

標本平均が従う分布の平均は、元の分布の平均と同じで、ばらつきは、元の分布の分散を標本平均を計算したデータ数nで割った値になります。
標本平均を使った検定の流れ
今回、Aさんは、4この製品の平均値を使って検定することにしました。
内容量が過去から変わっていないのであれば、4個の製品の平均は、平均が100、分散が1の正規分布に従うはずです。
これが帰無仮説になるので、N(100,1)が、帰無仮説が正しいと仮定したときの母集団の分布ということです。
4この製品の重さの平均が、やはり98gだったとします。
4この製品の平均が98gになりうるのかどうかを、同じ手順で評価してみましょう。

標準化の式に当てはめて計算すれば、98が標準正規分布では-2に相当することがわかります。

標準正規分布で-2よりも小さい確率(p値)は、標準正規分布表から、0.0228と読み取れます。

帰無仮説が正しいなら、「98g以下」という観測結果は、2.28%の確率でしか起こらないということです。
これは、おかしいですよね。実際のデータと帰無仮説に矛盾があります。
2.28%の超レアなことが起こったと考えることもできますが、そう考えるよりも、そもそも仮説が誤っていたと考えるほうが妥当ですよね。
p値が、一般的なしきい値5%よりも小さいので、帰無仮説の矛盾を主張できます。
帰無仮説の矛盾が主張でき、帰無仮説を否定することを、帰無仮説を棄却するという風に表現します。
この場合、自分の主張である対立仮説を間接的に肯定できることになります。
よって、帰無仮説を棄却して対立仮説を採択するという風に表現します。
このように、統計的仮説検定は、「実際のデータと帰無仮説の矛盾を主張することで、自分の主張が正しいことを間接的に主張する」という論法です。
母分散が未知だったら?
今回は、母分散がわかっている状況で、統計的仮説検定を行いましたが、実際には、母分散がわかっていない状況で検定を行うシチュエーションのほうが多いですよね。
母分散がわかっていない時に使うのが、t分布です。
t分布を使って、今回やったのと同じ論法で、帰無仮説の矛盾を主張しようとするのがt検定です。

まとめ
この記事では、母分散が既知のときに平均値を検定する方法について解説しました。
標本平均が従う分布から、検定統計量を求め、p値を用いて判断する流れを学びました。
- 帰無仮説と対立仮説を設定する
- 標本平均が従う分布を利用して検定統計量を計算する
- p値をもとに判断する
- 母分散が未知の場合は別の手法(t検定)を使う
統計的仮説検定の手順はどれも同じなので、この手順を理解しておけば、基本的な統計的仮説検定手法を正しく使えるようになります。
この記事のYouTube動画はこちら

