正規分布の標準化の計算式の理由から、標準正規分布表の読み方まで、丁寧にわかりやすく解説します。
標準化の考え方が理解できるので、もし、標準化の式を忘れてしまっても簡単に導き出すことができますよ!
標準正規分布表とは
標準正規分布表とは、このような、数字がたくさん書いてある表です。

これに書いてあることは、標準正規分布における任意の範囲の発生確率です。
正規分布はこのように、2つの数字で表現されます。最初の数字が平均、2番目の数字が分散です。

標準正規分布とは、平均0、分散1の正規分布のことです。
確率は面積
『標準正規分布表を使えば任意の範囲の発生確率がわかる』わけですが、正規分布のような連続型の確率分布では、ある特定の値の発生確率を知ることはできず、ある範囲の発生確率がわかります。
範囲の発生確率のイメージは、面積で考えてください。
例えば、この正規分布の全区間の面積は1です。

正規分布だけでなく、どんな連続型確率分布でも、全区間の面積は1になります。
ここで、平均±3σを超える確率は1000回に3回、ということを聞いたことはありませんか?
これが意味するのは、平均±3σの外側の赤の部分の面積が3/1000である、ということです。

このように、連続型確率分布における確率とは、確率変数のある範囲における面積のことを意味します。

確率は面積であるというイメージは、あらゆる場面で非常に重要ですよ!
標準化
標準化すると何がわかるのか
実際に、平均±3σを計算してみましょう。
まずは、平均7、分散4の正規分布における平均±3σを計算してみましょう。


平均は7で、σは分散の平方根なので4の平方根をとって2ですね。
平均-3σ : 7-3×2=1
平均+3σ : 7+3×2=13
では、標準正規分布の場合はどうなるでしょうか?


平均は0で、σは分散の平方根なので1の平方根をとって2ですね。
平均-3σ : 0-3×1=-3
平均+3σ : 0+3×1=3
平均が0、分散が1なので、平均±3σの±3の部分のみが残る形になりました。
つまり、標準正規分布における横軸の確率変数の値というのは、何σ相当か?を意味するということです。
標準化の必要性
平均7,分散4の正規分布における平均-3σは1、平均+3σは13でした。
標準正規分布における、平均-3σは-3、平均+3σは3でした。
ここで、平均±3σを超える確率は3/1000なので、赤の部分の面積は両方とも同じになりますよね。


平均7,分散4の正規分布における1と13は平均±3σに相当するため、”1以下13以上”の確率が3/1000とわかりましたが、5を下回る確率は?12を超える確率は?と聞かれたらどうしましょうか…
これを解決するには、5や12が標準正規分ではいくつに相当するのかがわかればわかります。
なぜなら、標準正規分布では、全ての確率があらかじめ計算されている標準正規分布表があるからです。
任意の正規分布における、任意の値を超える確率は、現代では Excel や統計ツールを使えば一瞬で求められます。
でも、こうしたツールがない状況で“手計算”で求める場合は、標準正規分布表を使うしかありません。
そのために、元の値を標準正規分布での値に変換する標準化が必要なんです。
標準化の式の成り立ち
平均7,分散4の正規分布における平均±3σは、このように計算しました。


これを変換するとこのようになります。


ここからは、この式をより一般的にしてみましょう。
平均7,分散4の正規分布における1と13は、標準正規分布における-3と3に相当した状況でしたよね。
平均7,分散4の正規分布における1と13 平均µ,分散σ2の正規分布におけるx1とx2
標準正規分布における-3と3 標準正規分布におけるz1とz2
すると、このようになります。


さぁ!みえてきましたね!


この式に当てはめれば、任意の正規分布の任意の値が、標準正規分布ではどんな値に相当するのか?が計算できます。
そして、それがわかれば、標準正規分布表から確率を読み取ることで、どんな範囲の確率でも計算することができます。
標準化の式は、平均を引いて標準偏差で割りますが、平均を引くことで分布の中心を合わせて、標準偏差で割ることで分布を伸び縮みさせて、任意の正規分布を標準正規分布にぴったり重なる形に変形させているわけですね。
そして、その変形をした結果、元の正規分布における任意の値が、標準正規分布ではいくつに相当するのか?を計算しているということですね!


標準正規分布表の見方
標準正規分布表の一番左の縦の数字は、整数と小数点以下1桁です。
一番上の横の数字は、小数点以下2桁目の数字です。
例えば、zが1.78だった場合、縦軸の1.7と横軸の8がクロスした部分の数字が1.78を超える確率です。


zが0.92であった場合、縦軸の0.9と横軸の2がクロスした部分の数字が0.92を超える確率です。


では、zがマイナスの値だったときにはどうすればよいでしょうか?
標準正規分布は0を左右対称なので、-0.92を下回る確率と、0.92を上回る確率は同じです。
よって、-0.92を下回る確率が知りたい時には、0.92を上回る確率を標準正規分布表から読み取ってください。
例題1
X が N(1,9) に従う時、P(7≦X) を求めよ
これは、確率変数Xが平均1,分散9の正規分布に従う時、Xが7よりも大きい確率を求めよということです。
この問題を解くとのアプローチを図で示すとこうなります。


まずは、全ての発生確率があらかじめ計算されている標準正規分布に変換します。
x=7はz=2になります。
標準正規分布において、zが2よりも大きくなる確率は、標準正規分布表から0.02275と読み取ることができます。


例題2
X が N(3,16) に従う時、 P(5≦X≦8)を求めよ
これは、確率変数Xが平均3,分散16の正規分布に従う時、Xが5から8の範囲内の発生確率を求めよということです。
この問題を解くとのアプローチを図で示すとこうなります。


まずは、全ての発生確率があらかじめ計算されている標準正規分布に変換します。
x=5はz=0.5、x=8はz=1.25になります。
赤の部分の面積は、zが0.5よりも大きくなる確率からzが1.25よりも大きくなる確率を計算すれば求まります。
標準正規分布において、zが0.5よりも大きくなる確率は、標準正規分布表から0.308538と読み取ることができます。
標準正規分布において、zが1.25よりも大きくなる確率は、標準正規分布表から0.10565と読み取ることができます。


この差分である0.202888が答えです。
まとめ
標準正規分布表には確率が書いてあります。
連続型確率分布における確率とは面積のことです。
標準正規分布表を使うためには、正規分布を標準化する必要があります。
******************この記事のYouTube動画はこちら******************
