何かを改善しようとするとき、私たちは「変える前」と「変えた後」を比べますよね。
- 勉強法を変えたら成績は上がったか?
- 運動を続けたら体力が伸びたか?
- 業務フローを見直したら効率が上がったか? などなど…
こうした “同じ人・同じ対象のビフォーアフター” を比べる場面は、日常でも仕事でもよく登場します。
ただ数字が少し変わっただけでは、それが本当に効果があってのことなのか、単なる偶然なのかは判断できません。
そこで役に立つのが対応のある2標本t検定 です。
この記事では、対応のある2標本t検定の考え方から計算方法、結果の読み取り方まで、丁寧に解説します。
「平均」や「分散」などの基礎的な統計知識がある読者を対象にしており、必要に応じて関連記事を参照しながら読み進めることで、初学者でも専門的すぎない範囲で理屈をしっかり理解できます。
この記事を読むと、次のことがわかります。
- 対応のある2標本t検定とは何か
- 対応のあるデータの特徴
- 検定統計量の計算方法
- p値の読み取り方と結論の出し方
- 実務で使う際の注意点
統計検定・QC検定・データ分析の実務にも役立つ内容です。
t検定とは
t検定とは、t分布を利用した検定手法で、母集団の分散が未知の場合に用いられる方法です。
母集団の分散が既知の場合は、z検定を行えばよいのですが、現実的には、母集団の分散がわかっている場合というのはほとんどないので、t検定が用いられる場面は多いです。
z検定では、この式で計算されたz値が標準正規分布に従うことを利用して検定を行いますが、t検定では、この式中の母分散が未知なので、これを標本から求めた推定値に置き換えます。

この置き換えによって、この計算結果(t値)が従うのは、標準正規分布ではなく、t分布になるので、t分布を使って検定を行うことになります。
t検定の仕組みについては、👇こちらで詳しく解説していますので、必要に応じて確認してください。

t検定の種類
t検定は主にこのような種類があります。

まずは、1つの母集団からサンプリングした1つの標本を使用する1標本t検定と、2つの母集団からサンプリングした2つの標本を使用する2標本t検定があります。
2標本t検定には、対応のある2標本t検定と対応のない2標本t検定があり、対応のない2標本t検定については、等分散の仮定が必要なStudentのt検定と、等分散の仮定の必要がないWelchのt検定があります。

対応のある2標本t検定は、2標本を使って検定するので、2標本t検定の部類になるのですが、実は検定の原理は1標本t検定と同じなんです。
どういうことかを説明するために、対応のありなしとはどういうことなのかを説明します。
対応のあるとは
対応のありなしとはどういうことかというと、例えば群1からとった5つのデータ、群2からとった5つのデータがあったとして、これらのデータが同一の対象のデータである場合が対応のあるデータ、同一の対象のデータでない場合が対応のないデータとなります。

「製品No.がいくつのデータ」とか「誰々のデータ」という形で、群1のデータと群2のデータを紐づけることができる場合が、対応のあるデータということです。
同一対象に対するなんらかの比較とは、例えば、「英語のカリキュラムを受ける前と受けた後のTOEICの点数」や、「ある製品の出来栄えを測定器Aと測定器Bではかった結果」といったかんじです。
このように、対応のある2標本t検定では、同一の対象のデータに差があるかどうかについて議論する必要があるので、各同一対象のデータの差をとって、その差が0かどうかを検定するという考え方になりますよね。

つまり、「同一対象のデータの差」を1標本と考えることができるので、考え方は1標本t検定と同じなんです。
例題
製品のある電気特性が、検査装置Aで評価した場合と検査装置Bで評価した場合で異なっている可能性がある。
そこで、5つの製品をランダムに選び、それぞれ検査装置Aと検査装置Bで電気特性を評価し、これらのデータが得られた。
検査装置Aと検査装置Bで電気特性の評価結果が同じと言えるかどうかを有意水準5%で検定せよ。

ある製品の製造工場で、製品のある電気特性が、検査装置Aで評価したときと検査装置Bで評価したときで異なっているのではないか?という意見が出され、データをとって検討することになった、というシチュエーションです。
興味があるのは、同一No.の製品を、検査装置Aではかったときと検査装置Bではかったときで、その測定結果が同じかどうか?なので、ここでは、対応のある2標本t検定を行うのが適切ですよね。
帰無仮説は「差が0」です。
また、「差が0」かどうかを知りたいので、両側検定をすることになります。
対応のある2標本t検定で議論するのは、同一対象のデータの差なので、まずは差を計算します。

そして、この差を1標本と考えて、1標本t検定を行います。
差が従う分布は、帰無仮説が正しい場合は「平均が0、分散は不明」ですよね。
母分散がわからないので、標本データを使って推定します。
母分散を推定する際には、不偏分散を使います(不偏分散の計算は割愛しますが、計算結果は、0.143になります)。

実際の差の観測結果の平均は、0.96です。
この値を、この式で変換したt値は、自由度4のt分布に従います(データが5つなので、自由度は4ですね)。

この式に、実際の差の観測結果:0.96、帰無仮説が正しいと仮定したときに差の平均が従う分布の母平均:0、母分散の推定値:0.143をあてはめて、t値は5.68になります。

自由度4のt分布で、両側検定でp値が5%となる時のt値の絶対値は2.776です。

つまり、この赤の領域にt値がある場合には、帰無仮説が棄却されるということですね。
t値は、2.776よりも大きいので、赤の領域に存在します。
よって、帰無仮説を棄却し、「検査装置Aと検査装置Bの電気特性の評価結果は同じであるとは言えない」と結論づけます。
今やった検定の手順は、1標本t検定と全く同じですよね。
このとおり、対応のある2標本t検定では、最初に同一対象のデータの差を計算した後は、その差を1標本だと考えて、1標本t検定と同じ手順で検定を行えばよいのですね。
対応のありなしの重要性
対応のある2標本t検定の考え方は1標本t検定と同じで、対応のない2標本t検定とは考え方が異なるので、使用すべき場面を間違えてしまうと、得られる検定の結果も間違ったものになってしまいます。
例えば、英語学習プログラムの受講によって、TOEICの点数がUPしたかどうかを知りたいとします。

受講前の点数は300点から800点まで、幅広いレベルの方が受講していますね。
受講後は、受講前の点数が低かった人も高かった人も、20~30点、平均的に得点がアップしていますね。
これは確実にプログラムの効果があったと言えそうです。
実際に、対応のある2標本t検定の結果は、p値がかなり小さいので、「英語学習プログラムの効果があった」と結論づけることができますよね。
同じデータに対して、対応のない2標本t検を行うと、p値が0.73となり、2群に差があることを積極的には肯定できないという結論になってしまうんです。
これはどういうことかというと、プログラム前の点数の平均とプログラム後の点数の平均には25点程度の差があるが、この差は郡内ばらつきに対して小さいので、2群に差がないと結論づけられる、ということです。
知りたいのは、プログラムを受講して、受講者の各自のTOEICの点数が上がったかどうかであり、受講前の点数の平均と受講後の点数の平均が同じであるかどうかではないので、ここでは、目的に合った、対応のある2標本t検定を選択する必要がありますよね。
対応があるにも関わらず、対応のないt検定をしてしまうと、この例のように、あるはずの差を検出できなくなる可能性がありますので、目的に合った検定を行うことが重要ですね。
まとめ
この記事では、対応のある2標本t検定について、基本的な考え方から計算方法、結果の読み取り方まで解説しました。
- 対応のある2標本t検定は、同じ対象を2回測定したときの差を評価する方法
- 比較するのは2つの平均そのものではなく、対応するペアごとの「差」の平均
- 検定統計量は、差の平均と差のばらつき(推定値)から求められる
- 対応があるデータに対応のない2標本t検定を使うと、誤った結論になるため注意が必要
対応のある2標本t検定を使えば、ビフォーアフターの分析が“感覚”ではなく“証拠”として扱えるようになります。


