上野竜生です。今回は仮説検定のやり方を紹介したいと思います。
仮説検定の考え方
表が出る確率が50%のコインを10回投げると,10回表が出る確率は1/1024≒0.1%
9回表が出る確率は10/1024≒1.0%
よって9回以上表が出る確率は約1.1%。よって普通のコインなら9回以上表が出る確率はたったの1.1%なので,9回表が出たのならこのコインは表がでる確率は50%より高いコインであると考えられる。この例を仮説検定の用語を用いて説明する。
いろいろな用語が出てきて大変ですが,信頼区間が求められれば計算はさほど難しくないので言葉の使い方に慣れておきましょう。
帰無仮説・対立仮説・有意水準
帰無仮説H0とは検定しようとする仮説。否定されることを期待して立てる。今回の場合は普通じゃないぐらい表が出やすいと言いたいので否定されることを期待する仮説は「このコインは普通である」ということ,つまり「表の出る確率p=0.5である」ということが帰無仮説です。
対立仮説H1とは帰無仮説と対立する仮説のこと。帰無仮説が否定されればこちらの結論になります。今回は表が出やすいと言いたいので「p>0.5」が対立仮説です。
このように帰無仮説の片側について仮説検定を行うことを片側検定という。
今回の例は「コインは表が出やすい」ということを言いたいのでH1はp>0.5としていますが,コインがゆがんでいる(表が出やすいor裏が出やすい)ということを言いたいのであればH1はp≠0.5とします。このように帰無仮説の両側について仮説検定を行うことを両側検定という。
有意水準とは帰無仮説が真であるという仮定の下での滅多に起こらないと判断する確率の基準のことで1%,5%,10%(=0.01,0.05,0.1)あたりがよく使われます。今回の例では5%としてみます。
ここまでは計算で求めるのではなく,自分で基準を決めるだけなので数学的な議論はありません。ここから計算で求めていきます。
棄却域とは滅多に起こらない範囲のことです。今回の場合表が出る回数9回以上は1.1%であり,有意水準5%よりも低いので9回以上は滅多に起きないといえます。表8回以上の確率は5.5%になり有意水準5%よりも高くなるので8回以上は滅多に起きないとは言えません。よって滅多に起きない範囲(棄却域)は表が9回以上です。イメージとしては95%信頼区間の外側が「滅多に起きない範囲」と考えてもいいでしょう。
実際に起こった結果が棄却域に入っていれば帰無仮説を棄却するといい(コインは表が出やすいと結論する),棄却域に入っていなければ帰無仮説を採択するという。(コインは表が出やすいとはいえない)。今回は9回表が出たのなら棄却域に入っているので帰無仮説を棄却し,コインは表が出やすいということになります。
例題(2014eMAT改)
次の空欄に入る値や式を答えよ。選択肢がある場合は選択肢の言葉を答えよ。
今年の魚の体長について,母平均 µ の変化を調べるために,µ に対する片側検定を行うことにし,
µ0 = 5.90, σ2 = 1.172, \(\bar{x}\) = 6.10, n = 100 とおき
帰無仮説 H0 : µ = µ0,
対立仮説 H1 : µ > µ0
と設定する. 選び出した 100 匹の魚の体長を表す確率変数をそれぞれX1, X2, . . . , X100とすると,これらはすべて独立で平均 µ, 分散 1.172 の正規分布 N(µ, 1.172) に従っている.したがって,標本平均
\(\displaystyle \bar{X}=\frac{X_1+X_2+\cdots +X_{100}}{100} \)
は平均[ ア ],分散[ イ ]の[ ウ ]に従う。
[ウ]の選択肢:⓪一様分布 ①二項分布 ②ポアソン分布 ③正規分布 ④指数分布 ⑤t分布
Zが標準正規分布に従うとき,正規分布表から
P(-1.64<Z<1.64)≒0.9がわかる。
これを用いるとH0は有意水準[ エ ]%で[ オ ]。
[オ]の選択肢:⓪棄却される ①採択される
※[ウ]から[エ]までにもう少し誘導がありますが,それは省略しています。語句を答える問題以外は選択肢を省略しています。[エ・オ]の組み合わせはいくらでも考えられますが直前のP(-1.64<Z<1.64)≒0.9を用いたものを答えてください。
※本番では選択式なので最後の[オ]は勘でも2分の1で当たりますが,記述式だと思って途中の過程も答えられるようにしましょう。
[ア]=μ,[イ]=\(\displaystyle \frac{1.17^2}{100}(=0.013689) \),[ウ]=正規分布(③)
と即答してもいいですが,一応期待値と分散の性質から導出してもいいですね。
期待値はE(X+Y)=E(X)+E(Y), E(aX)=aE(X)が成り立つので
\(\displaystyle E(\bar{X})=\frac{1}{n} \sum_{k=1}^n E(X_k)=\mu \)
分散はX,Yが独立のときV(X+Y)=V(X)+V(Y), V(aX)=a2V(X)が成り立つので
\(\displaystyle V(\bar{X})=\frac{1}{n^2} \sum_{k=1}^n V(X_k)=\frac{1.17^2}{100} \)
と求められます。
[エ・オ]
帰無仮説H0のもとでは
\(\displaystyle Z=\frac{\bar{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}} = \frac{\bar{X}-5.90}{0.117} \)
は標準正規分布に従う。
正規分布表からP(-1.64<Z<1.64)≒0.90であるが,片側検定であることに注意すると正規分布の対称性からP(Z≧1.64)≒0.05である。
\(\displaystyle Z\geq 1.64 ⇔\bar{X}-5.90 \geq 1.64 \cdot 0.117 ≒0.192 \)なので
\( P(\bar{X}-5.90 \geq 0.192)≒0.05 \)
\(\bar{x} \)は\(\bar{x}-5.90 = 6.10-5.90>0.192 \)を満たす。
(5%未満しかおきないレアなパターンのほうに入っている)
よってH0(μ=5.90)は有意水準5%で棄却される。
([エ]=5 [オ]=⓪)
ちなみにこの問題では棄却/採択だけでしたが,一部の試験では次のような選択肢になることもあります。
⓪棄却され,今年は体長が大きくなったと言える。
①棄却され,今年は体長が大きくなったとは言い切れない。
②棄却され,今年は体長が大きくなっていないと言える。
③採択され,今年は体長が大きくなったと言える。
④採択され,今年は体長が大きくなったとは言い切れない。
⑤採択され,今年は体長が大きくなっていないと言える。
棄却か採択かは今回の解答通りにすると棄却なので⓪から②のどれかですが,どれかわかりますか?
棄却という言葉のニュアンスだけで①とか②を選ぶ人がいますがそうではなくてμ=5.90が棄却されるぐらい大きくなっているので⓪になります。
逆に採択された場合は95%のほうのノーマルパターンです。上位5%に入るほどの極端な巨大化ではない,といってるだけなので「大きくなっていないと言える」のではありません。採択されても大きくなっている可能性はあるのです。
よってもしも計算した結果採択された場合は④になります。
解説を読んで数学がわかった「つもり」になりましたか?数学は読んでいるうちはわかったつもりになりますが演習をこなさないと実力になりません。そのためには問題集で問題を解く練習も必要です。オススメの参考書を厳選しました
<高校数学>上野竜生です。数学のオススメ参考書などをよく聞かれますのでここにまとめておきます。基本的にはたくさん買うよりも…
上野竜生です。大学数学の参考書をまとめてみました。フーリエ解析以外は自分が使ったことある本から選びました。 大…
上野竜生です。当サイトでも少し前まで各ページで学習サイトをオススメしていましたが他にもオススメできるサイトはた…