上野竜生です。今回は母分散の信頼区間を求めたいと思います。母平均の信頼区間とはやることがかなり異なります。
母分散の信頼区間の式
公式として覚えてしまいましょう
POINT\(\displaystyle \left[ \frac{(n-1)s^2 }{χ^2上} , \frac{(n-1)s^2 }{χ^2下} \right] \)
nはデータのサイズ,\(s^2 \)は不偏分散です。つまり(データの値ー平均)2の和を(n-1)で割ったものです。ということは(n-1)で割って(n-1)をかけてるので分子は偏差の2乗の合計になります。それを分母のうまい値で割った範囲となります。正規分布で1.96をかけたりしたように,ここでも表から値を読み取って調整するのですが,今回は割り算です。しかも上側と下側で2つの値を読む必要があります。
カイ二乗分布の読み取り方
カイ二乗分布も自由度と○%信頼区間の○の値の2変数に依存します。自由度はデータのサイズマイナス1,つまりn-1です。
たとえば95%信頼区間を求めるなら上側は2.5%,つまり0.025。下側は97.5%つまり0.975のところを見ます。それをここでは分かりやすく\( χ^2上,χ^2下\)と表現しています。見方はt分布のときとほぼ同じなので省略します。t分布は左右対称なので1つの値を読めば良かったですがカイ2乗分布は左右対称ではないので上側と下側で2回読んであげる必要があります。
図のピンクの面積がαのときの「↑」とかかれた部分の値を表にしたものです。
α=0.025 | α=0.05 | α=0.95 | α=0.975 | |
自由度1 | 5.02 | 3.84 | 0.0039 | 0.00098 |
自由度2 | 7.38 | 5.99 | 0.10 | 0.051 |
自由度3 | 9.35 | 7.82 | 0.35 | 0.22 |
自由度4 | 11.14 | 9.49 | 0.71 | 0.48 |
自由度5 | 12.83 | 11.07 | 1.15 | 0.83 |
自由度6 | 14.45 | 12.59 | 1.64 | 1.24 |
自由度7 | 16.01 | 14.07 | 2.17 | 1.69 |
自由度8 | 17.54 | 15.51 | 2.73 | 2.18 |
自由度9 | 19.02 | 16.92 | 3.33 | 2.70 |
自由度10 | 20.48 | 18.31 | 3.94 | 3.25 |
たとえばデータのサイズが10で95%信頼区間が欲しいとき,自由度9で0.025,0.975のところを見ることで
\( χ^2上=19.02 , χ^2下=2.70 \)とわかります。
注意
1 カイ2乗で1つの文字だと思ってください。つまり上の例で値を読んだ後,19.022を計算するのではありません。
2 本来は\(\displaystyle \frac{(n-1)s^2}{\sigma^2} \)が自由度(n-1)のカイ2乗分布に従うことから計算しますが,今回紹介した公式はすでに移項などをすませた最終結果のみを見せています。なので上側のほうが信頼区間の下限に使われていて,下側のほうが上限に使われています。もし逆にしてしまうとたとえば[100,1]などのあり得ない信頼区間が出るので異変に気付けるようにしましょう。
カイ2乗分布の説明
信頼区間を求めるだけなら全くといって不要なので飛ばしても構いません。ただし,信頼区間を求める時以外にカイ2乗分布を使った問題も作れます。いろいろな大学の過去問を見てもほぼ出ていないので結果の暗記もあまりいらないかもしれません。
\( X_1,X_2,\cdots X_n \)は互いに独立で標準正規分布に従う確率変数とする。このとき
\( Z=X_1^2 + X_2^2 + \cdots +X_n^2 \)とおくと,これはカイ2乗分布に従う。
カイ2乗分布の密度関数は次のように表される。x≧0のとき,
\(\displaystyle f(x)= \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} e^{-\frac{x}{2}}x^{\frac{n}{2}-1} \)
x<0のときはf(x)=0
ただしΓはガンマ関数
性質
① f(x)は左右対称のグラフではない。
② カイ2乗分布の平均はn,分散は2n
③ X,Yが独立でどちらもカイ2乗分布ならX+Yもカイ2乗分布
④ n=2のカイ2乗分布は指数分布と一致する。
n=2,x≧0のときの確率密度関数は\(\displaystyle f(x)=\frac{1}{2}e^{-\frac{x}{2}} \)
例題
45,50,53,58,61,63,64,72,88,106(kg)
となった。
(前回の問題と同じ数字です。よって以下の結果は使ってよい。また,上にのせたカイ2乗分布表も使ってよい。)
平均:66
分散:308.8
不偏分散:\(s^2=\displaystyle \frac{3088}{9} \)
母分散の95%信頼区間を求めよ。(小数第1位を四捨五入して整数にせよ)
よって公式より
\(\displaystyle \frac{9s^2}{19.02} \leq \sigma^2 \leq \frac{9s^2}{2.70} \)
sの値も代入して整理すると
\(162.35 \leq \sigma^2 \leq 1143.70 \)
整数にすると
\( 162 \leq \sigma^2 \leq 1144 \)
ちなみに標準偏差の95%信頼区間は最後の数字のルートをとればいいです。
\( \sqrt{162.35} \leq \sigma \leq \sqrt{1143.7} \)
\(12.74 \leq \sigma \leq 33.82 \)
カイ2乗分布は統計的にはこのあとの分野にも使われます。ただ,大学の統計学の授業ではここまでで終わることもあります。自由度=データサイズ-1ではない分布や信頼区間のパターンもこの後にありますがここで終わりの人にとっては自由度=n-1としてしまっていいでしょう。
解説を読んで数学がわかった「つもり」になりましたか?数学は読んでいるうちはわかったつもりになりますが演習をこなさないと実力になりません。そのためには問題集で問題を解く練習も必要です。オススメの参考書を厳選しました
<高校数学>上野竜生です。数学のオススメ参考書などをよく聞かれますのでここにまとめておきます。基本的にはたくさん買うよりも…
上野竜生です。大学数学の参考書をまとめてみました。フーリエ解析以外は自分が使ったことある本から選びました。 大…
上野竜生です。当サイトでも少し前まで各ページで学習サイトをオススメしていましたが他にもオススメできるサイトはた…