上野竜生です。前回のデータの分析で一部の結果だけ与えましたがちゃんとした証明と,もう1つの変数変換u=X+Yについても調べてみたいと思います。基本的に共通テスト用なので結果だけで大丈夫だとは思いますが絶対に失点できない立場の人は証明も理解しておくほうがいいでしょう。
なお数I範囲で行いたいのでΣ記号は使わず「・・・」で表記しますがそれで十分理解できるでしょう。
u=aX+bと変換
a,bは定数としXの平均を
\(\displaystyle \bar{X}=\frac{x_1+x_2+\cdots + x_n}{n} \)
分散を
とする。(ゆえに標準偏差は\( s_x \))このときu=aX+bの平均・分散・標準偏差を求めてみよう。
uの平均
各データは\(u_i=ax_i +b \)となるので平均は
=\displaystyle \frac{(ax_1+b)+(ax_2+b)+\cdots +(ax_n+b)}{n}\\
=\displaystyle \frac{a(x_1+x_2+\cdots +x_n)+bn}{n}\\
=\displaystyle a\frac{x_1+x_2+\cdots +x_n}{n}+ b \\
=a\bar{x}+b \)
となる。
uの分散
\( \bar{u}=a\bar{x}+b\)なので
となることに注意する。
=\displaystyle \frac{\{a(x_1-\bar{x})\}^2+\{a(x_2-\bar{x})\}^2+\cdots +\{a(x_n-\bar{x})\}^2}{n}\\
=\displaystyle a^2\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots +(x_n-\bar{x})^2}{n}\\
=a^2 s_x^2 \)
となる。
uの標準偏差
\( \sqrt{a^2 s_x^2}=|a|s_x \)となる。
このように各データがわからなくてもu=aX+bの変数変換では平均はa倍してb増える,分散はa2倍,標準偏差は|a|倍になるということがわかります。
u=aX+b , v=cY+d と変換
X,Yの共分散を
相関係数を
\(\displaystyle r_{xy}=\frac{s_{xy}}{s_x s_y} \)
とする。このときu,vの共分散・相関係数を計算しよう。
共分散
であることに注意します。(というよりこれがほぼすべてです。)
=\displaystyle ac \frac{(x_1-\bar{x})(y_1-\bar{y})+(x_2-\bar{x})(y_2-\bar{y})+\cdots + (x_n-\bar{x})(y_n-\bar{y})}{n}\\
=ac s_{xy} \)
相関係数
\( \displaystyle \frac{s_{uv}}{s_u s_v}=\frac{ac s_{xy}}{|a|s_x |c|s_y}=\frac{ac}{|ac|}r_{xy} \)
つまり絶対値は等しくac>0ならばrxy,ac<0ならば-rxyとなる。
a,cが同符号なら相関係数は同じ。異符号なら絶対値は同じで符号が逆転する。
ここまでは結果だけ知っておきましょうという話でした。さて,もう1つはu=x+yの変換についても述べます。
u=x+yと変換
平均
こちらは簡単でしょう。
=\displaystyle \frac{(x_1+y_1)+(x_2+y_2)+\cdots +(x_n+y_n)}{n}\\
=\displaystyle \frac{x_1+x_2+\cdots +x_n}{n}+\frac{y_1+y_2+\cdots +y_n}{n}\\
=\bar{x}+\bar{y} \)
単純にそれぞれの平均の和です。
分散はちょっと複雑ですよ。
分散
\( u_i-\bar{u} = (x_i-\bar{x})+(y_i-\bar{y}) \)より
がなり立つことに注意する。特に最後の項が厄介です。
=\displaystyle \frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots + (x_n-\bar{x})^2}{n} + \frac{(y_1-\bar{y})^2+(y_2-\bar{y})^2+\cdots + (y_n-\bar{y})^2}{n}\\
\displaystyle + 2\frac{(x_1-\bar{x})(y_1-\bar{y})+(x_2-\bar{x})(y_2-\bar{y})+\cdots (x_n-\bar{x})(y_n-\bar{y})}{n}\\
=s_x^2+s_y^2+2s_{xy} \)
よって分散は(Xの分散)+(Yの分散)+2×(X,Yの共分散)となる。
特に定義から\( s_{xy}=r_{xy} s_x s_y \)であり,sx,sy>0なので最後の項「2sxy」の正負は相関係数rxyの正負と一致する。
ここまで理解すれば十分すぎるでしょう。頑張ってください。
解説を読んで数学がわかった「つもり」になりましたか?数学は読んでいるうちはわかったつもりになりますが演習をこなさないと実力になりません。そのためには問題集で問題を解く練習も必要です。オススメの参考書を厳選しました
<高校数学>上野竜生です。数学のオススメ参考書などをよく聞かれますのでここにまとめておきます。基本的にはたくさん買うよりも…
上野竜生です。大学数学の参考書をまとめてみました。フーリエ解析以外は自分が使ったことある本から選びました。 大…
上野竜生です。当サイトでも少し前まで各ページで学習サイトをオススメしていましたが他にもオススメできるサイトはた…