\(\chi^2\)分布の期待値と分散、再生性

〜\(\chi^2\)分布の期待値〜
自由度が\(n\)の\(\chi^2\)分布の確率密度関数は、\(x>0\)として、
\[ f_n\left(x\right)=\frac{1}{2^{\frac{n}{2}}\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{n}{2}-1}\mathrm{e}^{-\frac{x}{2}} \tag{1} \] と定義されますが、この分布の期待値を求めてみましょう。
期待値ということは…。
\[ \begin{align*} \mathbb{E}\left[x\right]&=\int^\infty_0xf_n\left(x\right)dx=\int^\infty_0x\frac{1}{2^{\frac{n}{2}}\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{n}{2}-1}\mathrm{e}^{-\frac{x}{2}}dx \\ &=\frac{1}{\Gamma\left(\cfrac{n}{2}\right)}\int^\infty_0\left(\frac{x}{2}\right)^{\frac{n}{2}}\mathrm{e}^{-\frac{x}{2}}dx \tag{2} \end{align*} \] 積分の部分は、ガンマ関数になりそうだな…。ん〜と、\(x=2t\)と置換すると、\(dx=2dt\)だから、
\[ \begin{align*} \int^\infty_0\left(\frac{x}{2}\right)^{\frac{n}{2}}\mathrm{e}^{-\frac{x}{2}}dx&=\int^\infty_0t^{\frac{n}{2}}\mathrm{e}^{-t}\times2dt=2\int^\infty_0t^{\frac{n}{2}}\mathrm{e}^{-t}dt \\ &=2\Gamma\left(\frac{n}{2}+1\right)=2\times\frac{n}{2}\Gamma\left(\frac{n}{2}\right)=n\Gamma\left(\frac{n}{2}\right) \tag{3} \end{align*} \] 式(3)を式(2)に代入すると、
\[ \mathbb{E}\left[x\right]=\frac{1}{\Gamma\left(\cfrac{n}{2}\right)}\times n\Gamma\left(\frac{n}{2}\right)=n \tag{4} \] ですね。サクサク約分できて気持ちいいですね。

〜\(\chi^2\)分布の分散〜
では、分散も計算してみましょう。分散は、
\[ \mathbb{V}\left[x\right]=\mathbb{E}\left[x^2\right]-\mathbb{E}\left[x\right]^2 \tag{5} \] の定義式を使うといいですね。
なぜですか??
式(5)の右辺第2項は、式(4)を2乗したものなので、\(n^2\)と分かっているからです。
ということは、右辺第1項を求めればいいのか。
\[ \begin{align*} \mathbb{E}\left[x^2\right]&=\int^\infty_0x^2f_n\left(x\right)dx=\int^\infty_0x^2\frac{1}{2^{\frac{n}{2}}\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{n}{2}-1}\mathrm{e}^{-\frac{x}{2}}dx \\ &=\frac{2}{\Gamma\left(\cfrac{n}{2}\right)}\int^\infty_0\left(\frac{x}{2}\right)^{\frac{n}{2}+1}\mathrm{e}^{-\frac{x}{2}}dx \tag{6} \end{align*} \] やっぱり、\(x=2t\)と置換ですね。
\[ \begin{align*} \int^\infty_0\left(\frac{x}{2}\right)^{\frac{n}{2}+1}\mathrm{e}^{-\frac{x}{2}}dx&=\int^\infty_0t^{\frac{n}{2}+1}\mathrm{e}^{-t}\times2dt=2\int^\infty_0t^{\frac{n}{2}+1}\mathrm{e}^{-t}dt \\ &=2\Gamma\left(\frac{n}{2}+2\right)=2\times\left(\frac{n}{2}+1\right)\Gamma\left(\frac{n}{2}+1\right) \\ &=\left(n+2\right)\times\frac{n}{2}\Gamma\left(\frac{n}{2}\right)=\frac{n^2+2n}{2}\Gamma\left(\frac{n}{2}\right) \tag{7} \end{align*} \] 式(7)を式(6)に代入すると、
\[ \mathbb{E}\left[x^2\right]=\frac{2}{\Gamma\left(\cfrac{n}{2}\right)}\times\frac{n^2+2n}{2}\Gamma\left(\frac{n}{2}\right)=n^2+2n \tag{8} \] で、式(8)を式(5)に代入だな。
\[ \mathbb{V}\left[x\right]=n^2+2n-n^2=2n \tag{9} \]
よさそうですね。\(\chi^2\)分布の期待値や分散は、覚える必要はないですが、導出できるようにしておいた方がいいでしょう。

〜再生性〜
再生性??
言葉で表現するなら、
「\(m\)、\(n\)を正の整数とし、確率変数\(X\)、\(Y\)が互いに独立であるとき、
\(X\)が自由度\(m\)の分布\({\chi^2}_m\)に従い、かつ\(Y\)が自由度\(n\)の分布\({\chi^2}_n\)に従うならば、
\(X+Y\)は自由度\(m+n\)の分布\({\chi^2}_{m+n}\)に従う」
ということです。
それって、\(\chi^2\)分布を重ね合わせても\(\chi^2\)分布になるし、その自由度も重ね合わせられる、ってこと??
ざっくり言えば。
\(\chi^2\)分布の期待値や分散が自由度と関連しているから、結局、正規分布の重ね合わせと似てますね。
そのとおりです。重ね合わせができることを再生性と言うんですよ。
そうすると、計算は畳み込み積分ですね。
\[ \begin{align*} f\left(x\right)&=\int^x_0f_m\left(x-w\right)f_n\left(w\right)dw \\ &=\int^x_0\frac{1}{2^{\frac{m}{2}}\Gamma\left(\cfrac{m}{2}\right)}\left(x-w\right)^{\frac{m}{2}-1}\mathrm{e}^{-\frac{x-w}{2}}\frac{1}{2^{\frac{n}{2}}\Gamma\left(\cfrac{n}{2}\right)}w^{\frac{n}{2}-1}\mathrm{e}^{-\frac{w}{2}}dw \\ &=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}\mathrm{e}^{-\frac{x}{2}}\int^x_0w^{\frac{n}{2}-1}\left(x-w\right)^{\frac{m}{2}-1}dw \end{align*} \] ここで、\(w=xu\)と置換すると(\(dw=xdu\))、
\[ \begin{align*} f\left(x\right)&=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}\mathrm{e}^{-\frac{x}{2}}\int^1_0\left(xu\right)^{\frac{n}{2}-1}\left(x-xu\right)^{\frac{m}{2}-1}xdu \\ &=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}\mathrm{e}^{-\frac{x}{2}}\int^1_0x^{\frac{n}{2}-1}u^{\frac{n}{2}-1}x^{\frac{m}{2}-1}\left(1-u\right)^{\frac{m}{2}-1}xdu \\ &=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{m+n}{2}-1}\mathrm{e}^{-\frac{x}{2}}\int^1_0u^{\frac{n}{2}-1}\left(1-u\right)^{\frac{m}{2}-1}du \end{align*} \] それで、積分の部分はベータ関数で表せるから、
\[ f\left(x\right)=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{m+n}{2}-1}\mathrm{e}^{-\frac{x}{2}}B\left(\frac{n}{2},\frac{m}{2}\right) \] そんでもって、ベータ関数とガンマ関数の関係式から、
\[ \begin{align*} f\left(x\right)&=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m}{2}\right)\Gamma\left(\cfrac{n}{2}\right)}x^{\frac{m+n}{2}-1}\mathrm{e}^{-\frac{x}{2}}\frac{\Gamma\left(\cfrac{n}{2}\right)\Gamma\left(\cfrac{m}{2}\right)}{\Gamma\left(\cfrac{n+m}{2}\right)} \\ &=\frac{1}{2^{\frac{m+n}{2}}\Gamma\left(\cfrac{m+n}{2}\right)}x^{\frac{m+n}{2}-1}\mathrm{e}^{-\frac{x}{2}}=f_{m+m}\left(x\right) \end{align*} \] 示せましたね。
以上が\(\chi^2\)分布で押さえておくべき性質と言えるでしょう。


戻る