F 分布とは

定義

自由度 $k_1, k_2$ のカイ二乗分布に従う確率変数 $\chi_1^2, \chi_2^2$ が独立である時、以下の式で定義されつ統計量 $F$ が従う確率分布を F 分布 といい、$F(k_1, k_2)$ で表す。

\[F := \cfrac{\chi_1^2/k_1}{\chi_2^2/k_2} \tag{1}\]

F 分布の利用

確率密度関数

\[f_F(x:k_1,k_2) = \cfrac{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) \Gamma \left( \cfrac{k_2}{2} \right) } \left( \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_1/2} \left( 1 - \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_2/2} \cfrac{1}{x} \tag{2}\]

ここで、$\Gamma$ はガンマ関数

Figure_1

import numpy as np
from matplotlib import pyplot as plt
import math

def f(x, k1, k2):
	"""F 分布の確率密度関数"""
	g = math.gamma((k1+k2)/2.0) / math.gamma(k1/2.0) / math.gamma(k2/2.0)
	k1x = k1 * x
	tmp = k1x / (k1x+k2)
	return g * tmp**(k1/2) * (1-tmp)**(k2/2) / x

x = np.linspace(1e-10,5,1000)

for k1, k2 in [(1, 3), (3, 1), (2, 3), (3, 3), (5, 3), (20, 3), (3, 10), (10, 10)]:
	y = f(x, k1, k2)
	plt.plot(x, y, label='$k_1 = {}, k_2 = {}$'.format(k1, k2))

plt.ylim([-0.1, 1.1])
plt.legend()
plt.grid()
plt.show()

F 分布の期待値・分散

期待値

\[\begin{eqnarray} E(x) &=& \int_0^\infty x f_F(x:k_1,k_2) dx \\ &=& C \int_0^\infty \left( \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_1/2} \left( 1 - \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_2/2} dx \qquad \left( C = \cfrac{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) \Gamma \left( \cfrac{k_2}{2} \right) }\right) \\ &=& C \int_0^1 t^{k_1/2} (1 - t)^{k_2/2} \left( \cfrac{k_2}{k_1} \cfrac{dt}{(1-t)^2} \right) \qquad \left( t = \cfrac{k_1 x}{k_1 x + k_2} \right) \\ &=& C \cfrac{k_2}{k_1} \int_0^1 t^{k_1/2} (1 - t)^{k_2/2-2} dt \\ &=& C \cfrac{k_2}{k_1} B \left( \cfrac{k_1}{2}+1, \cfrac{k_2}{2}-1 \right) \\ &=& C \cfrac{k_2}{k_1} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+1 \right) \Gamma \left( \cfrac{k_2}{2}-1 \right) }{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) } \\ &=& \cfrac{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) \Gamma \left( \cfrac{k_2}{2} \right) } \cfrac{k_2}{k_1} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+1 \right) \Gamma \left( \cfrac{k_2}{2}-1 \right) }{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) } \\ &=& \cfrac{k_2}{k_1} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+1 \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) } \cfrac{ \Gamma \left( \cfrac{k_2}{2}-1 \right) }{ \Gamma \left( \cfrac{k_2}{2} \right) } \\ &=& \cfrac{k_2}{k_1} \cfrac{k_1/2}{1} \cfrac{1}{k_2/2-1} \\ &=& \cfrac{k_2}{k_2-2} \end{eqnarray}\]

$B$ はベータ関数であり、式変形の途中、ベータ関数とガンマ関数の関係式を用いた。

分散

\[\begin{eqnarray} E(x^2) &=& \int_0^\infty x^2 f_F(x:k_1,k_2) dx \\ &=& C \int_0^\infty x \left( \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_1/2} \left( 1 - \cfrac{k_1 x}{k_1 x + k_2} \right)^{k_2/2} dx \qquad \left( C = \cfrac{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) \Gamma \left( \cfrac{k_2}{2} \right) }\right) \\ &=& C \int_0^1 \left( \cfrac{k_2}{k_1} \cfrac{t}{1-t} \right) t^{k_1/2} (1 - t)^{k_2/2} \left( \cfrac{k_2}{k_1} \cfrac{dt}{(1-t)^2} \right) \qquad \left( t = \cfrac{k_1 x}{k_1 x + k_2} \right) \\ &=& C \cfrac{k_2^2}{k_1^2} \int_0^1 t^{k_1/2+1} (1 - t)^{k_2/2-3} dt \\ &=& C \cfrac{k_2^2}{k_1^2} B \left( \cfrac{k_1}{2}+2, \cfrac{k_2}{2}-2 \right) \\ &=& C \cfrac{k_2^2}{k_1^2} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+2 \right) \Gamma \left( \cfrac{k_2}{2}-2 \right) }{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) } \\ &=& \cfrac{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) \Gamma \left( \cfrac{k_2}{2} \right) } \cfrac{k_2^2}{k_1^2} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+2 \right) \Gamma \left( \cfrac{k_2}{2}-2 \right) }{ \Gamma \left( \cfrac{k_1+k_2}{2} \right) } \\ &=& \cfrac{k_2^2}{k_1^2} \cfrac{ \Gamma \left( \cfrac{k_1}{2}+2 \right) }{ \Gamma \left( \cfrac{k_1}{2} \right) } \cfrac{ \Gamma \left( \cfrac{k_2}{2}-2 \right) }{ \Gamma \left( \cfrac{k_2}{2} \right) } \\ &=& \cfrac{k_2^2}{k_1^2} \cfrac{ \left(\cfrac{k_1}{2} + 1\right) \cfrac{k_1}{2} }{1} \cfrac{1}{ \left(\cfrac{k_2}{2} - 1\right) \left(\cfrac{k_2}{2} - 2\right) } \\ &=& \cfrac{k_2^2(k_1+2)}{k_1(k_2-2)(k_2-4)} \end{eqnarray}\]

よって

\[\begin{eqnarray} V(x) &=& E(x^2) - E(x)^2 \\ &=& \cfrac{k_2^2(k_1+2)}{k_1(k_2-2)(k_2-4)} - \left( \cfrac{k_2}{k_2-2} \right)^2 \\ &=& \cfrac{2k_2^2(k_1+k_2-2)}{k_1(k_2-2)^2(k_2-4)} \end{eqnarray}\]

F 分布の性質

t 分布との関係

【定理】

確率変数 $t$ が自由度 $n$ の t 分布 $t(n)$ に従う時、

\[t^2 \sim F(1, n)\]

【証明】

$t(n)$ に従う確率変数 $t$ は

  • 標準正規分布 $N(0, 1)$ に従う確率変数 $Z$
  • 自由度 $n$ のカイ二乗分布 $\chi^2(n)$ に従う確率変数 $\chi^2$

を用いて

\[t = \cfrac{Z}{\sqrt{\chi^2/n}}\]

と表せるので、

\[t^2 = \cfrac{Z^2}{\chi^2/n}\]

$Z \sim N(0, 1)$ より $Z^2 \sim \chi^2(1)$、仮定より $\chi^2 \sim \chi^2(n)$ であるから、

\[t^2 = \cfrac{Z^2/1}{\chi^2/n} \sim F(1, n)\]

逆数の F 分布

【定理】

確率変数 $F$ について、

\[F \sim F(k_1, k_2)\ \Longleftrightarrow\ \cfrac{1}{F} \sim F(k_2, k_1)\]

【証明】

(ToDo)