综合百科行业百科金融百科经济百科资源百科管理百科
管理百科
管理营销
资源百科
人力财务
经济百科
经济贸易
金融百科
金融证券
行业百科
物流咨询
综合百科
人物品牌

卡方分布

  	      	      	    	    	      	    

卡方分布(Chi-square Distribution)

目录

什么是卡方分布

  卡方分布 (χ2分布)是概率论统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验置信区间的计算。

卡方分布的数学定义

  若k 个随机变量Z1、……、Zk 相互独立,且数学期望为0、方差为 1(即服从标准正态分布),则随机变量X

X=\sum_{n=1}^k Z_n^2

被称为服从自由度为 k 的卡方分布,记作

X\ \sim\ \chi^2(k)

卡方分布的特征

  卡方分布的概率密度函数为:

f_k(x)= \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}

其中x≥0, 当x≤0时fk(x) = 0。这里Γ代表Gamma 函数。


  卡方分布的累积分布函数为:

F_k(x)=\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}

其中γ(k,z)为不完全Gamma函数

在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函数。

卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。

自由度为 k 的卡方变量的平均值是 k,方差是 2k。 卡方分布是伽玛分布的一个特例,它的熵为:

H = \int_{-\infty}^\infty f(x)\ln(f(x)) dx = \frac{k}{2} + \ln \left( 2 \Gamma \left( \frac{k}{2} \right) \right) + \left(1 - \frac{k}{2}\right) \psi(k/2)

其中ψ(x) 是 Digamma function。

卡方变数与 Gamma变数的关系

  当Gamma变数频率(λ)为1/2 时,α 的2倍为卡方变数之自由度(Degree of freedom)

即: r.v. Y = \chi^2 \left(U\right) = \Gamma \left( \frac{U}{2} , \frac{1}{2}\right)

E \left( \chi^2 \left(U\right) \right) = E \left( Y \right) = \frac{\alpha}{\lambda} = \frac{\frac{U}{2}}{\frac{1}{2}} = U

Var \left( \chi^2 \left(U\right) \right) = Var \left( Y \right) = \frac{\alpha}{\lambda^2} = \frac{\frac{U}{2}}{\left(\frac{1}{2}\right)^2} = 2U

卡方变数之期望值=自由度卡方变数之方差=两倍自由度

  卡方分布

参数k > 0, 自由度
值域x \in [0; +\infty),
概率密度函数\frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2},
累积分布函数(cdf)\frac{\gamma(k/2,x/2)} {\Gamma(k/2)},
期望值k,
中位数大约k − 2 / 3,
众数k-2, ifk\geq 2,
方差2,k,
偏态\sqrt{8/k},
峰态12/k,
熵值\frac{k}{2}\!+\!\ln(2\Gamma(k/2))\!+\! (1\!-\!k/2)\psi(k/2)
动差生成函数(mgf)(1-2\,t)^{-k/2},2t<1,
特征函数(1-2\,i\,t)^{-k/2},