零假设(null hypothesis)
目录 |
零假设又称原假设,是统计学术语,指进行统计检验时预先建立的假设。 零假设成立时,有关统计量应服从已知的某种概率分布。当统计量的计算值落入否定域时,可知发生了小概率事件,应否定原假设。
在统计学中,零假设或虚无假设是做统计检验时的一类假设。零假设的内容一般是希望被证明为错误的假设或者是需要着重考虑的假设。比如说,在相关性检验中,一般会取“两者之间无关联”作为零假设,而在独立性检验中,一般会取“两者之间有关联”作为零假设。与零假设相对的是备择假设(对立假设),即希望证明是正确的另一种可能。从数学上来看,零假设和备择假设的地位是相等的,但是在统计学的实际运用中,常常需要强调一类假设为应当或期望实现的假设。如果一个统计检验的结果拒绝零假设(结论不支持零假设),而实际上真实的情况属于零假设,那么称这个检验犯了第一类错误。反之,如果检验结果支持零假设,而实际上真实的情况属于备择假设,那么称这个检验犯了第二类错误。通常的做法是,在保持第一类错误出现的机会在某个特定水平上的时候,尽量减少第二类错误出现的概率。
看到零假设的时候我们会自然地发问,这个“假设”太奇怪了,竟然叫零假设,难道还有什么一假设和二假设吗?换句话说,假设是可用数字来计量的吗?对这个问题有一个好的理解的办法可能需要提到相关系数,还有就是关于假设的一些简单陈述。当我们想理解两个事件是否相关的时候,我们用相关系数来测量它们之间的相关程度,它是介于-1到1的一个数值。当相关系数是零的时候,我们说这两个事件没有关系。假设就是我们对两个事件之间关系的某种猜测。因此,如果们要研究两个事件的关系时,零假设的意思就是说,两件事情之间没有关系。
当然,零假设仍然是一种假设,并不是对世界运动的客观描述,至少在没有证明它是正确的情形下这样的表达是可靠的。零假设不过是我们研究两个事物之间是否有关的时候我们能做出的最保守的假设。如果我们想知道温室气体排放的增加和全球变暖之间的关系,而在研究之前我们没有做过任何的研究和调查,我们最保险的办法就是认为这两者之间没有关系,这就是零假设。因为我们不知道它们之间是什么样的关系在研究之前,所以我们令可认为它们之间没有关系。然后通过我们科学的调查研究,再排除那些偶然性的因素之后,我们得到的结论是温室气体排放使和全球变暖。
正如上面所提到的,零假设还要让我们接受偶然性。许多事情的发生出于偶然,这是一个基本事实。由于偶然而导致两个事情看起来有关系,或者说有关系,但实际上我们还是认为这两者之间的关系仍然是不相关的,用零假设来描述它们的关系仍然是恰当的。偶然性是一个让人着迷又易犯错误的领域,尽管它确实存在,但是在对它进行研究的人们仍然是我们人类中的强者。我们所要研究的是,在排除这些偶然性的因素之后得到的两者之间的必然联系。只有这样的结论才是可靠的,运用这样的结论来改造世界才是安全的。
1.零假设一般是有意推翻的假设;
2.由于第一类错误的概率可以通过显著性水平的选定加以控制,零假设一般是如果出现第一类错误后后果更为严重的情况的假设。
在假定零假设为真的前提下,确定样本分布形态和特征值(包括期望和方差)并选择合适的统计量,然后,确定包括接受域,临界值和拒绝域在内的决策标准;根据样本数据计算出统计量并将其与决策标准比后得出结论。其间决策标准的逻辑意义在于,零假设为真时的样本分布中,抽样数据落在拒绝域被设定为小概率事件,而小概率事件在一次试验中几乎是不可能发生的,一旦发生,可认定样本数据落在拒绝域并非小概率事件,零假设为真的前提可以被推翻。
选用哪个命题做原假设,要视具体问题的目的和要求而定,它取决于犯两类错误将会带来的后果。一般的,按下面几个原则建立原假设:
1)往往把有把握的、不能轻易被否定的命题作为原假设H0,而把无把握的、不能轻易肯定的命题作为备择假设。
如考虑新工艺是否能提高效益.只有真正能提高效益的新工艺才可能被采用.这是因为采用新工艺,必然要购进新设备、调整生产线、培训人员等进行人力、物力、财力的投入.作为企业的主管部门,作出采用新工艺的决策应持慎重态度.若以U0代表采用新工艺前的平均效益,U代表采用新工艺下的平均效益,则原假设和备择假设必须设为
H0:U≤U0; H1:U>U0.
这样当在显著性水平 α下,拒绝原假设H。时,才可认为新工艺确实提高效益.因为企业的主管部门心中有数,做错这个结论的可能性大小只有 α。
2)当我们的目的是希望取得对某一陈述强有力的支持时,把这一陈述的对立面作为原假设.仍用在1)中提到的例子,我们希望取得新工艺提高效益这一陈述的有力支持时,将其对立面“新工艺不能提高效益”作为原假设,即H0:U≤U0。
3.)尽量使后果严重的错误成为第一类错误.
例如,我们要检验某个求医者是否患有某种疾病.如果原假设和备择假设建立为
H0:患者患病; H1:患者不患病,
则犯第一类错误意味着是把患病当作不患病,后果是有可能导致此人死亡.
若将原假设和备择假设建立为
H0:患者不患病; H1:患者患病,
则犯第一类错误意味着是把不患病当作患病,不仅给此人带来精神上及身体上的痛苦,还会造成经济上的浪费.虽然无论在哪种情形,有病当无病、无病当有病都有不良后果,但后果更严重的是将有病当无病.由于我们所做的检验控制的是犯第一类错误的概率,因此一般设H0:患者患病。