总体标准差(population standard deviation )
目录 |
总体标准差是反映研究总体内个体之间差异程度的一种统计指标,用σ表示。
总体方差是一组资料中各数值与其算术平均数离差平方和的平均数。总体标准差则是总体方差的平方根。
标准差是最常用和最重要的变异性测量。标准差以分布的平均数作为参照点,用考虑每个数据和平均 数之间的距离来测量变异性。它由数据是否接近或远离平均数来决定。也就是说,它考虑数据是聚集还是离散的?简单来说,标准差与数据到平均数的平均距离近似。
方差被定义为平方差的平均数。这个平均数为总和除以N,因此,总体方差的公式为:
方差=
标准差是方差的平方根,因此,总体标准差的公式为:
标准差=
与平均数(μ)一样,方差和标准差是总体的参数,将用希腊字母表示。我们用σ表示总体标准差。为了强调标准差和方差之间的关系,我们用σ2表示总体方差。所以:
总体标准差=
总体方差
总体参数中除了均值和比例的估计之外,还经常要对差异的情况作出估计,例如:一架飞机的电缆如果发生断裂,飞机就会市区控制,因而严格控制其质量非常必要。但只知道电缆的平均强度是否达到标准是不够的,因为如果电缆差异太大,电缆强度太强,都容易发生断裂,后果不堪设想。所以对于电缆强度质量不仅应知道均值,而且还应知道方差,即需要要对电缆的方差进行估计。
对方差进行估计要用到Excel中的卡方分布反函数CHIINV。若已知总体方差σ2(总体方差未知时用样本方差S2代替总体方差)和样本数,对于给定的显著性水平σ,利用CHINV函数可以求出临界值和,则总体方差σd的置信度为1 − σ的置信区间为
()。
其中,和
分别是自由度为n − 1的X2分布的和的水平的分位数。
假设上市公司预计的每股收益率服从正态分布,现有8个公司组成一个简单随机样本,2007年的有关数据如表12-1所示,试建立总体标准差的95%的置信区间。
设随机变量X表示预计的每股收益率,则由已知条件知X~N(μ,σ2),且σ2未知。具体操作步骤如下:
(1)打开“《大学计算机应用高级教程》教学资源\第3篇Excel数据分析与处理\第12章 参数估计与分析\第12章 参数估计与分析.xls”工作簿,选定“例12-10方程估计”工作表。
(2)将表12-1中的数据输入“方差估计工作表的相关单元格中,输入后的工作表如图12-20所示”
(3)在D2单元格中输入样本容量的值8:在D3单元格计算样本方差得值2.618971。
(4)在D4单元格中输入置信度95%。
(5)在G2单元格中输入右侧置信度0.025:在G3但与昂输入左侧置信度0.975。
说明:通常卡方分布函数所给出的是由右侧向左侧累加的概率。若置信度为95%,则右侧临界值的右侧面积称为右侧置信度,为0.025,左侧临界值的右侧面积为左侧置信度,它等于中心面积加上右侧置信度,即左侧置信度=0.95+0.025=03975。
(6)选定G4单元格,依次选择“插入”→“函数”命令,打开“插入函数”对话框。
(7)在“函数分类”列表中选择“统计”选项,在“函数名”列表中选择CHIINV选项,单击“确定”按钮,打开“函数参数”对话框,如图所示。
(8)在Probability文本框中输入右侧置信度0.025或G2,在Deg_freedom文本框中输入自由度7或“=D2-1”,单击“确定”按钮,计算结果为16.01276。
(9)在G4单元格重复上面的步骤,在“函数对数”对话框中的Probability文本框中输入右侧置信度0.975或E3,自由度不变,单击“确定”按钮,计算结果为1.689869。
(10)在D7单元格中输入公式“=((D2-1)*D3)/G4”,得方差下限为1.145。
(11)在D8单元格中输入公司“=((D2-1)*D3)/G5”,得方差上限为10.849。
(12)在D9和D10单元格中分别对D7和D8单元格开平方,即在D9单元格中输入公式“=SQRT(D7)”,按Enter键得1.070,在D10单元格输入公式“=SQRT(D8)”,按Enter键得3.294。结果如图所示。
故总体方差的95%的置信区间为(1.145,10.849),总体标准差的95%的置信区间为(1.070,3.294)。
由此我们有95%的把握认为这些上市公司整体每股收益率的浮动范围在1.070~3.294之间。