在数值计算中,为解决求方程近似值的问题,通常对实际问题中遇到的误差进行下列几类的区分: 模型误差 在建立数学模型过程中,要将复杂的现象抽象归结为数学模型,往往要忽略一些次要因素的影响,对问题作一些简化。因此数学模型和实际问题有一定的误差,这种误差称为模型误差。 测量误差在建模和具体运算过程中所用的数据往往是通过观察和测量得到的,由于精度的限制,这些数据一般是近似的,即有误差,这种误差称为测量误差。 截断误差由于实际运算只能完成有限项或有限步运算,因此要将有些需用极限或无穷过程进行的运算有限化,对无穷过程进行截断,这样产生的误差成为截断误差。 舍入误差在数值计算过程中,由于计算工具的限制,我们往往对一些数进行四舍五入,只保留前几位数作为该数的近似值,这种由舍入产生的误差成为舍入误差。 抽样误差 (一)抽样误差的概念 抽样误差:是指样本指标和总体指标之间数量上的差别,例如抽样平均数与总体平均数之差 、抽样成数与总体成数之差(p-P)等。 抽样调查中的误差有两个来源。 1.登记性误差,即在调查过程中,由于主客观原因而引起的误差。 2.代表性误差,即样本各单位的结构情况不足以代表总体特征而引起的误差。 代表性误差的发生有两种情况: 第一,非随机的代表性误差。 第二,随机性误差。 (二)抽样平均误差 抽样平均误差:是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。 抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。 (三)抽样极限误差 抽样极限误差:抽样估计时,应根据研究对象的差异程度和分析任务的需要来确定可允许的误差范围,这种允许的误差范围称为抽样极限误差。它小于或等于样本指标与总体指标之差的绝对值。 设Δx、Δp分别表示抽样平均数极限误差和抽样成数极限误差。则有: Δx≤ Δp≤ 上面不等式可变为下列不等式 ≤ ≤ +Δx P-Δp≤p≤P+Δp 抽样平均数 是以总体平均数 中心在 之间变动,区间( )称为平均数的估计区间,区间总长度为2Δx,在这个区间内的抽样平均数与总体平均数的绝对离差不超过Δx。 抽样成数p是以总体成数P为中心,在p±Δp之间变动,抽样成数在(P-Δp,P+Δp)区间内与总体成数的绝对离差不超过Δp。 总全平均数 落在抽样平均数 的范围内,总体成数P落在抽样成数p±Δp的范围内即: (四)影响抽样误差大小的因素 1.总体各单位标志值的差异程度。 2.抽样单位数的多少。 3.抽样方法。 4.抽样调查的组织形式。 (五)、简单随机抽样的抽样平均误差 1.抽样平均数的平均误差。若以μx表示抽样平均数的平均误差,即表示总体的标准差 (1)在重置抽样的情况下,这时的样本变量x1,x2,…,xn是相互独立的,样本变量x与总体变量X同分布。 抽样平均数的平均误差为总体标准差的 ,抽样平均误差和总体标志变动度的大小成正比,而和样本单位数的平方根成反比。 举例说明:。 设有3个职工,其月工资分别为500、760、840元。现用重置抽样的方法从3个工人工资中随机抽取2人构成样本,并计算样本平均工资,以代表3人总体的平均工资。所有可能的样本以及平均工资及表7—1。 表7—1 工资抽样平均误差计算表 序号 | 样本变量x | 样本平均数 | 平均数离差 | 离差平方 | 1 | 500500 | 500 | -200 | 4000 | 2 | 500760 | 630 | -70 | 4900 | 3 | 500840 | 670 | -30 | 900 | 4 | 760500 | 630 | -70 | 4900 | 5 | 760760 | 760 | 60 | 3600 | 6 | 760840 | 800 | 100 | 1000 | 7 | 840500 | 670 | -30 | 900 | 8 | 840760 | 800 | 100 | 10000 | 9 | 840840 | 840 | 140 | 19600 |
若直接用3人工资计算总平均工资和工资的标准差,其结果为: (元)145.4(元) 抽样平均误差为: 结论:第一,样本平均数的平均数 等于总体平均数,即 = 第二,抽样平均误差要比总体标准差小得多,仅为总体标准差的 。 (2)在不重置抽样的条件下,样本变量x1,x2,…,xn不是相互独立的,经过推导,得 在总体单位数N很大的情况下,μx,可以近似地用下式计算: 举例说明: 仍研究上述3个职工工资水平及其差异问题。假设用不重置抽样,从总体中抽取2个人的工资计算平均数(表7—2)。 抽样平均误差为: (元) 根据已经计算的总体 =700元 σ=145.14元 也可以按不重置抽样误差公式计算: = =72.57(元) 表7—2工资抽样误差计算表 序号 | 样本变量x | 样本平均数 | 平均数离差 | 离差平方 | 1 | 500500 | 630 | -70 | 4900 | 2 | 500760 | 670 | -30 | 900 | 3 | 500840 | 630 | -70 | 4900 | 4 | 760840 | 800 | 100 | 10000 | 5 | 840500 | 670 | -30 | 900 | 6 | 840760 | 800 | 100 | 10000 |
两者的计算结果完全相同。由此可见,在不重置抽样的条件下,抽样平均数仍然等于总体平均数,而它的抽样平均误差72.57元比重置抽样平均误差102.63元小。 2.抽样成数的平均误差。 抽样成数的平均误差表明样本成数和总体成数的绝对离差的平均水平。根据抽样平均数和总体平均数的关系,可是E(p)=P,即抽样成数的平均数等于总体成数。根据抽样平均误差和总体标准差的关系,可较容易推出抽样成数的平均误差。 (1)在重置抽样的情况下。抽样成数的平均误差: 其中P为总体成数,n为样本单位数。 在总体单位数N很大的情况下, 可以近似地用下式计算: 举例说明:要估计某县10万家庭的电视机拥有率,随机抽取100户家庭,调查结果显示有85户拥有电视机,求拥有电视机的平均抽样误差。 根据已知条件可得: p= 85/100 =0.85 σ=p(1-p)= 0.85×0.15=0.1275 在重置抽样下:=0.0357 在不重置抽样下:= =0.0357 计算结果表明,用样本的拥有率来估计总体的拥有率,其抽样误差平均说来为3.6%左右。
|