第5章市场调查数据的数理推断分析培训教材

上传人:yuzo****123 文档编号:141315616 上传时间:2020-08-06 格式:PPT 页数:81 大小:3.11MB
返回 下载 相关 举报
第5章市场调查数据的数理推断分析培训教材_第1页
第1页 / 共81页
第5章市场调查数据的数理推断分析培训教材_第2页
第2页 / 共81页
第5章市场调查数据的数理推断分析培训教材_第3页
第3页 / 共81页
第5章市场调查数据的数理推断分析培训教材_第4页
第4页 / 共81页
第5章市场调查数据的数理推断分析培训教材_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《第5章市场调查数据的数理推断分析培训教材》由会员分享,可在线阅读,更多相关《第5章市场调查数据的数理推断分析培训教材(81页珍藏版)》请在金锄头文库上搜索。

1、市场调查数据的数理推断分析,第5章,1,本章主要介绍利用 Excel 进行数据推断的方法,包括参数估计、假设检验、方差分析、相关和回归分析。所使用的函数为 RAND。,本章简介,本章重点,重 点 、 难 点,参数估计,假设检验,相关和回归分析。,本章难点,使用数据分析工具进行数据推断分析。,2,本章目录,3,5.1.1 利用EXCEL数据分析功能实现随机抽样,实现随机抽样有两种方法:,利用 Excel 数据分析功能实现随机抽样。,使用随机数生成函数实现随机抽样。,例5-1,图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:,第一步:选择“工具”

2、菜单下“数据分析”中“抽样”功能,打开“抽样”对话框,如图 5-2 所示。,例5-1,图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:,第二步:设置相关参数,如图 5-2 所示,单击“确定”按钮。,8,利用 Excel“数据分析”提供的抽样功能抽取的样本存在以下问题:,1,2,随机抽样采用的是可放回抽样,因此,总体中的每个数据都可以多次被抽中,所以样本中的数据一般都会有重复现象。,经过筛选,抽样结果避免了重复,但最终所得样本数量可能少于所需数量,因而要根据经验适当调整在数据样本选取时的数量设置,以使筛选后的样本数量满足要求。,3,尽管高级筛选

3、可以对重复抽样情况进行修补,但抽样结果只能输出所需数目的所抽选项,其他相关信息需要利用其他辅助手段得到,给后继数据分析带来困难。,5.1.2 使用随机数生成函数实现随机抽样,利用随机数函数 RAND()进行随机抽样,上例数据利用 RAND函数抽样的操作步骤为:,第一步:增加字段“生成随机数”和“随机数排序” 。,第二步:在单元格 F2 中输入公式“=RAND()” ,并复制到单元格区域 F3:F81,得到一列动态随机数。如图 5-5 所示。,第三步:选择单元格区域 F2:F81,单击鼠标右键,选择“复制” ,移动光标到单元格 G2,再次单击鼠标右键,选择“选择性粘贴” ,在出现的对话框中选择“

4、数值”并单击“确定” ,得到一列静态随机数。,第四步:选择单元格区域 A1:G81,选择“数据”“排序” ,以“随机数排序”为主要关键字排序。在排序结果中根据所需样本数目,即可以进行进一步数据推断。,5.2.2 均值区间估计,5.2.1 参数估计概述,5.2 总体参数估计,5.2.3 比率区间估计,11,5.2.1参数估计概述,参数估计是指用样本指标(也称为统计量)来估计未知的总体指标(也称为总体参数) 。最常见的是用样本平均数估计总体均数、用样本比率估计总体比率。,点估计也称为定值估计,是以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。,区间估计是给出总体未知参数的可能变动范围

5、,即区间,并用一定的概率保证区间包含总体未知参数,即根据统计量和标准误差推断总体指标的可能范围。,5.2.2均值区间估计,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 (2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第一步:建立均值区间估计计算表,如图 5-7 所示。,15,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区

6、间。 (2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第二步:总体方差已知的区间估计:在单元格B24 中输入已知总体标准差“10” ,在单元格 B25中输入置信水平“95%” ,在单元格 B26 中输入样本容量“ 20 ”,在单元格 B23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格B27 中输入公式“=ABS(NORMSINV(1-B25)/2)” ,计算正态分布临界值;在单元格 B28、B29 中分别输入公式“=B23-B27*B24/SQRT(B26)” , “=B23+ B27*B24/SQRT(B26)” ,计算均

7、值区间的下限和上限。,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 (2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第三步:总体方差未知的区间估计:在单元格D25 中输入置信水平“95%” ,在单元格 D26 中输入样本容量“20” ,在单元格 D23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格D24 中输入公式“=STDEV(C2:C21)” ,计算样本标 准差;在单元格 D27 中输入公式“=TINV

8、(1-D25,D26-1)” ,计算 t 分布临界值;在单元格 D28、D29中分别输入公式“=D23D27* D24/SQRT(D26)” ,“=D23+D27*D24/SQRT(D26)” ,计算均值区间的下限和上限。,5.2.3比率区间估计,比率在大样本情况下,服从正态分布分布,比率的区间估计为:,例5-3,某市区随机调查了 300 名居民户,其中 6户拥有等离子电视机,估计该地区等离子电视机 95%的置信区间。具体的操作步骤如下:,第一步:建立比率区间估计的计算表,如图 5-8所示。 第二步:在单元格 B4 中输入公式“=B3/B2” ,计算样本比率;在单元格 B7中输入公式“=ABS

9、(NORMSINV(1-B6)/2)” ,计算正态分布临界值。 第三步:在单元格 B8、B9 中分别输入公式“=B4-B7*SQRT (B4*(1-B4)/B5)” , “=B4+B7*SQRT(B4*(1-B4)/B5)” ,计算比率置信区间下限和上限。,5.3.2 一个总体参数假设检验,5.3.1 假设检验概述,5.3 总体参数假设检验,5.3.3 两个总体参数假设检验,20,5.3.1假设检验概述,1.假设检验,假设检验是推断分析的另一项重要内容,它与参数估计类似,但角度不同。参数估计是利用样本信息推断未知总体参数,而假设检验是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断

10、假设是否成立的过程。假设检验有参数检验和非参数检验两种。 逻辑上运用反证法,统计上依据小概率事件不可能发生这一原理。,5.3.1假设检验概述,2.原假设与备择假设,统计是对总体参数的具体数值所作的陈述。在假设检验中,有原假设与备择假设。原假设是研究者想收集证据予以反对的假设,又称“零假设” ,用符号表示为 H 0 。之所以用零来修饰原假设,是因为原假设的内容总是没有差异或没有改变,或变量间没有关系等。关于样本统计量,如样本均值或样本均值之差的零假设,是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或者是否相等。 备择假设也称“研究假设” ,是研究者想收集证据予以支持的假设,表示为 H

11、1 。,5.3.1假设检验概述,3.双侧检验与单侧检验,如果备择假设没有特定的方向性,并含有符号“” ,这样的检验称为双侧检验或双尾检验(图 5-9) 。 如果备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验。备择假设的方向为“” ,称为左侧检验(图 5-10) . 备择假设的方向为“” ,称为右侧检验(图 5-11) 。,图5-9双侧假设检验,图5-10 左侧假设检验,图5-11右侧假设检验,5.3.1假设检验概述,4.显著性水平,在假设检验中,把拒绝 H0 所犯的错误称为弃真错误(或类错误) ,发生的概率设为 ,也称显著性水平; 把接受不真实的 H0 所犯的

12、错误,称为取伪错误(或类错误) ,发生的概率设为, 两者之间的关系是: 大, 就小; 小, 就大,一般力求在控制 的前提下减少。显著性水平 的通常取值有 0.1、0.05、0.001 等。 如果犯类错误损失更大,为减少损失, 值取小;如果犯类错误损失更大, 值取大。确定了 ,就确定了临界点。,5.3.1假设检验概述,5.检验统计量与拒绝域,检验统计量是根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。 标准化检验统计量(点估计量假设值)点估计量的标准差,是对样本估计量的标准化结果,即原假设 H0 为真时,点估计量的抽样分布。双侧检验的拒绝域如图5-9 所示,左侧检验

13、的拒绝域如图 5-10 所示,右侧检验的拒绝域如图 5-11所示。,图5-9双侧假设检验,图5-10 左侧假设检验,图5-11右侧假设检验,5.3.1假设检验概述,6. 假设检验的步骤, 根据已知总体与样本陈述原假设和备择假设。 确定一个适当的检验统计量,并利用样本数据算出其具体数值。 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域。 将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域内,拒绝 H,否则不拒绝 H。也可以直接利用 P 值作出决策,P 值,拒绝 H。,5.3.2一个总体参数假设检验,表5-2 一个总体均值检验类型,1.一个总体均值检验,例5-4,利用例 5-1

14、 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第一步:建立如图 5-12所示的总体均值检验表。 第二步:在单元格区域 B7:D8,B15:D16 设置检验形式。其中, (1)为双侧检验, (2)为左侧检验, (3)为右侧检验。在单元格 B4 输入例 5-2 计算样本标准差。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验

15、: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第三步:总体方差已知的情况下,在单元格区域 B10:D10 分别输入公式“=NORMSINV(1B9/2)” , “=NORMSINV(B9)” , “=NORMSINV(1B9)” ,计算三种检验临界值。 在单元格 B11 中输入公式“=(B280)/(B3/SQRT(20)” ,计算检验统计量。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是

16、否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第三步:在单元格区域B12:D12 分别输入公式“=IF(ABS(B11)B10,”平均分不为 80 分“,”平均分为 80 分“)” ,“=IF(B11D10,平均分高于 80 分,平均分不高于 80 分)” ,进行检验决策。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第四步: 总体方差未知情况下, 在单元格区域 B18:D18 分别输入公式 “=TINV(B17, 19)” ,“=-TINV(2*C17,19)” , “=TINV(2*C17,19)”

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号