统计学ppt课件全.ppt

上传人:公**** 文档编号:570165819 上传时间:2024-08-02 格式:PPT 页数:485 大小:15.23MB
返回 下载 相关 举报
统计学ppt课件全.ppt_第1页
第1页 / 共485页
统计学ppt课件全.ppt_第2页
第2页 / 共485页
统计学ppt课件全.ppt_第3页
第3页 / 共485页
统计学ppt课件全.ppt_第4页
第4页 / 共485页
统计学ppt课件全.ppt_第5页
第5页 / 共485页
点击查看更多>>
资源描述

《统计学ppt课件全.ppt》由会员分享,可在线阅读,更多相关《统计学ppt课件全.ppt(485页珍藏版)》请在金锄头文库上搜索。

1、1 - 1第一章第一章 绪论绪论第一节第一节 统计与统计学统计与统计学第二节第二节 统计学的产生与发展统计学的产生与发展第三节第三节 统计学的研究对象与方法统计学的研究对象与方法第四节第四节 统计学的要素和指标统计学的要素和指标1 - 2学习目标学习目标1. 理解统计与统计学的含义理解统计与统计学的含义2. 理解统计学的对象和方法理解统计学的对象和方法3.了解统计学的产生与发展过程了解统计学的产生与发展过程 1 - 3第一节第一节 统计与统计学统计与统计学一一. 统计与统计学的含义统计与统计学的含义二二. 统计学的性质和作用统计学的性质和作用1 - 4一、什么是统计?一、什么是统计?1. 1.

2、 统计工作统计工作统计工作统计工作n n收集数据的活动收集数据的活动收集数据的活动收集数据的活动2. 2. 统计数据统计数据统计数据统计数据对现象计量的结果对现象计量的结果对现象计量的结果对现象计量的结果 3. 3. 统计学统计学统计学统计学n n分析数据的方法与技术分析数据的方法与技术分析数据的方法与技术分析数据的方法与技术1 - 5什么是统计学什么是统计学?1. 1. 数据搜集:例如,调查与试验数据搜集:例如,调查与试验2. 2. 数据整理:例如,分组数据整理:例如,分组 3. 3. 数据展示:例如,数据展示:例如, 图和表图和表4.4.数据分析:例如,回归分析数据分析:例如,回归分析 统

3、统计计学学是是一一门门收收集集、整整理理和和分分析析数数据据的的方方法法科科学学,其其目目的的是是探探索索数数据据的的内内在在数数量量规规律律性性,以以达达到到对对客观事物的科学认识客观事物的科学认识1 - 6Statistics的定义的定义(不列颠百科全书不列颠百科全书)Statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc.Copyright 1994-2000 Encyclop

4、aedia Britannica, Inc. (不列颠百科全书)(不列颠百科全书)1 - 7统计数据的内在规律统计数据的内在规律(一些例子)(一些例子)1.正常条件下新生婴儿的性别比为107:1002.投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/63.农作物的产量与施肥量之间存在相关关系1 - 8统计学的应用领域统计学的应用领域统计学统计学经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会学社会学社会学社会学1 - 9应用统计的领域应用统计的领域actuarial workactuarial work ( (

5、精算精算精算精算) ) agricultureagriculture ( (农业农业农业农业) )animal scienceanimal science ( (动物学动物学动物学动物学) ) anthropologyanthropology ( (人类学人类学人类学人类学) )archaeology archaeology ( (考古学考古学考古学考古学) ) auditing auditing ( (审计学审计学审计学审计学) )crystallography crystallography ( (晶体学晶体学晶体学晶体学) ) demography demography ( (人口统计学

6、人口统计学人口统计学人口统计学) )dentistry dentistry ( (牙医学牙医学牙医学牙医学) ) ecologyecology ( (生态学生态学生态学生态学) )econometrics econometrics ( (经济计量学经济计量学经济计量学经济计量学) ) education education ( (教育学教育学教育学教育学) ) election forecasting and projectionelection forecasting and projection ( (选举预测和策划选举预测和策划选举预测和策划选举预测和策划) )engineering e

7、ngineering ( (工程工程工程工程) ) epidemiology epidemiology ( (流行病学流行病学流行病学流行病学) )finance finance ( (金融金融金融金融) )fisheries researchfisheries research ( (水产渔业研究水产渔业研究水产渔业研究水产渔业研究) )gambling gambling ( (赌博赌博赌博赌博) ) genetics genetics ( (遗传学遗传学遗传学遗传学) )geography geography ( (地理学地理学地理学地理学) ) geology geology ( (地质

8、学地质学地质学地质学) )historical researchhistorical research ( (历史研究历史研究历史研究历史研究) ) human geneticshuman genetics ( (人类遗传学人类遗传学人类遗传学人类遗传学) )1 - 10应用统计的领域应用统计的领域(续续)hydrology hydrology ( (水文学水文学水文学水文学) ) IndustryIndustry ( (工业工业工业工业) ) linguisticslinguistics ( (语言学语言学语言学语言学) ) literature literature ( (文学文学文学文学

9、) )manpower planningmanpower planning ( (劳动力计划劳动力计划劳动力计划劳动力计划) )management sciencemanagement science ( (管理科学管理科学管理科学管理科学) )marketing marketing ( (市场营销学市场营销学市场营销学市场营销学) ) medical diagnosismedical diagnosis ( (医学诊断医学诊断医学诊断医学诊断) )meteorology meteorology ( (气象学气象学气象学气象学) ) military sciencemilitary scien

10、ce ( (军事科学军事科学军事科学军事科学) )nuclear material safeguardsnuclear material safeguards ( (核材料安全管理核材料安全管理核材料安全管理核材料安全管理) )ophthalmology ophthalmology ( (眼科学眼科学眼科学眼科学) ) pharmaceutics pharmaceutics ( (制药学制药学制药学制药学) )physicsphysics ( (物理学物理学物理学物理学) ) political sciencepolitical science ( (政治学政治学政治学政治学) )psycho

11、logy psychology ( (心理学心理学心理学心理学) ) psychophysics psychophysics ( (心理物理学心理物理学心理物理学心理物理学) )quality controlquality control ( (质量控制质量控制质量控制质量控制) ) religious studiesreligious studies ( (宗教研究宗教研究宗教研究宗教研究) )sociologysociology ( (社会学社会学社会学社会学) ) survey samplingsurvey sampling ( (调查抽样调查抽样调查抽样调查抽样) )taxonomy

12、taxonomy ( (分类学分类学分类学分类学) ) weather modification weather modification ( (气象改善气象改善气象改善气象改善) )1 - 11补充:统计学的分科补充:统计学的分科1 - 12统计方法统计方法1 - 13描述统计描述统计1.内容内容n n搜集数据搜集数据n n整理数据整理数据n n展示数据展示数据2. 目的目的n n描述数据特征描述数据特征n n找出数据的基本规律找出数据的基本规律0 0 0252525505050Q1Q1Q1Q2Q2Q2Q3Q3Q3Q4Q4Q4¥x x x = 30 = 30 = 30 s s s2 22 =

13、 105 = 105 = 1051 - 14推断统计推断统计1.内容内容参数参数估计估计假设检验假设检验2.目的目的对总体特征作出对总体特征作出推断推断样样本本总体总体1 - 15描述统计与推断统计的关系描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据总体内在的总体内在的总体内在的总体内在的数量规律性数量规律性数量规律性数量规律性推断统计推断统计推断统计推断统计(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进行估计和检验等)行估计和检验

14、等)行估计和检验等)行估计和检验等)概率论概率论概率论概率论(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律和中心极限定理等)和中心极限定理等)和中心极限定理等)和中心极限定理等)描述统计描述统计描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程1 - 16统计学的性质统计学的性质

15、1.数量性数量性有大量数据出现的地方,都要用到统计学有大量数据出现的地方,都要用到统计学2 .方法论学科方法论学科3 . 规律性规律性统计学所统计学所研究的是总体的数量特征及其分布的规研究的是总体的数量特征及其分布的规律性律性1 - 17统计的作用统计的作用一一. 为党和国家各级领导机构决策服务为党和国家各级领导机构决策服务-为企业单位和社会事业单位管理服务为企业单位和社会事业单位管理服务-为广大人民了解社会服务为广大人民了解社会服务-为科研机构和人员进行理论研究服务为科研机构和人员进行理论研究服务-为各国人民相互了解和发展国际交流为各国人民相互了解和发展国际交流服务服务1 - 18第二节第二

16、节 统计学的产生与发展统计学的产生与发展一一. 政治算术政治算术社会经济统计社会经济统计二二. 概率论概率论数理统计数理统计1 - 19统计学家是科学家统计学家是科学家1 - 20历史上著名的统计学家历史上著名的统计学家Jacob BernoulliJacob Bernoulli ( (伯努利伯努利伯努利伯努利) (1654-1705) ) (1654-1705) Edmond HalleyEdmond Halley ( (哈雷哈雷哈雷哈雷) (1656-1742) ) (1656-1742) De MoivreDe Moivre ( (棣美佛棣美佛棣美佛棣美佛) (1667-1754) )

17、(1667-1754) Thomas BayesThomas Bayes ( (贝叶斯贝叶斯贝叶斯贝叶斯) (1702-1761) (1702-1761)Leonhard EulerLeonhard Euler ( (欧拉欧拉欧拉欧拉) (1707-1783) (1707-1783)Pierre Simon LaplacePierre Simon Laplace ( (拉普拉斯拉普拉斯拉普拉斯拉普拉斯) (1749-1827) ) (1749-1827) Adrien Marie LegendreAdrien Marie Legendre ( (勒让德勒让德勒让德勒让德) (1752-1833

18、) ) (1752-1833) Thomas Robert MalthusThomas Robert Malthus ( (马尔萨斯马尔萨斯马尔萨斯马尔萨斯) (1766-1834) (1766-1834)Friedrich GaussFriedrich Gauss ( (高斯高斯高斯高斯) (1777-1855) ) (1777-1855) Johann Gregor MendelJohann Gregor Mendel ( (孟德尔孟德尔孟德尔孟德尔) (1822-1884) (1822-1884)Karl PearsonKarl Pearson ( (皮尔森皮尔森皮尔森皮尔森) (185

19、7-1936) (1857-1936)Ronald Aylmer FisherRonald Aylmer Fisher ( (费歇费歇费歇费歇) (1890-1962) (1890-1962)Jerzy NeymanJerzy Neyman ( (内曼内曼内曼内曼)(1894-1981) )(1894-1981) Egon Sharpe PearsonEgon Sharpe Pearson ( (皮尔森皮尔森皮尔森皮尔森) (1895-1980) ) (1895-1980) William FellerWilliam Feller ( (费勒费勒费勒费勒)(1906-1970)(1906-19

20、70)1 - 21统计学发展的历史线索统计学发展的历史线索1.一般认为,统计学产生于17世纪中叶2.统计学的发展过程基本上沿着两条主线展开以以“ “政政治治算算术术学学派派” ”为为开开端端形形成成和和发发展展起起来来的的、以以社社会会经经济济问问题题为为主主要要研研究究对对象象的的社社会会经经济济统统计计以以概概率率论论的的研研究究为为开开端端、并并以以概概率率论论为为基基础础形形成成和和发发展展起起来来的的、以以方方法法和和应应用用研研究究为为主主的的数数理统计理统计3.今天,社会经济统计和数理统计仍然在以各自不同的方式发展着1 - 22政治算术政治算术社会经济统计社会经济统计1. 1.政

21、政治治算算术术学学派派产产生生于于1717世世纪纪中中叶叶的的英英国国,代代表表人人物物主主要要是是威威廉廉 配配第第(William (William PattyPatty,16231687)16231687)和和约约翰翰 格朗特格朗特(John Graunt(John Graunt,16201674)16201674)2. 2.1717世纪中叶的政治算术学派可看作是统计学的开端世纪中叶的政治算术学派可看作是统计学的开端3. 3.1919世世纪纪,沿沿着着约约翰翰 格格朗朗特特所所开开创创的的人人口口统统计计以以及及沿沿着着威威廉廉 配配第第所所开开创创的的经经济济统统计计有有了了进进一一步

22、步的的发发展展4. 4.威威廉廉 配配第第为为以以后后经经济济统统计计的的发发展展开开拓拓了了道道路路;约约翰翰 格朗特为人口统计的发展开拓了道路格朗特为人口统计的发展开拓了道路5. 5.政政治治算算术术学学派派则则为为后后来来的的社社会会经经济济统统计计的的发发展展奠奠定定了基础了基础1 - 23概率论概率论数理统计数理统计1. 1.概概率率沦沦研研究究起起源源于于1717世世纪纪中中叶叶意意大大利利文文艺艺复复兴兴时时代代,代表人物主要有法国的拉普拉斯和比利时的凯特勒代表人物主要有法国的拉普拉斯和比利时的凯特勒2. 2.古古典典统统计计时时期期的的概概率率论论基基本本上上是是独独立立发发展

23、展的的,最最开开始始的的概概率率论论是是从从对对赌赌博博的的研研究究开开始始。它它与与统统计计学学( (主主要要是是指政治算术指政治算术) )没有太多的联系没有太多的联系3. 3. 从从1919世世纪纪中中叶叶到到2020世世纪纪中中叶叶,概概率率论论的的进进一一步步发发展展为为数数理理统统计计学学的的形形成成和和发发展展奠奠定定了了基基础础。主主流流从从描描述述性性统计学向推断统计学发展统计学向推断统计学发展 4. 4.本本世世纪纪5050年年代代以以后后,统统计计理理论论、方方法法和和应应用用进进入入了了一一个全面发展的阶段个全面发展的阶段1 - 24第三节第三节 统计学的研究对象及方统计

24、学的研究对象及方法法-统计学的研究对象及特点统计学的研究对象及特点-统计学的研究方法统计学的研究方法1 - 25统计学研究对象及特点1. 研究对象n n社会经济现象的数量方面社会经济现象的数量方面2. 特点n n数量性数量性n n总体性总体性n n社会性社会性 1 - 26统计学的研究方法统计学的研究方法1 .大量观察法n n对所研究事物的全部或足够数量进行观察对所研究事物的全部或足够数量进行观察的方法。依据是大数定律的方法。依据是大数定律2 .综合指标法n n从数量方面对现象总体特征的概括说明从数量方面对现象总体特征的概括说明3. 统计推断法n n在一定的置信度下,根据样本资料的特征在一定的

25、置信度下,根据样本资料的特征对总体特征作出估计和预测的方法对总体特征作出估计和预测的方法1 - 27第四节第四节 统计学的要素和指标统计学的要素和指标一一.统计学的要素统计学的要素二二.指标及指标体系指标及指标体系1 - 28统计学的要素统计学的要素1.总体(Population)n n根据一定目的确定的所要研究事物的总根据一定目的确定的所要研究事物的总体体2. 样本(Sample)n n从总体中抽取出来的部分单位组成的集从总体中抽取出来的部分单位组成的集合体合体3. 总体单位n n组成整体的各个个体组成整体的各个个体1 - 29指标及指标体系指标及指标体系1.标志与指标2. 统计指标的特点3

26、. 指标的分类统计指标体系1 - 30标志与指标标志与指标1 - 31标志与指标的概念标志与指标的概念1.1.标志标志标志标志n n 说明总体单位属性说明总体单位属性和特征的名称和特征的名称2.2.指标指标指标指标n n 运用一定的统计方运用一定的统计方法对各单位的标志值进法对各单位的标志值进行登记、整理、汇总,行登记、整理、汇总,形成反映总体数量特征形成反映总体数量特征的综合指标的综合指标1 - 32标志与指标的概念标志与指标的概念1 - 33标志与指标的区别与联系标志与指标的区别与联系区别区别n n指标是说明总体特指标是说明总体特征的,而标志是说征的,而标志是说明总体单位特征的明总体单位特

27、征的n n标志有不能用数值标志有不能用数值表示的品质标志与表示的品质标志与能用数值表示的数能用数值表示的数量标志,而指标都量标志,而指标都是用数值表示是用数值表示联系n n很多统计指标的数很多统计指标的数值是从总体单位的值是从总体单位的数量标志值汇总而数量标志值汇总而来的来的n n指标与标志之间存指标与标志之间存在变换关系在变换关系1 - 34统计指标的特点统计指标的特点1.同质事物的可量性n n小康水平、公司绩效、满意度小康水平、公司绩效、满意度2.量的综合性n n许多个体现象的数量综合的结果许多个体现象的数量综合的结果3.具体性1 - 35统计指标的分类统计指标的分类1.按说明的内容特征n

28、 n数量指标和质量指标数量指标和质量指标2.按具体内容和作用n n 总量指标、相对指标和平均指标总量指标、相对指标和平均指标3.按计量单位n n实物指标、价格指标和劳动量指标实物指标、价格指标和劳动量指标1 - 36统计指标体系统计指标体系由若干个相互联系相互制约的统计指标组成的一个统计指标系统基本统计指标体系专题统计指标体系指标类型代码指标性质 流动性指标流动比率X1适度指标速动比率X2适度指标盈利性指标自有资产收益率X3正指标信托资产收益率X4正指标资本收益率X5正指标信托报酬率X6正指标成长性指标自有资产增长率X7正指标信托资产增长率X8正指标表内利润增长率X9正指标信托收入增长率X10

29、正指标安全性指标不良资产率X11逆指标资本负债率X12适度指标1 - 37几种常用的统计软件几种常用的统计软件(Software)典型的统计软件典型的统计软件n nSASn nSPSSn nMINITABn nSTATISTICAn nExcelMINITABMINITABSTATISTICASTATISTICAExcelExcelSASSASSPSSSPSS1 - 38第二章第二章 统计调查统计调查统计学1 - 39第二章第二章 统计调查统计调查第一节第一节 统计调查的种类与技术统计调查的种类与技术第二节第二节 统计调查的方案统计调查的方案第三节第三节 统计调查的问卷统计调查的问卷第四节第四

30、节 统计调查的组织方式统计调查的组织方式1 - 40学习目标学习目标1.了解统计调查的种类了解统计调查的种类2.了解统计调查方式了解统计调查方式3.掌握调查方案的设计掌握调查方案的设计4.掌握调查问卷的设计掌握调查问卷的设计1 - 41第一节 统计调查的种类与技术一. 统计调查的意义二. 统计调查的种类三. 统计调查技术1 - 42统计调查的意义统计调查的意义1 - 43统计调查的意义统计调查的意义1 - 44统计调查的种类统计调查的种类1 - 45统计调查的种类统计调查的种类全面调查全面调查非全面调非全面调查查一次性一次性经常性经常性统计报表统计报表专门调查专门调查1 - 46统计调查的技术

31、统计调查的技术1 - 47统计调查的技术统计调查的技术数据的搜集方法数据的搜集方法询问调查访访问问调调查查观察实验电电话话调调查查邮邮寄寄调调查查观观察察电电脑脑辅辅助助座座谈谈会会个个别别深深访访实实验验1 - 48访问调查访问调查(概念要点概念要点)1. 调查者与被调查者通过面对面地交谈而获得资料2. 有标准式访问和非标准式访问n n标标准准式式访访问问通通常常按按事事先先设设计好的问卷进行计好的问卷进行n n非非标标准准式式访访问问事事先先一一般般不不制作问卷制作问卷对不起,对不起,对不起,打扰了打扰了打扰了!1 - 49邮寄调查邮寄调查(概念要点)(概念要点)1.也称邮寄问卷调查也称邮

32、寄问卷调查2.是一种标准化调查是一种标准化调查3.调调查查者者与与被被调调查查者者没没有有直直接接的的语语言言交交流流,信信息的传递依赖于问卷息的传递依赖于问卷4.通通过过某某种种方方式式将将调调查查表表或或问问卷卷送送至至某某调调查查者者手手中中,由由被被调调查查者者填填写写,然然后后将将问问卷卷寄寄回回指指定收集点定收集点5.问问卷卷或或表表格格的的发发放放方方式式有有邮邮寄寄、宣宣传传媒媒介介传传送、专门场所分发三种送、专门场所分发三种1 - 50电话调查电话调查(概念要点)(概念要点)1.调查者利用电话与被调查者进行语言交流以获得信息2.时效快、成本低3.问题的数量不宜过多 您好您好!

33、 !我是我是调查公调查公司的调查员司的调查员1 - 51电脑辅助调查电脑辅助调查(概念要点)(概念要点)1.又称电脑辅助电话调查2.电脑与电话相结合完成调查的全过程3.一般需借助专门的软件进行4.硬件设备要求较高1 - 52座谈会座谈会(概念要点)(概念要点)1. 也称集体访谈2. 将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料3. 参加座谈会的人数不宜过多,一般为610人4. 侧重于定性研究1 - 53个别深度访问个别深度访问(概念要点)(概念要点)1.一次只有一名受访者参加、针对特殊问题的调查2.适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题3.侧

34、重于定性研究1 - 54观察法观察法(概念要点)(概念要点)1. 就调查对象的行动和意识,调查人员边观察边记录以收集所需信息2. 调查人员不是强行介入3. 能够在被调查者不察觉的情况下获得资料1 - 55实验法实验法(概念要点)(概念要点)1. 在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料2. 有室内实验法和市场实验法1 - 56统计数据的间接来源统计数据的间接来源1. 1. 公公公公开开开开出出出出版版版版物物物物: 中中国国统统计计年年鉴鉴、中中国国统统计计摘摘要要、中中国国社社会会统统计计年年鉴鉴、中中国国工工业业经经济济统统计计年年鉴鉴、中中国国农农村村统统计计年

35、年鉴鉴、中中国国人人口口统统计计年年鉴鉴、中中国国市市场场统统计计年年鉴鉴、世世界界经经济济年年鉴鉴、国国外外经经济济统统计计资资料料、世世界界发发展报告展报告InternetInternet 2. 2. 网络网络中国统计中国统计年鉴年鉴20012001中中国国人人口口统统计计年年鉴鉴中中国国市市场场统统计计年年鉴鉴世世界界发发展展报报告告世世界界经经济济年年检检工工业业普普查查数数据据中国统计出版社1 - 57第二节 调查方案设计一. 确定调查目的二. 确定调查对象和调查单位三. 设计调查项目和调查表四. 方案设计中的其他内容1 - 58调查方案设计调查方案设计1 - 59调查目的调查目的1

36、. 调查要达到的具体目标2.回答“为什么调查?”3.调查之前必须明确1 - 60调查对象和调查单位调查对象和调查单位1.调查对象:调查对象:调查对象:调查对象:调查研究的现象总体或调查范围调查研究的现象总体或调查范围2.调查单位:调查单位:调查单位:调查单位:调查项目的承担者。可以是调查对调查项目的承担者。可以是调查对象的全部单位(全面调查),也可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)象中的一部分单位(非全面调查)3.区别调查单位与报告单位区别调查单位与报告单位4.回答回答“ “向谁调查?向谁调查?” ”调查对象调查对象调查单位?调查单位? 1 - 6

37、1调查提纲和调查表调查提纲和调查表1. 调调查查提提纲纲:调查提纲由调查项目构成,及调查的具体内容2. 调查表:调查表:表现调查项目的表格或问卷3. 回答“调查什么?”QQ1 1 QQ2 2 QQ3 3 QQ4 4 1 - 62方案设计中的其他问题方案设计中的其他问题1. 明确调查所采用的方法2. 确定调查资料的所属时间和调查工作的期限3. 调查的组织与实施计划1 - 63第三节 统计调查问卷一. 问卷的类型与结构-问卷的设计程序和形式-问卷设计应注意的问题1 - 64问问卷卷的类型的类型与结构与结构1 - 65调查问卷的基本类型调查问卷的基本类型按填写方式划分:按填写方式划分:按填写方式划分

38、:按填写方式划分:1. 1. 自自填填式式问问卷卷,标标准准化化语语句句。例如:网络问卷例如:网络问卷访访问问式式问问卷卷,口口头头回回答答。例如:入户调查例如:入户调查1 - 66调查问卷的基本结构调查问卷的基本结构1.题目题目2.说明信说明信3.被调查者的基本情况被调查者的基本情况4.调调查查事事项项的的问问题题和和答答案案:开放式问题和封闭式问题开放式问题和封闭式问题5.填写说明和解释填写说明和解释1 - 67问卷的设计程序和形式问卷的设计程序和形式1 - 68问卷的设计程序问卷的设计程序1. 主要环节:主要环节:初步探索、设计初稿、试用和修改初步探索、设计初稿、试用和修改2. 方法:方

39、法:先分后合的卡片法和先合后分的框图法先分后合的卡片法和先合后分的框图法1 - 69问卷的设计形式问卷的设计形式1.1.自由询问式:自由询问式:自由询问式:自由询问式:自由发表意见自由发表意见2.2.二项选择:二项选择:二项选择:二项选择:using “yes”or “no”to replyusing “yes”or “no”to reply3.3.多项选择式多项选择式多项选择式多项选择式4.4.顺位式:顺位式:顺位式:顺位式:定出先后次序定出先后次序5.5.赋值评价式:赋值评价式:赋值评价式:赋值评价式:K K点量表点量表问卷样板1 - 70第四节 统计调查的组织方式一. 普查-抽样调查-统

40、计报表-重点调查和典型调查1 - 71统计调查方式统计调查方式1 - 72统计调查方式统计调查方式1 - 73普查普查(概念要点)(概念要点)1.为特定目的专门组织的非经常性全面调查2. 通常是一次性或周期性的3. 一般需要规定统一的标准调查时间4. 数据的规范化程度较高5. 应用范围比较狭窄总体总体1 - 74抽样调查抽样调查(概念要点概念要点)1. 从总体中随机抽取一部分单位(样本)进行调查总体总体随机样本随机样本 4. 具有经济性、时效性强、适应面广、准确性高等特点2. 目的是推断总体的未知数字特征3. 最常用的调查方式一 次 失 败 的 抽 样 调 查1 - 75统计报表统计报表(概念

41、要点概念要点)1. 统计调查方式之一2. 过去曾经是我国主要的数据收集方式3. 按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4. 有各种各样的类型1 - 76重点调查和典型调查重点调查和典型调查(概念要点概念要点)2.典型调查典型调查典型调查典型调查n n从调查对象的全部单位中选从调查对象的全部单位中选择少数典型单位进行调查择少数典型单位进行调查n n目的是描述和揭示事物的本目的是描述和揭示事物的本质特征和规律质特征和规律n n调查结果不能用于推断总体调查结果不能用于推断总体1.重点调查重点调查从调查对象的全部单位中选择少数重点单位进行从调查对象的全部单位中选择少

42、数重点单位进行调查调查调查结果不能用于推断总体调查结果不能用于推断总体1 - 77本章小结本章小结1. 统计调查的基本任务统计调查的基本任务2. 统计调查方案统计调查方案3. 统计调查问卷统计调查问卷4.调查问卷的基本结构调查问卷的基本结构5.统计调查的方式统计调查的方式1 - 78结 束1 - 79第三章第三章 统计资料整理统计资料整理统计学1 - 80第三章第三章 统计数据的整理与显示统计数据的整理与显示第一节第一节 统计资料整理的一般问题统计资料整理的一般问题 第二节第二节 统计分组统计分组第三节第三节 分配数列分配数列第四节第四节 数据显示数据显示1 - 81学习目标学习目标1.了解统

43、计整理在统计活动中的作用了解统计整理在统计活动中的作用2.了解统计整理的内容、组织形式了解统计整理的内容、组织形式3.了解统计资料审核与汇总的技术了解统计资料审核与汇总的技术4.掌握统计分组的基本理论与方法掌握统计分组的基本理论与方法5.懂得统计表的构成和制表规范懂得统计表的构成和制表规范6.用用Excel作作频数分布表和形频数分布表和形图图1 - 82第一节第一节 统计资料整理的一般统计资料整理的一般问题问题一一. 统计整理统计整理-统计整理的内容统计整理的内容-统计资料的审核和汇总统计资料的审核和汇总1 - 83统计整理统计整理统计整理的概念:统计整理的概念:统计整理的概念:统计整理的概念

44、: 根根据据统统计计研研究究的的目目的的要要求求,对对统统计计调调查查所所得得的的原原始始资资料料进进行行科科学学的的分分类类、汇汇总总,或或对对已已初初步步加加工工的的资资料料进进行行再再加加工工,使使之之成成为为系系统统化化、条条理理化化的的综综合合资资料料,已已反反映映现现象象总总体体特特征征的工作过程的工作过程1 - 84统计整理的内容统计整理的内容1.资料审核2.划类分组3.资料汇总4.编制统计表、统计图1 - 85 资料的审核资料的审核1.数据的审核发现数据中的错误发现数据中的错误2.数据的筛选找出符合条件的数据找出符合条件的数据3.数据排序发现数据的基本特征发现数据的基本特征升序

45、和降序升序和降序1 - 86资料的审核资料的审核(原始数据)(原始数据) 审核的内容审核的内容审核的内容审核的内容1.完整性审核完整性审核n n检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏n n所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全2.及时性审核及时性审核n n检查数据是否及时报送检查数据是否及时报送3. 3. 准确性审核准确性审核n n检检查查数数据据是是否否真真实实反反映映客客观观实实际际情情况况,内内容容是是否否符合实际符合实际n n检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等1 - 87资料的审核资料的审核(汇总后的

46、资料)(汇总后的资料)审核的方法审核的方法1.复计审核n n对每个指标数值进行复核计算对每个指标数值进行复核计算2.表表审核n n检查不同统计表出现的同一指标数值是否一致检查不同统计表出现的同一指标数值是否一致3.对照审核4.表实审核1 - 88统计汇总统计汇总基本组织形式基本组织形式1.逐级汇总n n自下而上逐级对资料进行汇总:GDP2.集中汇总n n将资料集中在最高机关或指定机构进行汇总3.综合汇总n n基本资料逐级汇总,其他资料集中汇总1 - 89 第二节第二节 统计分组统计分组一一. 统计分组的概念和作用统计分组的概念和作用-统计标志的选择统计标志的选择-统计分组的方法统计分组的方法1

47、 - 90统计分组的概念统计分组的概念n n 根根据据统统计计研研究究的的需需要要,按按照照一一定定的的标标志志,将将统统计计总总体体划划分分为为若若干干个个组组成成部部分分的的一一种种统统计计方方法。法。n n 相对于总体的相对于总体的“ “分分” ”,个体的,个体的“ “合合” ”1 - 91统计分组的作用统计分组的作用1.1.区分社会经济现象的类型区分社会经济现象的类型区分社会经济现象的类型区分社会经济现象的类型n n银行、保险公司、信托投资公司、证券投资公司等等银行、保险公司、信托投资公司、证券投资公司等等2.2.反映社会经济现象总体的内部结构反映社会经济现象总体的内部结构反映社会经济

48、现象总体的内部结构反映社会经济现象总体的内部结构n n性别结构、学历结构、年龄结构、地区结构性别结构、学历结构、年龄结构、地区结构3.3.反映社会经济现象之间的依存关系反映社会经济现象之间的依存关系反映社会经济现象之间的依存关系反映社会经济现象之间的依存关系n n收入与长相之间的关系、股票价格与公司业绩的关系收入与长相之间的关系、股票价格与公司业绩的关系1 - 92分组标志的选择分组标志的选择1.1.根据统计研究的目的选择根据统计研究的目的选择根据统计研究的目的选择根据统计研究的目的选择2.2.选择现象中最具有本质特征的标志选择现象中最具有本质特征的标志选择现象中最具有本质特征的标志选择现象中

49、最具有本质特征的标志n n学生:男、女学生:男、女 ;大学:;大学:1 1本、本、2 2本、本、3 3本、大专本、大专3.3.结合被研究对象所处的历史条件合经济状况选择结合被研究对象所处的历史条件合经济状况选择结合被研究对象所处的历史条件合经济状况选择结合被研究对象所处的历史条件合经济状况选择n n封建社会与资本主义社会封建社会与资本主义社会n n发展中国家与发达国家发展中国家与发达国家1 - 93统计分组的方法统计分组的方法1 - 94分组方法分组方法单项式分组单项式分组组距式分组组距式分组1 - 95品质标志分组品质标志分组例:对我校学生按品质标志进行分组例:对我校学生按品质标志进行分组

50、按性别分组按性别分组按性别分组按性别分组 按学院分组按学院分组按学院分组按学院分组 按来源地分组按来源地分组按来源地分组按来源地分组 是否可以按照年纪来分组?是否可以按照年纪来分组?是否可以按照年纪来分组?是否可以按照年纪来分组?1 - 96分组方法分组方法单项式分组单项式分组组距式分组组距式分组1 - 97单项式分组单项式分组(要点)(要点)1. 1. 将一个变量值作为一组将一个变量值作为一组2. 2. 适合于离散变量适合于离散变量3. 3. 适合于变量值较少的情况适合于变量值较少的情况1 - 98单项式分组表单项式分组表(实例)(实例)表表表表3-1 3-1 某车间某车间某车间某车间505

51、0名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221121 - 99组距分组组距分组(要点)(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.必须遵循“不重不漏”的原则5.可采用等距分组,也可采用不

52、等距分组 1 - 100组距分组组距分组(步骤)(步骤)1. 1.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。在在实实际际分分组组时时,可可以以按按 Sturges Sturges 提提出的经验公式来确定组数出的经验公式来确定组数K K2. 2.确确定定各各组组的的组组距距:组组距距(Class (Class Width)Width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所分的组数来确定,即所分的组数来确定,即 组距组距组距组距( ( 最大值最大值

53、最大值最大值 - - 最小值)最小值)最小值)最小值) 组数组数组数组数 3. 3.根据分组整理成频数分布表根据分组整理成频数分布表 1 - 101组距分组组距分组(几个概念)(几个概念)1. 1. 下下下下 限:限:限:限:一个组的最小值一个组的最小值2. 2. 上上上上 限:限:限:限:一个组的最大值一个组的最大值3. 3. 组组组组 距:距:距:距:上限与下限之差上限与下限之差4. 4. 组中值:组中值:组中值:组中值:下限与上限之间的中点值下限与上限之间的中点值1 - 102等距分组表等距分组表(上下组限重叠)(上下组限重叠)表表表表3-2 3-2 某车间某车间某车间某车间5050名工

54、人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计501001 - 103等距分组表等距分组表(上下组限间断)(上下组限间断)表表表表3-3 3-3 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)1051091101141

55、15119120124125129130134135139358141064610162820128合计合计501001 - 104等距分组表等距分组表(使用开口组)(使用开口组)表表表表3-4 3-4 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110114115119120124125129130134135以上以上358141064610162820128合计合计501001 - 105统计分组的形式统计分组的形式1 - 106统计

56、分组形式统计分组形式1 - 107简单分组简单分组(举例)(举例)表表表表3-5 3-5 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%) 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计20011001 - 108复合分组复合分组(举例)(举例)表表表表3 3-

57、 - 6 6 某大学在校学生人数表某大学在校学生人数表某大学在校学生人数表某大学在校学生人数表 指标指标人数人数(人人)比例比例频率频率(%)大一大一 男男 女女大二大二 男男 女女大三大三 男男 女女大四大四 男男 女女 合计合计1 - 109分配数列的概念和种类分配数列的概念和种类1 - 110第三节第三节 分配数列分配数列-分配数列的概念和分类分配数列的概念和分类-数量数列分布表与分布图数量数列分布表与分布图-次数分布的一般特征次数分布的一般特征1 - 111几个概念几个概念1. 分配数列分配数列: 用来反映总体单位在各组中分布状 况的统计数列2. 频频 数:数:落在各组中的统计单位个数

58、3. 频频 率:率:某一组单位个数占总体单位的比重1 - 112变量数列分布表变量数列分布表1 - 113编制频数分布表的步骤编制频数分布表的步骤排排列列数数据据编制频数分编制频数分布表的步骤布表的步骤确确定定组组数数计计算算频频数数编编制制表表格格确确定定组组距距1 - 114次数分布表的编制次数分布表的编制(实例)(实例)117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125108 131 125 117 122

59、 133 126 122 118 108108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 120 123 127 135112 134

60、 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121【例例例例3.13.1】某某生生产产车车 间间 5050名名 工工 人人 日日加加工工零零件件数数如如下下(单单位位:个个)。试试采采用用单单变变量量值值对数据进行分组。对数据进行分组。 1 - 115单变量值分组表单变量值分组表表表表表3-7 3-7 某车间某车间某车间某车间5050名工人日加工零件

61、数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221121 - 116等距分组表等距分组表(上下组限重叠)(上下组限重叠)表表表表3-5 3-5 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名

62、工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计501001 - 117等距分组表等距分组表(上下组限间断)(上下组限间断)表表表表3-8 3-8 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141

63、064610162820128合计合计501001 - 118等距分组表等距分组表(使用开口组)(使用开口组)表表表表3-9 3-9 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110114115119120124125129130134135以上以上358141064610162820128合计合计501001 - 119次数分布图次数分布图1 - 120简单次数分布图示简单次数分布图示用用Excel作图作图以下图形均由以下图形均由以下

64、图形均由以下图形均由计算机绘制计算机绘制计算机绘制计算机绘制! !ExcelSTATISTICASTATISTICA1 - 121单项式数列次数分布图单项式数列次数分布图(折线图的制作)(折线图的制作)1.以横轴代表变量值,以纵轴代表次数。2.用折线连接各组变量相应的分配次数所对应的坐标点。即得到分布曲线(Frequency ploygon)1 - 122分组数据分组数据直方图直方图(直方图的制作)(直方图的制作)1.以横轴代表变量值,以纵轴代表次数。2.以各组组距为宽,以各组次数为高,绘出对应的矩形。So各组矩形面积占矩形面积和的百分数与该组频率相同。即直方图(Histogram)1 - 1

65、23分组数据分组数据直方图直方图(直方图的绘制)直方图的绘制)频频频频频频数数数数数数( ( (人人人人人人) ) )151512129 96 63 3105105110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )图图图图3-10 3-10 某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120

66、125125之间之间! !1 - 124分组数据分组数据折线图折线图(折线图的制作)(折线图的制作)1.折线图也称频数多边形图折线图也称频数多边形图(Frequency polygon)(Frequency polygon)2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点( (组组中值中值) )用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是n n第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)

67、连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与其竖边中点连接到横轴与其竖边中点连接到横轴n n折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所表示的频数分布是一致的所表示的频数分布是一致的1 - 125151512129 96 63 3105105 110110 115115120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )频频频频频频数数数数数数( (人人人人人人) )折线图下的面积折线图下的面积与直方图的面积与直方图的面

68、积相等!相等!分组数据分组数据折线图折线图(折线图的绘制)(折线图的绘制)图图图图3-11 3-11 某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图1 - 126累计次数分布累计次数分布1.意义:知知道道截截至至某某一一组组变变量量值值以以下下或或以以上上的的对对应分配次数是多少应分配次数是多少2.计算:计算累计次数和累计频率计算累计次数和累计频率3.方法:以下累计和以上累计以下累计和以上累计1 - 127累计次数分布图累计次数分布图人均月消费性支出(元)人均月消费性支出(元)人均月消费性支出(元)人均月消费性支出(元)

69、累累累累计计计计次次次次数数数数图图图图3-12 3-12 家庭月人均消费性支出累计次数分布图家庭月人均消费性支出累计次数分布图家庭月人均消费性支出累计次数分布图家庭月人均消费性支出累计次数分布图1 - 128次数分布的类型次数分布的类型1 - 129次数分布的类型次数分布的类型对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布图图图图3-17 3-17 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布1 - 130第四节第四节 数据显示数据显示一一. 统

70、计表的构成统计表的构成二二. 统计表的设计统计表的设计1 - 131统计表的结构统计表的结构表表表表3- 19973- 199719981998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1997年年 1998年年 一、调查户数一、调查户数 二、平均每户家庭人口数二、平均每户家庭人口数 三、平均每户就业人口数三、平均每户就业人口数 四、平均每人全部收入四、平均每人全部收入 五、平均每人实际支出五、平均每人实际支出 消费性支出消费性支出 非消费性支出非消费性支出 六、平均每人居住面积六、平均每人居住面积户户人人人人元元元

71、元元元元元平方米平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:资料来源:中国统计摘要中国统计摘要19991999,中国统计出版社,中国统计出版社,19991999,第,第7979页。页。注:注:1 1本表为城市和县城的城镇居民家庭抽样调查材料。本表为城市和县城的城镇居民家庭抽样调查材料。 2 2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交

72、通和通讯、娱乐教育文化服务、居住、杂项商品和服务。保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行行行行标标标标题题题题表头表头表头表头列列列列标标标标题题题题数数数数字字字字资资资资料料料料附附附附加加加加1 - 1321. 1.要合理安排统计表的结构要合理安排统计表的结构2. 2.表表中中的的合合计计栏栏可可以以排排在在前前面面,也也可可以以排排在在最最后后,如如果果只只列出其中部分项目时,则合计栏必须排在前面列出其中部分项目时,则合计栏必须排在前面3. 3.数数据据计计量量单单位位相相同同时时,可可放放在在表表的的右右上上角角标标明明,不不同同时时应放在每个指标后或单列出一列

73、标明应放在每个指标后或单列出一列标明4. 4.表中的上下两条横线一般用粗线,其他线用细线表中的上下两条横线一般用粗线,其他线用细线5. 5.通常情况下,统计表的左右两边不封口通常情况下,统计表的左右两边不封口6. 6.表表中中的的数数据据一一般般是是右右对对齐齐,有有小小数数点点时时应应以以小小数数点点对对齐齐,而且小数点的位数应统一而且小数点的位数应统一7. 7.对于没有数字的表格单元,一般用对于没有数字的表格单元,一般用“ “”表示表示8. 8.必要时可在表的下方加上注释必要时可在表的下方加上注释统计表的设计统计表的设计1 - 133圆形图圆形图(补充)(补充) (由(由 Excel 绘制

74、的圆形图)绘制的圆形图) 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%图图3- 3- 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成1 - 134本章小结本章小结1.统计整理的概念和内容统计整理的概念和内容2.统计分组的作用及分组方式统计分组的作用及分组方式3.分配数列分配数列4.用用Excel作作次数分布表和图形次数分布表和图形5.统计表的编制统计表的编制1 - 135结结 束束1 - 136第五章第五章 时间序列分析时间序列分析统计学1 - 137第五章第五章 时间序列分析时间序列分析第一节第

75、一节 时间数列的概述时间数列的概述第二节第二节 时间序列的对比分析时间序列的对比分析 第三节第三节 长期趋势分析长期趋势分析第四节第四节 季节变动分析季节变动分析1 - 138学习目标学习目标1. 掌握时间序列对比分析的方法掌握时间序列对比分析的方法2. 掌握长期趋势分析的方法及应用掌握长期趋势分析的方法及应用3. 掌握季节变动分析的原理与方法掌握季节变动分析的原理与方法1 - 139第一节第一节 时间数列的概述时间数列的概述一一一一. . 时间数列的概念时间数列的概念时间数列的概念时间数列的概念二二二二. . 时间数列的种类时间数列的种类时间数列的种类时间数列的种类三三三三. . 时间序列的

76、编辑原则时间序列的编辑原则时间序列的编辑原则时间序列的编辑原则1 - 140时间序列时间序列(概念概念)1. 同一现象在不同时间上的相继观察值排列而成的数列2. 形式上由现象所属的时间和现象在不同时间上的观察值两部分组成3. 排列的时间可以是年份、季度、月份或其他任何时间形式1 - 141时间序列时间序列(一个例子)(一个例子)表表表表11- 1 11- 1 国内生产总值等时间序列国内生产总值等时间序列国内生产总值等时间序列国内生产总值等时间序列年年 份份国内生产总值国内生产总值(亿元亿元)年末总人口年末总人口(万人万人)人口自然增长率人口自然增长率()居民消费水平居民消费水平(元元)1990

77、1991199219931994199519961997199818547.921617.826638.134634.446759.458478.167884.674772.479552.8114333115823117171118517119850121121122389123626124810 14.3912.9811.6011.4511.2110.5510.4210.069.5380389610701331178123112726294430941 - 142时间序列的种类时间序列的种类1 - 143时间序列的分类时间序列的分类时间序列时间序列平均数序列平均数序列绝对数序列绝对数序列相对

78、数序列相对数序列时期序列时期序列时点序列时点序列1 - 144时间序列的分类时间序列的分类1.绝对数时间序列绝对数时间序列n n一系列绝对数按时间顺序排列而成一系列绝对数按时间顺序排列而成n n时间序列中最基本的表现形式时间序列中最基本的表现形式n n反映现象在不同时间上所达到的绝对水平反映现象在不同时间上所达到的绝对水平n n分为时期序列和时点序列分为时期序列和时点序列 时期序列:现象在一段时期内总量的排序时期序列:现象在一段时期内总量的排序 时点序列:现象在某一瞬间时点上总量的排序时点序列:现象在某一瞬间时点上总量的排序2.相对数时间序列相对数时间序列 一系列相对数按时间顺序排列而成一系列

79、相对数按时间顺序排列而成3.平均数时间序列平均数时间序列n n一系列平均数按时间顺序排列而成一系列平均数按时间顺序排列而成1 - 145时间序列的编制原则时间序列的编制原则1 - 146时间数列时间数列(编制原则)(编制原则)1.时间长短统一2.总体范围统一3.计算方法、价格和计量单位的统一1 - 147第二节第二节 时间序列的对比分析时间序列的对比分析一一一一. . 时间序列的水平分析时间序列的水平分析时间序列的水平分析时间序列的水平分析二二二二. . 时间序列的速度分析时间序列的速度分析时间序列的速度分析时间序列的速度分析1 - 148时间序列的水平分析时间序列的水平分析1 - 149发展

80、水平与平均发展水平发展水平与平均发展水平(概念要点)(概念要点)1.发展水平n n现象在不同时间上的观察值现象在不同时间上的观察值n n说明现象在某一时间上所达到的水平说明现象在某一时间上所达到的水平n n表示为表示为Y Y1 1 ,Y Y2 2, ,Y Yn n 或或 Y Y0 0 ,Y Y1 1 ,Y Y2 2 , ,Y Yn n2.平均发展水平n n现象在不同时间上取值的平均数,又称序时平均数现象在不同时间上取值的平均数,又称序时平均数n n说明说明现象在一段时期内所达到的一般水平现象在一段时期内所达到的一般水平n n不同类型的时间序列有不同的计算方法不同类型的时间序列有不同的计算方法1

81、 - 150绝对数序列的序时平均数绝对数序列的序时平均数(计算方法)(计算方法)计算公式:【例例例例11.111.1】 根根据据表表11.111.1中中的的国国内内生生产产总总值值序列,计算各年度的平均国内生产总值序列,计算各年度的平均国内生产总值 时期序列时期序列时期序列时期序列1 - 151绝对数序列的序时平均数绝对数序列的序时平均数(计算方法)(计算方法) 时点序列时点序列时点序列时点序列 间隔不相等间隔不相等间隔不相等间隔不相等Y Y1 1Y Y2 2Y Y3 3Y Yn nY Y4 4Y Yn-1n-1T T1 1T T2 2T T3 3T Tn-1n-11 - 152绝对数序列的序

82、时平均数绝对数序列的序时平均数(计算方法)(计算方法) 计算步骤计算步骤计算步骤计算步骤1.计算出两个点值之间的平均数 2.用相隔的时期长度 (Ti ) 加权计算总的平均数1 - 153绝对数序列的序时平均数绝对数序列的序时平均数(计算方法)(计算方法)当间隔相等(T1 = T2= = Tn-1)时,有 时点序列时点序列时点序列时点序列间隔相等间隔相等间隔相等间隔相等Y Y Y1 11Y Y Y2 22Y Y Y3 33Y Y Yn nnY Y Yn-1n-1n-11 - 154绝对数序列的序时平均数绝对数序列的序时平均数(实例)(实例)表表表表11- 2 11- 2 某种股票某种股票某种股票

83、某种股票19991999年各统计时点的收盘价年各统计时点的收盘价年各统计时点的收盘价年各统计时点的收盘价统计时点统计时点1月月1日日3月月1日日7月月1日日10月月1日日12月月31日日收盘价收盘价(元元)15.214.217.616.315.8【例例例例11.211.2】设设某某种种股股票票19991999年年各各统统计计时时点点的的收收盘盘价如表价如表11-211-2,计算该股票,计算该股票19991999年的年平均价格年的年平均价格1 - 155绝对数序列的序时平均数绝对数序列的序时平均数(实例)(实例)【例例例例11.311.3】 根据表根据表11-111-1中年末总人口数序列,计算中

84、年末总人口数序列,计算1991199119981998年间的年平均人口数年间的年平均人口数 1 - 156 相对数序列的序时平均数相对数序列的序时平均数(计算方法)(计算方法)1. 1.先分别求出构成相对数或平均数的分子先分别求出构成相对数或平均数的分子a ai i和分母和分母 b bi i 的平均的平均数数2. 2.再进行对比,即得相对数或平均数序列的序时平均数再进行对比,即得相对数或平均数序列的序时平均数 3. 3.基本公式为基本公式为1 - 157 相对数序列的序时平均数相对数序列的序时平均数(计算方法与实例)(计算方法与实例)【例例例例11.411.4】已已知知199419981994

85、1998年年我我国国的的国国内内生生产产总总值值及及构构成成数数据据如如表表11-311-3。计计算算1994199819941998年年间间我我国国第第三三产产业业国内生产总值占全部国内生产总值的平均比重国内生产总值占全部国内生产总值的平均比重表表表表11- 3 11- 3 我国国内生产总值及其构成数据我国国内生产总值及其构成数据我国国内生产总值及其构成数据我国国内生产总值及其构成数据年年 份份19941995199619971998 国内生产总值国内生产总值(亿元亿元) 其中其中 第三产业第三产业(亿元亿元) 比重比重(%)46759.414930.031.958478.117947.23

86、0.767884.620427.530.174772.424033.332.179552.826104.332.81 - 158 相对数序列的序时平均数相对数序列的序时平均数(计算结果)(计算结果)解:解:解:解:第三产业国内生产总值的平均数第三产业国内生产总值的平均数全部国内生产总值的平均数全部国内生产总值的平均数第三产业国内生产总值所占平均比重第三产业国内生产总值所占平均比重1 - 159增长量增长量(概念要点)(概念要点)1.报告期水平与基期水平之差,说明现象在观察报告期水平与基期水平之差,说明现象在观察期内增长的绝对数量期内增长的绝对数量2.有逐期增长量与累积增长量之分有逐期增长量与累

87、积增长量之分 逐期增长量逐期增长量l l报告期水平与前一期水平之差报告期水平与前一期水平之差l l计算形式为:计算形式为: i i= =Y Yi i- -Y Yi-1i-1 ( (i i =1,2,=1,2, ,n n) ) 累积增长量累积增长量l l报告期水平与某一固定时期水平之差报告期水平与某一固定时期水平之差l l 计算形式为:计算形式为: i i= =Y Yi i- -Y Y0 0 ( (i i=1,2,=1,2,n n) )3.各逐期增长量之和等于最末期的累积增长量各逐期增长量之和等于最末期的累积增长量1 - 160平均增长量平均增长量(概念要点)(概念要点)1. 观察期内各逐期增长

88、量的平均数2. 描述现象在观察期内平均增长的数量3. 计算公式为1 - 161时间序列的速度分析时间序列的速度分析1 - 162发展速度发展速度(要点)(要点)1.报告期水平与基期水平之比报告期水平与基期水平之比2.说明现象在观察期内相对的发展变化程度说明现象在观察期内相对的发展变化程度3.有环比发展速度与定期发展速度之分有环比发展速度与定期发展速度之分1 - 163环比发展速度与定基发展速度环比发展速度与定基发展速度(要点)(要点)1.环比发展速度n n报告期水平与前一期水平之比报告期水平与前一期水平之比2.定基发展速度n n报告期水平与某一固定时期水平之比报告期水平与某一固定时期水平之比1

89、 - 164环比发展速度与定基发展速度环比发展速度与定基发展速度(关系)(关系)1.观察期内各环比发展速度的连乘积等于最末期的定基发展速度 2.两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度1 - 165增长速度增长速度(要点)(要点)1.增长量与基期水平之比2.又称增长率3.说明现象的相对增长程度4.有环比增长速度与定期增长速度之分5.计算公式为1 - 166环比增长速度与定基增长速度环比增长速度与定基增长速度(要点)(要点)1.环比增长速度基n n报告期水平与前一时期水平之比报告期水平与前一时期水平之比2.定基增长速度 报告期水平与某一固定时期水平之比报告期水平与某一固定时

90、期水平之比1 - 167发展速度与增长速度的计算发展速度与增长速度的计算(实例)(实例)表表表表11- 4 11- 4 第三产业国内生产总值速度计算表第三产业国内生产总值速度计算表第三产业国内生产总值速度计算表第三产业国内生产总值速度计算表年年 份份19941995199619971998国内生产总值国内生产总值(亿元亿元) 14930.017947.220427.524033.326104. 3发展速度发展速度(%) 环比环比定基定基 100120.2120.2113.8136.8117.7161.0108.6174.8增长速度增长速度(%) 环比环比定基定基 20.220.213.836.

91、817.761.08.674.8【例例例例11.511.5】 根根据据表表11-311-3中中第第三三产产业业国国内内生生产产总总值值序序列列,计计算算各各年年的的环环比比发发展展速速度度和和增增长长速速度度,及及以以19941994年为基期的定基发展速度和增长速度年为基期的定基发展速度和增长速度 1 - 168平均发展速度平均发展速度(要点)(要点)1.观察期内各环比发展速度的平均数2.说明现象在整个观察期内平均发展变化的程度3.通常采用几何法(水平法)计算4.计算公式为1 - 169平均发展速度与平均增长速度平均发展速度与平均增长速度(算例)(算例) 平均发展速度平均发展速度平均发展速度平

92、均发展速度 平均增率平均增率平均增率平均增率【例例例例11.611.6】 根根据据表表11.411.4中中的的有有关关数数据据,计计算算1994199419981998年年间间我我国国第第三三产产业业国国内内生生产产总总值值的的年年平平均均发发展展速速度和年平均增长率度和年平均增长率1 - 1701.从最初水平Y0出发,每期按平均发展速度发展,经过n期后将达到最末期水平Yn2.按平均发展速度推算的最后一期的数值与最后一期的实际观察值一致3.只与序列的最初观察值Y0和最末观察值Yn有关4.如果关心现象在最后一期应达到的水平,采用水平法计算平均发展速度比较合适平均发展速度平均发展速度(几何法的特点

93、)(几何法的特点)1 - 171年度化增长率年度化增长率(要点)(要点)1.增长率以年来表示时,称为年度化增长率或年率增长率以年来表示时,称为年度化增长率或年率2.可将月度增长率或季度增长率转换为年度增长率可将月度增长率或季度增长率转换为年度增长率3.计算公式为计算公式为 m m 为一年中的时期个数;为一年中的时期个数;n n 为所跨的时期总数为所跨的时期总数 季度增长率被年度化时,季度增长率被年度化时,m m 4 4 月增长率被年度化时,月增长率被年度化时,m m 1212 当当m m n n 时,上述公式就是年增长率时,上述公式就是年增长率1 - 172年度化增长率年度化增长率(实例)(实

94、例) 【例例例例11.711.7】已已知知某某地地区区的的如如下下数数据据,计计算算年年度度化化增增化增长率化增长率1)1)19991999年年1 1月月份份的的社社会会商商品品零零售售总总额额为为2525亿亿元元, 20002000年年1 1月份在零售总额为月份在零售总额为3030亿元亿元 2)2)19981998年年3 3月月份份财财政政收收入入总总额额为为240240亿亿元元,20002000年年6 6月月份的财政收入总额为为份的财政收入总额为为300300亿元亿元 3)3)20002000年年1 1季季度度完完成成的的国国内内生生产产总总值值为为500500亿亿元元,2 2季季度完成的

95、国内生产总值为度完成的国内生产总值为510510亿元亿元4)4)19971997年年1 1季季度度完完成成的的国国内内生生产产总总值值为为500500亿亿元元,2 2季季度完成的国内生产总值为度完成的国内生产总值为510510亿元亿元 1 - 173速度的分析与应用速度的分析与应用(需要注意的问题)(需要注意的问题)1.当时间序列中的观察值出现0或负数时,不宜计算速度2.例如:假定某企业连续五年的利润额分别为5、2、0、-3、2万元,对这一序列计算速度,要么不符合数学公理,要么无法解释其实际意义。在这种情况下,适宜直接用绝对数进行分析3.在有些情况下,不能单纯就速度论速度,要注意速度与绝对水平

96、的结合分析1 - 174速度的分析与应用速度的分析与应用(一个例子)(一个例子)表表表表11- 5 11- 5 甲、乙两个企业的有关资料甲、乙两个企业的有关资料甲、乙两个企业的有关资料甲、乙两个企业的有关资料年年 份份甲甲 企企 业业乙乙 企企 业业利润额利润额(万元万元)增长率增长率(%)利润额利润额(万元万元)增长率增长率(%)1996500601997600208440【例例11.8】 假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如表11-5 1 - 175速度的分析与应用速度的分析与应用(增长(增长1%绝对值)绝对值)1.速度每增长一个百分点而增加的绝对量2.用于弥补速

97、度分析中的局限性3.计算公式为甲企业增长1%绝对值500/1005万元乙企业增长1%绝对值60/1000.6万元1 - 176第二节第二节 长期趋势分析长期趋势分析-时间序列的构成要素与模型时间序列的构成要素与模型时间序列的构成要素与模型时间序列的构成要素与模型-线性趋势线性趋势线性趋势线性趋势-非线性趋势非线性趋势非线性趋势非线性趋势-趋势线的选择趋势线的选择趋势线的选择趋势线的选择1 - 177时间序列的构成要素与模型时间序列的构成要素与模型(构成要素与测定方法)(构成要素与测定方法)线性趋势线性趋势时间序列的构成要素时间序列的构成要素 循环波动循环波动季节季节变动变动长期趋势长期趋势剩余

98、法剩余法剩余法剩余法剩余法剩余法移动平均法移动平均法移动平均法移动平均法移动平均法移动平均法移动中位数法移动中位数法移动中位数法移动中位数法移动中位数法移动中位数法线性模型法线性模型法线性模型法线性模型法线性模型法线性模型法不规则波动不规则波动非线性趋势非线性趋势 趋势剔出法趋势剔出法趋势剔出法趋势剔出法趋势剔出法趋势剔出法按月按月按月按月按月按月( (季季季季季季) )平均法平均法平均法平均法平均法平均法GompertzGompertzGompertz曲线曲线曲线曲线曲线曲线指数曲线指数曲线指数曲线指数曲线指数曲线指数曲线二次曲线二次曲线二次曲线二次曲线二次曲线二次曲线修正指数曲线修正指数曲

99、线修正指数曲线修正指数曲线修正指数曲线修正指数曲线LogisticLogisticLogistic曲线曲线曲线曲线曲线曲线1 - 178时间序列的构成要素与模型时间序列的构成要素与模型(要点)(要点)1.构成因素n n长期趋势长期趋势 (Secular trend )(Secular trend )n n季节变动季节变动 (Seasonal Fluctuation )(Seasonal Fluctuation )n n循环波动循环波动 (Cyclical Movement )(Cyclical Movement )n n不规则波动不规则波动 (Irregular Variations )(Ir

100、regular Variations )2.模型 n n乘法模型:乘法模型:Y Yi i = = T Ti i S Si i C Ci i I Ii i n n加法模型:加法模型:Y Yi i = = T Ti i + + S Si i + + C Ci i + + I Ii i 1 - 179长期趋势长期趋势(概念要点)(概念要点)1.现象在较长时期内持续发展变化的一种趋向或状态2.由影响时间序列的基本因素作用形成3.时间序列的主要构成要素4.有线性趋势和非线性趋势1 - 180线性趋势线性趋势1 - 181线性趋势线性趋势1.现象随时间的推移呈现出稳定增长或下降的线性变化规律2.测定方法有

101、n n移动平均法移动平均法n n移动中位数法移动中位数法n n线性模型法线性模型法1 - 182线性模型法线性模型法(概念要点与基本形式)(概念要点与基本形式)1.现象的发展按线性趋势变化时,可用线性模型表示2.线性模型的形式为 时间序列的趋势值时间序列的趋势值 t t 时间标号时间标号 a a趋势线在趋势线在Y Y 轴上的截距轴上的截距 b b趋趋势势线线的的斜斜率率,表表示示时时间间 t t 变变动动一一个个单单位位时时观观察值的平均变动数量察值的平均变动数量1 - 183线性模型法线性模型法(a 和和 b 的最小二乘估计)的最小二乘估计)1.趋势方程中的两个未知常数 a 和 b 按最小二

102、乘法(Least-square Method)求得n n根据回归分析中的最小二乘法原理根据回归分析中的最小二乘法原理n n使各实际观察值与趋势值的离差平方和为最小使各实际观察值与趋势值的离差平方和为最小n n最最小小二二乘乘法法既既可可以以配配合合趋趋势势直直线线,也也可可用用于于配配合趋势曲线合趋势曲线2.根据趋势线计算出各个时期的趋势值1 - 184线性模型法线性模型法(a和和b的最小二乘估计)的最小二乘估计)1. 根据最小二乘法得到求解 a 和 b 的标准方程为2.取时间序列的中间时期为原点时有 t=0,上式可化简为解得:解得:解得:解得:解得:解得:1 - 185t值设计值设计2.奇数

103、项t1 -2 t2 -1t3 0t4 1t5 23. 偶数项t1 -5 t2 -3t3 -1t4 1t5 3t6 51.基本方法 t1 1 t2 2 t3 3 t4 4 t5 51 - 186线性模型法线性模型法(实例及计算过程实例及计算过程)表表表表11- 8 11- 8 汽车产量直线趋势计算表汽车产量直线趋势计算表汽车产量直线趋势计算表汽车产量直线趋势计算表年份年份时间标号时间标号 t产量产量(万辆万辆) YitYtt2趋势值趋势值19811982198319841985198619871988198919901991199219931994199519961997199812345678

104、910111213141516171817.5619.6323.9831.6443.7236.9847.1864.4758.3551.4071.42106.67129.85136.69145.27147.52158.25163.0017.5639.2671.94126.56218.60221.88330.26515.76525.15514.00785.621280.041688.051913.662179.052360.322690.252934.001491625364964811001211441691962252562893240.009.5019.0028.5038.0047.5057

105、.0066.5076.0085.5095.00104.51114.01123.51133.01142.51152.01161.51合计合计1711453.5818411.9621091453.58【例例例例11.1011.10】利利用用表表11-611-6中中的的数数据据,根根据据最最小小二二乘乘法法确确定定汽汽车车产产量量的的直直线线趋趋势势方方程程,计计 算算 出出 1981198119981998年年 各各 年年 汽汽 车车产产量量的的趋趋势势值值,并并 预预 测测 20002000年年 的的汽汽车车产产量量,作作图图与原序列比较与原序列比较1 - 187线性模型法线性模型法(计算结果)

106、(计算结果) 根据上表得根据上表得 a a 和和 b b 结果如下结果如下汽车产量的直线趋势方程为汽车产量的直线趋势方程为$ $ $ $Yt = -9.4995 + 9.5004 t$ $ $ $Y Y20002000= -9.4995 + 9.5004= -9.4995 + 9.5004 20 = 20 = 180.51180.51 ( ( 万辆万辆万辆万辆 ) )20002000年汽车产量的预测值为年汽车产量的预测值为1 - 188线性模型法线性模型法(趋势图趋势图)05010015020019811985198919931997汽车产量趋势值 图图11-2 11-2 汽车产量直线趋势汽车

107、产量直线趋势(年份)汽车产量(万辆)1 - 189移动平均法移动平均法(Moving Average Method)1.测定长期趋势的一种较简单的常用方法n n通通过过扩扩大大原原时时间间序序列列的的时时间间间间隔隔,并并按按一一定定的的间间隔长度逐期移动,计算出一系列移动平均数隔长度逐期移动,计算出一系列移动平均数n n由由移移动动平平均均数数形形成成的的新新的的时时间间序序列列对对原原时时间间序序列列的的波波动动起起到到修修匀匀作作用用,从从而而呈呈现现出出现现象象发发展展的的变变动趋势动趋势2.移动步长为K(1K11,增长率随着时间,增长率随着时间t t的增加而增加的增加而增加 若若b

108、b100,b b1 0 0,a a 0 0,0 0 0 0,0 0 a a 1 1,0 0 0 0,a a 0 0,0 0 5 5, , n n(1- )=605(1- )=605, = 0.95= 0.95, /2/2=1.96=1.96p p p p p p 我我们们可可以以9595的的概概率率保保证证该该企企业业职职工工由由于于同同管管理理人人员员不不能能融融洽洽相相处处而而离开的比例在离开的比例在63.6%76.4%63.6%76.4%之间之间【例例】某某企企业业在在一一项项关关于于职职工工流流动动原原因因的的研研究究中中,从从该该企企业业前前职职工工的的总总体体中中随随机机选选取取了

109、了200200人人组组成成一一个个样样本本。在在对对其其进进行行访访问问时时,有有140140人人说说他他们们离离开开该该企企业业是是由由于于同同管管理理人人员员不不能能融融洽洽相相处处。试试对对由由于于这这种种原原因因而而离离开开该该企企业业的的人人员员的的真真正正比比例例构构造造95%95%的置信区间。的置信区间。1 - 353样本容量的确定样本容量的确定1 - 3541.根据均值区间估计公式可得样本容量n为估计总体均值时样本容量的确定估计总体均值时样本容量的确定 2.样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为 与总体方差成正比与总体方差成正比 与允许误差成反比与允许误差成

110、反比 与可靠性系数成正比与可靠性系数成正比其中:其中:1 - 355样本容量的确定样本容量的确定(实例)(实例)解解 : :已已 知知 2 2=1800000=1800000, =0.05=0.05, Z Z /2/2=1.96=1.96, =500=500 应抽取的样本容量应抽取的样本容量为为【例例】一一家家广广告告公公想想估估计计某某类类商商店店去去年年所所花花的的平平均均广广告告费费用用有有多多少少。经经验验表表明明,总总体体方方差差约约为为 18000001800000元元 。 如如置置信信度度取取95%95%,并并要要使使估估计计处处在在总总体体平平均均值值附附近近500500元元的

111、的范范围围内内,这这家家广广告告公公司司应应抽抽多多大大的的样样本?本?1 - 3561.根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n n为为估计总体比例时样本容量的确定估计总体比例时样本容量的确定 2.若总体比例若总体比例P P未知时,可用样本比例未知时,可用样本比例 来代替来代替 p p 其中:其中:1 - 357样本容量的确定样本容量的确定(实例)(实例)【例例例例】一一家家市市场场调调研研公公司司想想估估计计某某地地区区有有彩彩色色电电视视机机的的家家庭庭所所占占的的比比例例。该该公公司司希希望望对对比比例例p p的的估估计计 误误 差差 不不 超超 过过0.05

112、0.05,要要求求的的可可靠靠程程度度为为95%95%,应应抽抽多多大大容容量量的的样样本本(没没有有可可利利用的用的p p估计值)。估计值)。解解: : 已已知知 =0.05=0.05, =0.05=0.05,Z Z /2/2=1.96=1.96,当当p p未知时用最大方差未知时用最大方差0.250.25代替代替 应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为1 - 358第四节 两个总体均值及两个 总体比例之差估计一. 两个总体均值之差估计二. 两个总体比例之差估计1 - 359两个总体均值之差的估计两个总体均值之差的估计1 - 360两个样本均值之差的抽样分两个样本均值之差的抽样

113、分布布 1 1 1 1总体1 2 2 2 2总体2抽取简单随机样样本容量 n1计算X1抽取简单随机样样本容量 n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2 - 抽样分布抽样分布1 - 361两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2 已知已知)1.1.假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本 两个两个总体都服从正态分布总体都服从正态分布 若不是正态分布若不是正态分布, , 可以用正态分布来近似可以用正态分布来近似( (n n1 1 3030和和n n2 2 30)30)2.2.两两个个独独立立样样本本均均值值之之差

114、差的的抽抽样样分分布布服服从从正正态态分分布布,其其期期望望值为值为其标准误差为其标准误差为1 - 362两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2 已知已知)4.4.两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信水平下的置信区间为置信区间为3.使用正态分布统计量Z1 - 363两个总体均值之差的估计两个总体均值之差的估计(实例)(实例)【例例例例】一一个个银银行行负负责责人人想想知知道道储储户户存存入入两两家家银银行行的的钱钱数数。他他从从两两家家银银行行各各抽抽取取了了一一个个由由2525个个储储户户组组成成的的随随

115、机机样样本本,样样本本均均值值如如下下:银银行行A A:45004500元元;银银行行B:B:32503250元元。设设已已知知两两个个总总体体服服从从方方差差分分别别为为 A A2 2=2500=2500和和 B B2 2=3600=3600的的正正态态分分布布。试试求求 A A- - B B的区间估计的区间估计(1 1)置信度为)置信度为95%95%(2 2)置信度为)置信度为99%99%BA1 - 364两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果)解解: :已知已知 X XA A N N( ( A A,2500),2500) X XB B N N( ( B B,3

116、600),3600) x xA A=4500=4500, x xB B=3250=3250, A A2 2 =2500 =2500 B B2 2 =3600 =3600 n nA A= = n nB B =25=25(1)(1) A A- - B B置信度为置信度为95%95%的置信区间为的置信区间为(2)(2) A A- - B B置信度为置信度为99%99%的置信区间为的置信区间为1 - 365两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,但相等未知,但相等)1.假定条件假定条件n n两个两个总体都服从正态分布总体都服从正态分布n n 1 12 2、

117、1 12 2未知,但未知,但 1 12 2 1 12 22.总体方差总体方差 2 2的联合估计量为的联合估计量为3.估计量估计量 x x1 1- - x x2 2的标准差为的标准差为1 - 366两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,但相等未知,但相等)使用使用 t t 分布统计量分布统计量两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信置信水平下的置信 区间为区间为1 - 367两个总体均值之差的估计两个总体均值之差的估计(实例)(实例)【例例例例】为为比比较较两两位位银银行行职职员员为为新新顾顾客客办办理理个

118、个人人结结算算账账目目的的平平均均时时间间长长度度,分分别别给给两两位位职职员员随随机机安安排排了了1010位位顾顾客客,并并记记录录下下为为每每位位顾顾客客办办理理账账单单所所需需的的时时间间(单单位位:分分钟钟),相相应应的的样样本本均均值值和和方方差差分分别别为为: x x1 1= =22.222.2,s s1 12 2=16.63=16.63, x x2 2= =28.528.5,s s2 22 2=18.92=18.92。假假定定每每位位职职员员办办理理账账单单所所需需时时间间均均服服从从正正态态分分布布,且且方方差差相相等等。试试求求两两位位职职员员办办理理账账单单的的服服务务时时

119、间间之之差差的的95%95%的区间估计。的区间估计。2 21 11 - 368两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果)解解: :已知已知 X X1 1 N N( ( 1 1, , 2 2) ) X X2 2 N N( ( 2 2, , 2 2) ) x x1 1=22.2=22.2, x x2 2=28.5=28.5, s s1 12 2=16.63=16.63 s s2 22 2=18.92=18.92 n n1 1= = n n2 2=10=10 1 12 2= = 1 12 2 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为1 - 3

120、69两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2 、 2 22 2未知,且不相等未知,且不相等)1.假定条件 两个两个总体都服从正态分布总体都服从正态分布 1 12 2、 1 12 2未知,且未知,且 1 12 2 1 12 22.使用的统计量为自由度自由度1 - 370两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,且不相等未知,且不相等) 两个总体均值之差1-2在1- 置信水平下的置信区间为1 - 371两个总体均值之差的估计两个总体均值之差的估计(续前例)(续前例)【例例例例】为为比比较较两两位位银银行行职职员员为为新新顾顾客客办办理

121、理个个人人结结算算账账目目的的平平均均时时间间长长度度,分分别别给给两两位位职职员员随随机机安安排排了了1010位位顾顾客客,并并记记录录下下了了为为每每位位顾顾客客办办理理账账单单所所需需的的时时间间(单单位位:分分钟钟),相相应应的的样样本本均均值值和和方方差差分分别别为为: x x1 1= =22.222.2,s s1 12 2=16.63=16.63, x x2 2= =28.528.5,s s2 22 2=18.92=18.92。假假定定每每位位职职员员办办理理账账单单所所需需时时间间均均服服从从正正态态分分布布,但但方方方方差差差差不不不不相相相相等等等等。试试求求两两位位职职员员

122、办办理理账账单单的的服服务务时时间间之之差差的的95%95%的区间估计。的区间估计。1 12 21 - 372两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果) 自由度自由度 f f 为为 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为解解: :已知已知 X X1 1 N N( ( 1 1, , 2 2) ) X X2 2 N N( ( 2 2, , 2 2) ) x x1 1=22.2=22.2, x x2 2=28.5=28.5, s s1 12 2=16.63=16.63 s s2 22 2=18.92=18.92 n n1 1= = n n2

123、 2=10=10 1 12 21 12 21 - 373两个总体比例之差的估计两个总体比例之差的估计1 - 3741. 假定条件 两个总体是独立的两个总体是独立的 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似2. 两个总体比例之差P1-P2在1-置信水平下的置信区间为两个总体比例之差的区间估两个总体比例之差的区间估计计1 - 375两个总体比例之差的估计两个总体比例之差的估计(实例)(实例)【例例例例】某某饮饮料料公公司司对对其其所所做做的的报报纸纸广广告告在在两两个个城城市市的的效效果果进进行行了了比比较较,它它们们从从两两个个城城 市市 中中 分分 别

124、别 随随 机机 地地 调调 查查 了了10001000个个成成年年人人,其其中中看看过过广广告告 的的 比比 例例 分分 别别 为为 p p1 1=0.18=0.18和和p p2 2=0.14=0.14。试试求求两两城城市市成成年年人人中中看看过过广广告告的的比比例例之之差差的的95%95%的置信区间。的置信区间。 绿色绿色健康饮品健康饮品1 - 376两个总体比例之差的估计两个总体比例之差的估计(计算结果)(计算结果)P P1 1- - P P2 2置信度为置信度为95%95%的置信区间为的置信区间为解解: :已知已知 p p1 1=0.18=0.18, p p2 2=0.14=0.14,1

125、-1- =0.95=0.95, n n1 1= = n n2 2=1000=1000 我我们们有有95%95%的的把把握握估估计计两两城城市市成成年年人人中中看看过过该该广广告的比例之差在告的比例之差在0.79% 7.21%0.79% 7.21%之间之间1 - 377第五节 正态总体方差及两正 态总体方差比的估计一. 正态总体方差的区间估计二. 两个正态总体方差比的区间估计1 - 378正态总体方差的区间估计正态总体方差的区间估计1 - 379正态总体方差的区间估计正态总体方差的区间估计(要点)(要点)1. 估计一个总体的方差或标准差2. 假设总体服从正态分布3.总体方差 2 2 的点估计量为

126、S2 2,且4. 总体方差在1-置信水平下的置信区间为1 - 380正态总体方差的区间估计正态总体方差的区间估计(实例)(实例)【例例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求2的95%的置信区间。1 - 381正态总体方差的区间估计正态总体方差的区间估计(计算结果)(计算结果)解:已知n10,s2 4,1-95% 2置信度为95%的置信区间为1 - 382两个正态总体方差比的区间估计两个正态总体方差比的区间估计1 - 383两个正态总体方差比的区间估计两个正态总体方差比的区间估计(要点)(要点)1.1.比较两个总体的方差比比较两个总体的方差比2.

127、用两个样本的方差比来判断用两个样本的方差比来判断 如果如果S S1 12 2/ / S S2 22 2接近于接近于1 1, ,说明两个总体方差很接近说明两个总体方差很接近 如果如果S S1 12 2/ / S S2 22 2远离远离1 1, ,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-1- 置信水平下的置信区间为置信水平下的置信区间为1 - 384两个正态总体方差比的区间估计两个正态总体方差比的区间估计(实例)(实例)【例例例例】用用某某一一特特定定工工序序生生产产的的一一批批化化工工产产品品中中的的杂杂质质含含量量的的变变异异依依赖赖于于操操作作

128、过过程程中中处处理理的的时时间间长长度度。某某生生产产商商拥拥有有两两条条生生产产线线,为为了了降降低低产产品品中中杂杂质质平平均均数数量量的的同同时时降降低低杂杂质质的的变变异异,对对两两条条生生产产线线进进行行了了很很小小的的调调整整,研研究究这这种种调调整整是是否否确确能能达达到到目目的的。为为此此从从两两条条生生产产线线生生产产的的两两批批产产品品中中各各随随机机抽抽取取了了2525个样品,它们的均值和方差为个样品,它们的均值和方差为 x x1 1=3.2 =3.2 ,S S1 12 2 =1.04=1.04 x x2 2=3.0 =3.0 , S S2 22 2 =0.51=0.51

129、试确定两总体方差比试确定两总体方差比 1 12 2/ / 1 12 2的的90%90%的置信区间。的置信区间。1 - 385两个正态总体方差比的区间估计两个正态总体方差比的区间估计(计算结果)(计算结果)解解: :已知已知 x x1 1=3.2=3.2,S S1 12 2 =1.04=1.04 x x2 2=3.0=3.0,S S2 22 2 =1.04=1.04 F F1-1- /2 /2 (24, 24)(24, 24) = =F F0.95 0.95 =1.98=1.98 F F /2 /2 (24, 24)(24, 24) = =F F0.050.05=0.51=0.51 1 12 2

130、/ / 2 22 2置置信信度度为为90%90%的的置置信信区间为区间为1 - 386本章小结本章小结1. 抽样的有关概念抽样的有关概念2.抽样分布抽样分布3.点估计和区间估计的有关概念点估计和区间估计的有关概念4. 确定样本容量确定样本容量5. 区间估计区间估计1 - 387第十章第十章 相关与回归分析相关与回归分析统计学1 - 388第十章第十章 相关与回归分析相关与回归分析第一节第一节 变量间的相关关系变量间的相关关系 第二节第二节 一元线性回归一元线性回归第三节第三节 多元线性回归多元线性回归第四节第四节 可化为线性回归的曲线回归可化为线性回归的曲线回归1 - 389学习目标学习目标1

131、. 掌握相关系数的含义、计算方法和应用掌握相关系数的含义、计算方法和应用2. 掌握一元线性回归的基本原理和参数的最掌握一元线性回归的基本原理和参数的最小二乘估计方法小二乘估计方法3.掌握回归方程的显著性检验掌握回归方程的显著性检验4.利用回归方程进行预测利用回归方程进行预测4.掌握多元线性回归分析的基本方法掌握多元线性回归分析的基本方法5.了解可化为线性回归的曲线回归了解可化为线性回归的曲线回归6.用用 Excel 进行回归分析进行回归分析1 - 390第一节第一节 变量间的相关关系变量间的相关关系一一. 变量相关的概念变量相关的概念二二. 相关系数及其计算相关系数及其计算1 - 391变量相

132、关的概念变量相关的概念1 - 392变量间的关系变量间的关系(函数关系)(函数关系)1.是一一对应的确定关系是一一对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y ,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时, y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y = = f f ( (x x) ),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3.各观测点落在一条线上各观测点落在一条线上 x

133、xy y1 - 393变量间的关系变量间的关系(函数关系)(函数关系) 函数关系的例子某某种种商商品品的的销销售售额额( (y y) )与与销销售售量量( (x x) )之之间间的的关关系可表示为系可表示为 y y = = p p x x ( (p p 为单价为单价) )圆圆的的面面积积(S)(S)与与半半径径之之间间的的关关系系可可表表示示为为S S = = R R2 2 企企业业的的原原材材料料消消耗耗额额( (y y) )与与产产量量( (x x1 1) ) 、单单位位产产量量消消耗耗( (x x2 2) ) 、原原材材料料价价格格( (x x3 3) )之之间间的的关关系系可可表示为表

134、示为y y = = x x1 1 x x2 2 x x3 3 1 - 394变量间的关系变量间的关系(相关关系)(相关关系)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.各观测点分布在直线周围各观测点分布在直线周围 x xy y1 - 395变量间的关系变量间的关系(相关关系)(相关关系) 相关关系的例子商品的消费量商品的消费量( (y y) )与居民收入与居民收入( (x x) )之间的关系

135、之间的关系商品销售额商品销售额( (y y) )与广告费支出与广告费支出( (x x) )之间的关系之间的关系粮粮食食亩亩产产量量( (y y) )与与施施肥肥量量( (x x1 1) ) 、降降雨雨量量( (x x2 2) ) 、温度温度( (x x3 3) )之间的关系之间的关系收入水平收入水平( (y y) )与受教育程度与受教育程度( (x x) )之间的关系之间的关系父亲身高父亲身高( (y y) )与子女身高与子女身高( (x x) )之间的关系之间的关系1 - 396相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关

136、关负负相相关关完全相关完全相关不相关不相关1 - 397相关关系的图示相关关系的图示 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 1 - 398相关系数及其计算相关系数及其计算1 - 399相关关系的测度相关关系的测度(相关系数)(相关系数)1.对变

137、量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r1 - 400相关关系的测度相关关系的测度(相关系数)(相关系数) 样本相关系数的计算公式或化简为1 - 401相关关系的测度相关关系的测度(相关系数取值及其意义)(相关系数取值及其意义)1. r r 的取值范围是的取值范围是 -1,1-1,12.| |r r|=1|=1,为完全相关为完全相关n nr r =1=1,为完全正相关,为完全正相关n nr r =-1=-1,为完全负正相关,为完全负正相关3

138、. r r = 0= 0,不存在不存在线性线性相关相关关系相关关系相关4.-1-1 r r00,为负相关为负相关5.0 0 t t,拒绝,拒绝H H0 0 若若 t t =64.9809t t(13-2)=2.201(13-2)=2.201,拒绝,拒绝H H0 0,人均,人均消费金额与人均国民收入之间的相关关系显著消费金额与人均国民收入之间的相关关系显著1 - 407相关系数的显著性检验相关系数的显著性检验(相关系数检验表的使用)(相关系数检验表的使用) 1.若若I Ir rI I大大于于表表上上的的 =5%=5%相相应应的的值值,小小于于表表上上 1%1%相应的值,称变量相应的值,称变量x

139、x与与y y之间有之间有显著显著显著显著的线性关系的线性关系2.若若I Ir rI I大大于于表表上上 =1%=1%相相应应的的值值,称称变变量量x x与与y y之之间间有有十分显著十分显著十分显著十分显著的线性关系的线性关系3.若若I Ir rI I小小于于表表上上 =5%=5%相相应应的的值值,称称变变量量x x与与y y之之间间没没有有明显明显明显明显的线性关系的线性关系4.根根据据前前例例的的r r0.99870.9987 =5%(=5%(n n-2)=0.553-2)=0.553,表表明明人人均均消消费费金金额额与与人人均均国国民民收收入入之之间间有有十十分分显显著著的的线性相关关系

140、线性相关关系1 - 408第二节第二节 一元线性回归一元线性回归一一. 一元线性回归模型一元线性回归模型-参数的最小二乘估计参数的最小二乘估计-回归方程的显著性检验回归方程的显著性检验-预测及应用预测及应用1 - 409什么是回归分析?什么是回归分析?(内容)(内容)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度回归方程一词是怎么来的1 - 410回归分析与相关分析的区别回归

141、分析与相关分析的区别1.相相关关分分析析中中,变变量量 x x 变变量量 y y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y y 称称为为因因变变量量,处处在在被被解解释释的的地地位,位,x x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2.相相关关分分析析中中所所涉涉及及的的变变量量 x x 和和 y y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量3.相相关关分分析析主主要要是是描描述述两两个个变变

142、量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 x x 对对变变量量 y y 的影响大小,还可以由回归方程进行预测和控制的影响大小,还可以由回归方程进行预测和控制 1 - 411回归模型的类型回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归1 - 412回归模型与回归方程回归模型与回归方程1 - 413回归模型回归模型1.回答“变量之间是什么样的关系?”2.方程中运用n n1 1 个数字的因变量个数

143、字的因变量( (响应变量响应变量) )l l被预测的变量被预测的变量n n1 1 个或多个数字的或分类的自变量个或多个数字的或分类的自变量 ( (解释变量解释变量) )l l用于预测的变量用于预测的变量3. 主要用于预测和估计1 - 414一元线性回归模型一元线性回归模型 (概念要点)(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归2.对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型1 - 415一元线性回归模型一元线性回归模型 (概念要点)(概

144、念要点) 对于只涉及一个自变量的简单线性回归模型可表示为 y = 0 0 + + 1 1 x + + n n模型中,模型中,y y 是是 x x 的线性函数的线性函数( (部分部分) )加上误差项加上误差项n n线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y 的变化的变化n n误差项误差项 是随机变量是随机变量l l反反映映了了除除 x x 和和 y y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y y 的影响的影响l l是不能由是不能由 x x 和和 y y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性n n 0 0 和和

145、1 1 称为模型的参数称为模型的参数1 - 416一元线性回归模型一元线性回归模型(基本假定)(基本假定)1.误误差差项项 是是一一个个期期望望值值为为0 0的的随随机机变变量量,即即E E( ( )=0)=0。对对于于一一个个给给定定的的 x x 值值,y y 的的期期望望值值为为E E ( ( y y ) ) = = 0 0+ + 1 1 x x2.对于所有的对于所有的 x x 值,值, 的方差的方差 2 2 都相同都相同3.误误差差项项 是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互独立。即互独立。即 N N( 0 ,( 0 , 2 2 ) )n n独独立立性性意意

146、味味着着对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 与与其他其他 x x 值所对应的值所对应的 不相关不相关n n对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不相关值也不相关1 - 417回归方程回归方程 (概念要点)(概念要点)1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2.简单线性回归方程的形式如下 E( y ) = 0+ 1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y

147、 轴轴上上的的截截距距,是是当当 x x=0 =0 时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值1 - 418估计估计( (经验经验) )的回归的回归方程方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中: 是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距, 是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值,也表示值,也表示 x x 每变动一个单位时,

148、每变动一个单位时, y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计1 - 419参数参数 0 和和 1 的最小二乘估计的最小二乘估计1 - 420最小二乘法最小二乘法 (概念要点)(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小1 - 421最小二乘法最

149、小二乘法(图示)(图示)x xy y( (x xn n , , y yn n) )( (x x1 1 , , y y1 1) )( (x x2 2 , , y y2 2) )( (x xi i , , y yi i) )e ei i = = y yi i- -y yi i1 - 422最小二乘法最小二乘法 ( 和和 的计算公式的计算公式) 根据最小二乘法的要求,可得求解 和 的标准方程如下1 - 423估计方程的求法估计方程的求法(实例)(实例) 【例例】根据例10.1中的数据,配合人均消费金额对人均国民收入的回归方程 根据 和 的求解公式得1 - 424估计估计( (经验经验) )方程方程

150、人均消费金额对人均国民收入的回归方程为y = 54.22286 + 0.52638 x 1 - 425估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)1 - 426回归方程的显著性检验回归方程的显著性检验1 - 427离差平方和的分解离差平方和的分解1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面n n由于自变量由于自变量 x x 的取值不同造成的的取值不同造成的n n除除 x x 以以外外的的其其他他因因素素( (如如x x对对y y的的非非线线性性影影响响、测量误差等测量误差等) )的影响的影响2.对一个具体的观测值来说,变差的大小可以通过该实

151、际观测值与其均值之差 来表示1 - 428离差平方和的分解离差平方和的分解(图示)(图示)x xy yy y 离差分解图离差分解图1 - 429离差平方和的分解离差平方和的分解 (三个平方和的关系)(三个平方和的关系)2. 两端平方后求和有1.从图上看有SST = SSR + SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)1 - 430离差平方和的分解离差平方和的分解 (三个平方和的意义)(三个平方和的意义)1.总平方和总平方和(SST)n n反映因变量的反映因变量的 n n 个观察值与其均值的总离差个观察值与其均值的总离

152、差2.回归平方和回归平方和(SSR)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x x 与与 y y 之之间间的的线线性性关关系系引引起的起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和1 - 431样本决定系数样本决定系数 (判定系数(判定系数 r2 )1.回归平方和占总离差平方和的比

153、例2.反映回归直线的拟合程度3.取值范围在 0 , 1 之间4. r2 1,说明回归方程拟合的越好;r20,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即r2(r)21 - 432回归方程的显著性检验回归方程的显著性检验 (线性关系的检验线性关系的检验 )1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著 如果是显著的,两个变量之间存在线性关系如果是显著的,两个变量之间存在线性关系 如果不显著,两个变量之间不存在线性关系如果不显著,两个变量之间不存在线性关系1 - 433回归方

154、程的显著性检验回归方程的显著性检验 (检验检验的步骤)的步骤)1.提出假设n nH H0 0:线性关系不显著:线性关系不显著2. 计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF ,拒绝H0;若F t t,拒绝,拒绝H H0 0; t t =65.0758t t=2.201=2.201,拒拒绝绝H H0 0,表表明明人人均均收收入入与人均消费之间有线性关系与人均消费之间有线性关系对前例的回归系数进行显著性检验(0.05)1 - 441回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的结果)1 - 442预测及应用预测

155、及应用1 - 443利用回归方程进行估计和预利用回归方程进行估计和预测测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型n n点估计点估计l ly y 的平均值的点估计的平均值的点估计l ly y 的个别值的点估计的个别值的点估计n n区间估计区间估计l ly y 的平均值的的平均值的置信区间置信区间估计估计l ly y 的个别值的的个别值的预测区间预测区间估计估计1 - 444利用回归方程进行估计和预利用回归方程进行估计和预测测(点估计)(点估计)2. 点估计值有n ny y 的平均值的点估计的平均值的点估计n ny y 的个别值的点估计的个别值的点估计3. 在点估计

156、条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同1.对于自变量 x 的一个给定值x0 ,根据回归方程得到因变量 y 的一个估计值1 - 445利用回归方程进行估计和预利用回归方程进行估计和预测测(点估计)(点估计) y 的平均值的点估计的平均值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0) ,就是平均值的点估计2.在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得1 - 446利用回归方程进行估计和预利用回归方程进行估计和预

157、测测(点估计)(点估计) y 的个别值的点估计的个别值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计2. 比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得1 - 447利用回归方程进行估计和预测利用回归方程进行估计和预测 (区间估计)(区间估计)1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间3.区间估计有两种类型n n

158、置信区间估计置信区间估计n n预测区间估计预测区间估计1 - 448利用回归方程进行估计和预利用回归方程进行估计和预测测(置信区间估计)(置信区间估计) y 的平均值的的平均值的置信区间置信区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间置信区间2. E(y0) 在1-置信水平下的置信区间为式式中中:S Sy y为为估估计标准误差计标准误差1 - 449利用回归方程进行估计和预利用回归方程进行估计和预测测(置信区间估计(置信区间估计:算例)算例) 【例例例例】根据前例,求出人均国民收入为根据前例

159、,求出人均国民收入为1250.71250.7元时,元时,人均消费金额人均消费金额95%95%的置信区间的置信区间 解:解:根据前面的计算结果根据前面的计算结果 712.57712.57,S Sy y=14.95=14.95,t t(13-2)(13-2)2.2012.201,n n=13=13 置信区间为置信区间为712.57712.57 10.26510.265人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间1 - 450利用回归方程进行估计和预利用回归方程进行估计和预测测(预测区间

160、估计)(预测区间估计) y 的个别值的的个别值的预测区间预测区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间 2. y0在1-置信水平下的预测区间为注意!注意!1 - 451利用回归方程进行估计和预利用回归方程进行估计和预测测(置预测区间估计(置预测区间估计:算例)算例) 【例例例例】根根据据前前例例,求求出出19901990年年人人均均国国民民收收入入为为1250.71250.7元时,人均消费金额的元时,人均消费金额的95%95%的预测区间的预测区间 解:解:根据前面的计算结果有根据前面的计算结果

161、有 712.57712.57,S Sy y=14.95=14.95,t t(13-2)(13-2)2.2012.201,n n=13=13 置信区间为置信区间为712.57712.57 34.46934.469人人均均消消费费金金额额95%95%的的预预测测区区间间为为678.101678.101元元 747.039747.039元之间元之间1 - 452影响区间宽度的因素影响区间宽度的因素1. 置信水平 (1 - )n n区间宽度随置信水平的增大而增大区间宽度随置信水平的增大而增大2. 数据的离散程度 (s)n n区间宽度随离散程度的增大而增大区间宽度随离散程度的增大而增大3. 样本容量n

162、n区间宽度随样本容量的增大而减小区间宽度随样本容量的增大而减小4. 用于预测的 xp与x的差异程度n n区间宽度随区间宽度随 x xp p与与 x x 的差异程度的增大而增大的差异程度的增大而增大1 - 453置信区间置信区间、预测区间预测区间、回归方回归方程程xp pyx x预测上限置信上限预测下限置信下限1 - 454第三节第三节 多元线性回归多元线性回归一一. 多元线性回归模型多元线性回归模型-回归参数的估计回归参数的估计-回归方程的显著性检验回归方程的显著性检验-回归系数的显著性检验回归系数的显著性检验-多元线性回归的预测多元线性回归的预测1 - 455多元线性回归模型多元线性回归模型

163、1 - 456多元线性回归模型多元线性回归模型 (概念要点)(概念要点)1.一个因变量与两个及两个以上自变量之间的回归一个因变量与两个及两个以上自变量之间的回归2.描描述述因因变变量量 y y 如如何何依依赖赖于于自自变变量量 x x1 1 , x x2 2 , x xp p 和误差项和误差项 的方程称为的方程称为多元线性回归模型多元线性回归模型多元线性回归模型多元线性回归模型3.涉及涉及 p p 个自变量的多元线性回归模型可表示为个自变量的多元线性回归模型可表示为 0 0 , , , p p是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2

164、2 , ,x xp p 的线性函数加上误差项的线性函数加上误差项 说说明明了了包包含含在在y y里里面面但但不不能能被被p p个个自自变变量量的的线线性关系所解释的变异性性关系所解释的变异性1 - 457多元线性回归模型多元线性回归模型 (概念要点)(概念要点) 对于 n 组实际观察数据(yi ; xi1,,xi2,xip ),(i=1,2,n),多元线性回归模型可表示为y1 = 0 0 + + 1 1 x11+ + 2 2 x12 + + + px1p + + 1 1y2= 0 0 + + 1 1 x21 + + 2 2 x22 + + + px2p + + 2 2 yn= 0 0 + +

165、1 1 xn1 + + 2 2 xn2 + + + pxnp + + n 1 - 458多元线性回归模型多元线性回归模型(基本假定)(基本假定)1.自变量 x1,x2,xp是确定性变量,不是随机变量2.随机误差项的期望值为0,且方差2 都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立1 - 459多元线性回归方程多元线性回归方程 (概念要点)(概念要点)1.描述 y 的平均值或期望值如何依赖于 x1, x1 ,xp的方程称为多元线性回归方程多元线性回归方程2.多元线性回归方程的形式为 E( y ) = 0+ 1 x1 + 2 x2 + p xp , , p p称为偏回归

166、系数称为偏回归系数 i i 表表示示假假定定其其他他变变量量不不变变,当当 x xi i 每每变变动一个单位时,动一个单位时,y y 的平均平均变动值的平均平均变动值1 - 460多元线性回归方方程的直观解释多元线性回归方方程的直观解释二元线性回归模型二元线性回归模型二元线性回归模型二元线性回归模型( (观察到的观察到的y y) )回归面回归面 0 0 i ix x1 1y yx x2 2( (x x1 1, ,x x2 2) )1 - 461多元线性回归的估计多元线性回归的估计( (经验经验) )方程方程1.总总体体回回归归参参数数 是是未未知知的的,利利用用样样本数据去估计本数据去估计2.

167、用用样样本本统统计计量量 代代替替回回归归方方程程中中的的 未知参数未知参数 即得到估计的回归方程即得到估计的回归方程 是是 估计值估计值 是是 y y 的估计值的估计值1 - 462参数的最小二乘估计参数的最小二乘估计1 - 463参数的最小二乘法参数的最小二乘法 (要点)(要点)2.根根据据最最小小二二乘乘法法的的要要求求,可可得得求求解解各各回回归归参参数数 的标准方程如下的标准方程如下1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达到最小来求得达到最小来求得 。即。即1 - 464回归方程的显著性检验回归方程的显著性检验1 - 465多重样本决定系

168、数多重样本决定系数 (多重判定系数(多重判定系数 R2 )1.回归平方和占总离差平方和的比例回归平方和占总离差平方和的比例2.反映回归直线的拟合程度反映回归直线的拟合程度3.取值范围在取值范围在 0 , 1 0 , 1 之间之间4. R R2 2 1 1,说明回归方程拟合的越好;,说明回归方程拟合的越好; R R2 20 0,说明,说明回归方程拟合的越差回归方程拟合的越差5.等于多重相关系数的平方,即等于多重相关系数的平方,即R R2 2=(=(R R) )2 21 - 466修正的多重样本决定系数修正的多重样本决定系数 (修正的多重判定系数(修正的多重判定系数 R2 )1.由于增加自变量将影

169、响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正R2的值2.用n表示观察值的数目,p表示自变量的数目,修正的多元判定系数的计算公式可表示为1 - 467回归方程的显著性检验回归方程的显著性检验 (线性关系的检验线性关系的检验 )1.检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总总体体的的显显著性著性检验2.检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应应用用 F 检检验验来分析二者之间的差别是否显著n n如如果果是是显显著著的的,因因变变量量与与自自变变量量之之间间存存在在线线性性关系关系n n如

170、如果果不不显显著著,因因变变量量与与自自变变量量之之间间不不存存在在线线性性关系关系1 - 468回归方程的显著性检验回归方程的显著性检验 (步骤)(步骤)1.提出假设提出假设n nH H0 0: 1 1 2 2 p p=0 =0 线性关系不显著线性关系不显著n nH H1 1: 1 1, 2 2, p p至少有一个不等于至少有一个不等于0 02. 2. 计算检验统计量计算检验统计量F F3. 3. 确定显著性水平确定显著性水平 和分子自由度和分子自由度p p、分母自由度、分母自由度n-n-p p-1-1找出临界值找出临界值F F 4. 4. 作出决策:若作出决策:若F F F F ,拒绝,拒

171、绝H H0 0;若若F F F F ,接受,接受H H0 01 - 469回归系数的显著性检验回归系数的显著性检验(要点)(要点)1.如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著2.对每一个自变量都要单独进行检验3.应用 t 检验4.在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验1 - 470回归系数的显著性检验回归系数的显著性检验 (步骤)(步骤)1.提出假设n nH H0 0: i i = 0 (= 0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系

172、) ) n nH H1 1: i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系) ) 2.计算检验的统计量 t3. 确定显著性水平,并进行决策 t tt t,拒绝,拒绝H H0 0; t t F F0.050.05(2,7)=4.74(2,7)=4.74,回归方程显著,回归方程显著4. 4. 回归系数的显著性检验回归系数的显著性检验2. 2.t t= = 9.35489.3548t t=0.3646=0.3646,; t t 2 2 = = 4.7962 4.7962 t t=2.3646=2.3646;两个回归系数均显著两个回归系数均显著一个含有

173、四个变量的回归1 - 474第三节第三节 可化为线性回归的可化为线性回归的 曲线回归曲线回归-基本概念基本概念-非线性模型及其线性化方法非线性模型及其线性化方法1 - 475非线性回归非线性回归1. 因变量 y 与 x 之间不是线性关系2. 可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型1 - 476几种常见的非线性模型几种常见的非线性模型 指数函数2.线性化方法两端取对数得:两端取对数得:lnlny y = ln= ln + + x x令:令:y y = ln = lny y,则有,则有y y = = lnln + + x x1.基本形

174、式:3.图像 1 - 477几种常见的非线性模型几种常见的非线性模型 幂函数2.线性化方法两端取对数得:两端取对数得:lg lg y y = lg= lg + + lglg x x令:令:y y = lg = lgy y,x x = lg = lg x x,则则y y = = lglg + + x x 1.基本形式:3.图像00 1 1 1 1 = 1= 1-1-1 0 0 -1 -1 =-1 =-1 1 - 478几种常见的非线性模型几种常见的非线性模型 双曲线函数2.线性化方法令:令:y y = 1/ = 1/y y,x x = 1/= 1/x x, , 则有则有y y = = + + x

175、 x 1.基本形式:3.图像 0 0 01 - 479几种常见的非线性模型几种常见的非线性模型 对数函数2.线性化方法x x = lg= lgx x , , 则有则有y y = = + + x x 1.基本形式:3.图像 0 0 0 0 1 - 480几种常见的非线性模型几种常见的非线性模型 S 型曲线2.线性化方法令:令:y y = 1/ = 1/y y,x x = e= e- -x x, , 则有则有y y = = + + x x 1.基本形式:3.图像1 - 481非线性回归非线性回归(实例)(实例) 【例例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。废品率与生产

176、率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系生产率(周生产率(周/单位单位)x1000200030003500 4000 4500 5000废品率(废品率(%)y5.26.56.88.110.210.313.01 - 482非线性回归非线性回归(实例)(实例)生产率与废品率的散点图1 - 483非线性回归非线性回归(实例)(实例)1.用线性模型:y =01x+ ,有 y = 2.671+0.0018x2.用指数模型:y = x ,有 y =4.05(1.0002)x3.比较 直线的残差平方和5.3371指数模型的残差平方和6.11。直线模型略好于指数模型1 - 484本章小结本章小结1.相关系数与相关分析相关系数与相关分析2.一一元元线线性性回回归归模模型型、回回归归方方程程与与估估计计的的回回归方程归方程3.多多元元线线性性回回归归模模型型、回回归归方方程程与与估估计计的的回回归方程归方程4.回归方程与回归系数的显著性检验回归方程与回归系数的显著性检验5.非线性回归的线性化非线性回归的线性化5. 用用Excel 进行回归分析进行回归分析1 - 485结结 束束

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号