数据与统计学PPT课件2

上传人:大米 文档编号:567687547 上传时间:2024-07-22 格式:PPT 页数:62 大小:2.95MB
返回 下载 相关 举报
数据与统计学PPT课件2_第1页
第1页 / 共62页
数据与统计学PPT课件2_第2页
第2页 / 共62页
数据与统计学PPT课件2_第3页
第3页 / 共62页
数据与统计学PPT课件2_第4页
第4页 / 共62页
数据与统计学PPT课件2_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《数据与统计学PPT课件2》由会员分享,可在线阅读,更多相关《数据与统计学PPT课件2(62页珍藏版)》请在金锄头文库上搜索。

1、统统 计计 学学主讲教师:张主讲教师:张 谦谦2统计学统计学描述统计描述统计推断统计推断统计目的目的基础基础参参数数估估计计参参数数估估计计参参数数估估计计假假设设检检验验参参数数估估计计方方差差分分析析参参数数估估计计相相关关与与回回归归分分析析参参数数估估计计时时间间序序列列分分析析参参数数估估计计统统计计指指数数概率、概率概率、概率分布和抽样分布和抽样分布分布第第 1 章章 绪绪 论论n1.1 统计数据与统计学统计数据与统计学n1.2 统计学的产生和发展统计学的产生和发展n1.3 统计学的分科统计学的分科n1.4 统计数据的来源统计数据的来源n1.5 统计数据的质量统计数据的质量 n1.

2、6 统计学的基本概念统计学的基本概念n 本章小结本章小结4本章学习教学大纲要求本章学习教学大纲要求n1.理解统计学的基本涵义理解统计学的基本涵义n2.理解统计数据与统计学的关系理解统计数据与统计学的关系n3.区分描述统计与推断统计区分描述统计与推断统计n4.了解统计误差的基本概念和分类了解统计误差的基本概念和分类n5.了解统计学与其他学科的关系了解统计学与其他学科的关系n6.了解统计学的产生与发展过程了解统计学的产生与发展过程 n7.掌握并理解总体与总体单位、样本、指掌握并理解总体与总体单位、样本、指标与标志的基本概念标与标志的基本概念5“统计统计”的三种含的三种含义义1. 1. 统计工作统计

3、工作统计工作统计工作n n收集数据的活动收集数据的活动收集数据的活动收集数据的活动2. 2. 统计数据统计数据统计数据统计数据对现象计量的结果对现象计量的结果对现象计量的结果对现象计量的结果 3. 3. 统计学统计学统计学统计学n n分析数据的方法与技术分析数据的方法与技术分析数据的方法与技术分析数据的方法与技术统计工作统计工作统计学统计学统计数据统计数据三者关系图三者关系图1.1 统计数据与统计学统计数据与统计学6一、什么是统计学?1. 数据搜集:例如,调查与试验数据搜集:例如,调查与试验2. 数据整理:例如,分组数据整理:例如,分组 3. 数据展示:例如,数据展示:例如, 图和表图和表4.

4、 数据分析:例如,回归分析数据分析:例如,回归分析 统统计计学学是是一一门门收收集集、整整理理和和分分析析数数据据的的方方法法科科学学,其其目目的的是是探探索索数数据据的的内内在在数数量量规规律性,以达到对客观事物的科学认识律性,以达到对客观事物的科学认识重点重点7统计研究的过程统计研究的过程收集数据收集数据( (取得数据取得数据取得数据取得数据) )整理数据整理数据( (处理数据处理数据处理数据处理数据) )解释数据解释数据( (结果说明结果说明结果说明结果说明) )分析数据分析数据( (研究数据研究数据研究数据研究数据) )实际问题实际问题8统计规律统计规律(一些例子一些例子)1.正 常

5、条 件 下 新 生 婴 儿 的 男 女 性 别 比 为107:1002.投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/63.农作物的产量与施肥量之间存在相关关系9二、统计学与其他学科的关系1、统计学与数学的关系、统计学与数学的关系联系:联系:数学为统计理论和统计方法的发展提供基础数学为统计理论和统计方法的发展提供基础不能将统计学等同于数学不能将统计学等同于数学区别:区别: 数学数学 统计学统计学研究内容:研究内容:抽象的数量规律抽象的数量规律 具体的、实际现象数量规律具体的、实际现象数量规律逻辑方法:逻辑方法: 演绎演绎 演绎与归纳相结合,但主要是

6、归纳演绎与归纳相结合,但主要是归纳10 统计学的应用领域统计学的应用领域a actuarial work ctuarial work ( (精算精算精算精算) ) agriculture agriculture ( (农业农业农业农业) )animal science animal science ( (动物学动物学动物学动物学) ) anthropology anthropology ( (人类学人类学人类学人类学) )archaeology archaeology ( (考古学考古学考古学考古学) ) auditing auditing ( (审计学审计学审计学审计学) )crystall

7、ography crystallography ( (晶体学晶体学晶体学晶体学) ) demography demography ( (人口统计学人口统计学人口统计学人口统计学) )dentistry dentistry ( (牙医学牙医学牙医学牙医学) ) ecology ecology ( (生态学生态学生态学生态学) )econometrics econometrics ( (经济计量学经济计量学经济计量学经济计量学) ) education education ( (教育学教育学教育学教育学) ) election forecasting and projection election

8、 forecasting and projection ( (选举预测和策划选举预测和策划选举预测和策划选举预测和策划) )engineering engineering ( (工程工程工程工程) ) epidemiology epidemiology ( (流行病学流行病学流行病学流行病学) )finance finance ( (金融金融金融金融) )fisheries research fisheries research ( (水产渔业研究水产渔业研究水产渔业研究水产渔业研究) )gambling gambling ( (赌博赌博赌博赌博) ) genetics genetics (

9、(遗传学遗传学遗传学遗传学) )geography geography ( (地理学地理学地理学地理学) ) geology geology ( (地质学地质学地质学地质学) )historical research historical research ( (历史研究历史研究历史研究历史研究) ) human genetics human genetics ( (人类遗传学人类遗传学人类遗传学人类遗传学) )2、统计学与其它学科的关系、统计学与其它学科的关系11统计学应用的领域(续)hydrology (hydrology (水文学水文学水文学水文学) Industry () Indust

10、ry (工业工业工业工业) ) linguistics (linguistics (语言学语言学语言学语言学) literature () literature (文学文学文学文学) )manpower planning (manpower planning (劳动力计划劳动力计划劳动力计划劳动力计划) )management science (management science (管理科学管理科学管理科学管理科学) )marketing (marketing (市场营销学市场营销学市场营销学市场营销学) medical diagnosis () medical diagnosis (医学诊

11、断医学诊断医学诊断医学诊断) )meteorology (meteorology (气象学气象学气象学气象学) military science () military science (军事科学军事科学军事科学军事科学) )nuclear material safeguards (nuclear material safeguards (核材料安全管理核材料安全管理核材料安全管理核材料安全管理) )ophthalmology (ophthalmology (眼科学眼科学眼科学眼科学) pharmaceutics () pharmaceutics (制药学制药学制药学制药学) )physics

12、 (physics (物理学物理学物理学物理学) political science () political science (政治学政治学政治学政治学) )psychology (psychology (心理学心理学心理学心理学) psychophysics () psychophysics (心理物理学心理物理学心理物理学心理物理学) )quality control (quality control (质量控制质量控制质量控制质量控制) religious studies () religious studies (宗教研究宗教研究宗教研究宗教研究) )sociology (socio

13、logy (社会学社会学社会学社会学) survey sampling () survey sampling (调查抽样调查抽样调查抽样调查抽样) )taxonomy (taxonomy (分类学分类学分类学分类学) weather modification () weather modification (气象改善气象改善气象改善气象改善) )统计学是一门应用极为广泛统计学是一门应用极为广泛的学科,其应用领域涉及到的学科,其应用领域涉及到了社会、经济、管理、医学了社会、经济、管理、医学等方方面面!等方方面面!12 一般认为,统计学产生于一般认为,统计学产生于17世纪中叶,世纪中叶,是从几个不

14、同领域开始的:是从几个不同领域开始的:第一个源头第一个源头威廉威廉配第配第(William Patty)政政治算术治算术(1676年)。在书中用年)。在书中用大量的数据大量的数据对对英、法、荷三国的经济实力进行比较,使用英、法、荷三国的经济实力进行比较,使用定定量的分析量的分析方法。方法。(配第)是政治经济学之父,在某种(配第)是政治经济学之父,在某种程度上也可以说是统计学的创造人程度上也可以说是统计学的创造人马克思马克思1.2 统计学的产生和发展统计学的产生和发展13另一个创始人另一个创始人英国的英国的约翰约翰格朗特格朗特(John Graunt)发发表于表于1662年的年的关于死亡表的自然

15、观察与政治观察关于死亡表的自然观察与政治观察一文中,通过一文中,通过大量观察的方法大量观察的方法,研究并发现了人口与,研究并发现了人口与社会现象中重要的社会现象中重要的数量规律性数量规律性。被称为。被称为“人口统计创人口统计创始人始人”。第三个源头第三个源头古典概率论引入统计学,开辟了统计学古典概率论引入统计学,开辟了统计学的新领域,形成了的新领域,形成了数理统计学数理统计学。1919世纪末建成了古典统计学(世纪末建成了古典统计学(主要是描述统计学主要是描述统计学)的)的基本框架。基本框架。2020世纪,统计学在理论、方法和应用领域有了较大发世纪,统计学在理论、方法和应用领域有了较大发展,展,

16、5050年代以来,扩展成为各学科的基础工具。年代以来,扩展成为各学科的基础工具。14历史上著名的统计学家历史上著名的统计学家 Jacob Bernoulli (Jacob Bernoulli (伯努利伯努利)(16541705) )(16541705) Edmond Halley (Edmond Halley (哈雷哈雷) (16561742) ) (16561742) De Moivre (De Moivre (棣莫弗棣莫弗) (16671754) ) (16671754) Thomas Bayes (Thomas Bayes (贝叶斯贝叶斯) (17021761) (17021761) L

17、eonhard Euler (Leonhard Euler (欧拉欧拉) (17071783) (17071783) Pierre Simon Laplace (Pierre Simon Laplace (拉普拉斯拉普拉斯) (17491827) (17491827) Adrien Marie Legendre (Adrien Marie Legendre (勒让德勒让德) (17521833) ) (17521833) Thomas Robert Malthus (Thomas Robert Malthus (马尔萨斯马尔萨斯) (17661834) (17661834)Thomas Rob

18、ert Thomas Robert Malthus Malthus ( (马尔萨斯马尔萨斯) )Pierre Simon Laplace Pierre Simon Laplace ( (拉普拉斯拉普拉斯) )Leonhard Euler Leonhard Euler ( (欧拉欧拉) )资料15历史上著名的统计学家历史上著名的统计学家 Friedrich Gauss (Friedrich Gauss (高斯高斯) (17771855) ) (17771855) Johann Gregor Mendel (Johann Gregor Mendel (孟德尔孟德尔) (18221884) (182

19、21884) Karl Pearson (Karl Pearson (皮尔逊皮尔逊) (18571936) (18571936) Ronald Aylmer Fisher (Ronald Aylmer Fisher (费希尔费希尔) (18901962) (18901962) Jerzy NeymanJerzy Neyman(奈曼)(奈曼) (18941981) (18941981) Egon Sharpe Pearson (Egon Sharpe Pearson (皮尔逊皮尔逊) (18951980) (18951980) William Feller (William Feller (费勒

20、费勒)(19061970). )(19061970). Friedrich Gauss Friedrich Gauss ( (高斯高斯) )Johann Gregor MendelJohann Gregor Mendel ( (孟德尔孟德尔) )16一、按照应用方法的不同分为一、按照应用方法的不同分为 描述统计学描述统计学 推断统计学推断统计学描述统计是整个统计学的描述统计是整个统计学的基础基础,推断统计则是,推断统计则是现代统计学的现代统计学的主要内容主要内容思考题思考题:举例分析:描述统计与推断统计的区:举例分析:描述统计与推断统计的区别与联系?别与联系?1.3 统计学的分科统计学的分科1

21、7描述统计描述统计描述统计描述统计推断统计推断统计推断统计推断统计描述统计和推断统计指对采集的数据进行登记、审核、整指对采集的数据进行登记、审核、整指对采集的数据进行登记、审核、整指对采集的数据进行登记、审核、整理、归类在此基础上进一步计算出理、归类在此基础上进一步计算出理、归类在此基础上进一步计算出理、归类在此基础上进一步计算出各种能反映总体数量特征的综合指标,各种能反映总体数量特征的综合指标,各种能反映总体数量特征的综合指标,各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而并用图表的形式表示经过归纳分析而并用图表的形式表示经过归纳分析而并用图表的形式表示经过归纳分析而得到

22、的各种有用的统计信息。得到的各种有用的统计信息。得到的各种有用的统计信息。得到的各种有用的统计信息。是在对样本数据进行描述的基础上,是在对样本数据进行描述的基础上,是在对样本数据进行描述的基础上,是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计利用一定的方法根据样本数据去估计利用一定的方法根据样本数据去估计利用一定的方法根据样本数据去估计或检验总体的数量特征。或检验总体的数量特征。或检验总体的数量特征。或检验总体的数量特征。18描述统计(Descriptive Statistics)研究数据收集、整理和描研究数据收集、整理和描述的统计学方法述的统计学方法 1.内容内容搜集数据搜

23、集数据整理数据整理数据显示数据显示数据2. 目的目的描述数据特征描述数据特征找出数据的基本找出数据的基本规律规律0 0 0252525505050Q1Q1Q1Q2Q2Q2Q3Q3Q3Q4Q4Q4¥x x x = 30 = 30 = 30 s s s2 22 = 105 = 105 = 105重点重点19推断统计(Inferential Statistics)研究如何利用样本数据来推断研究如何利用样本数据来推断总体特征的统计学方法总体特征的统计学方法1.内容内容参数参数估计估计假设检验假设检验2.目的目的对总体特征作出推对总体特征作出推断断样样样样本本本本总总总总体体体体重点重点20描述统计与推

24、断统计的关系重点重点反映反映反映反映客观客观客观客观现象现象现象现象的数的数的数的数据据据据总体内在的数总体内在的数总体内在的数总体内在的数量规律性量规律性量规律性量规律性推断统计推断统计推断统计推断统计(利用样本信(利用样本信(利用样本信(利用样本信息和概率论对息和概率论对息和概率论对息和概率论对总体的数量特总体的数量特总体的数量特总体的数量特征进行估计和征进行估计和征进行估计和征进行估计和检验等)检验等)检验等)检验等)概率论概率论概率论概率论(包括分布理论、大数定律和(包括分布理论、大数定律和(包括分布理论、大数定律和(包括分布理论、大数定律和中心极限定理等)中心极限定理等)中心极限定理

25、等)中心极限定理等)样本数据样本数据样本数据样本数据总体数据总体数据总体数据总体数据描述统计描述统计描述统计描述统计(统计数据的搜集、(统计数据的搜集、(统计数据的搜集、(统计数据的搜集、整理、显示和分析整理、显示和分析整理、显示和分析整理、显示和分析等)等)等)等)21统计方法221.理论统计理论统计(Theoretical Statistics)研究统计学的一般理论研究统计学的一般理论研究统计方法的数学原理研究统计方法的数学原理2.应用统计应用统计(Applied Statistics)研究统计学在各领域的具体应用研究统计学在各领域的具体应用二、按照研究内容的不同分为二、按照研究内容的不同

26、分为 理论统计学理论统计学 应用统计学应用统计学23统统统统计计计计学学学学的的的的两两两两大大大大类类类类 理论统计学理论统计学理论统计学理论统计学 (数理统计学)应用统计学应用统计学应用统计学应用统计学它的定义是把研究对象一般化、抽象化,它的定义是把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变经的一心内容是以归纳方法研究随机变经的一般规律。般规律。社会经济统计学。这是一门以社社会经济统计学。这是一门以社会经济现象的数量方面为特定研会经济现象的数量方

27、面为特定研究对象的应用统计学究对象的应用统计学 。理论统计学和应用统计学241.4 统计数据的来源统计数据的来源n直接获取的数据直接获取的数据统计数据来源于直接的调查、观察和科学实验统计数据来源于直接的调查、观察和科学实验又称为第一手数据又称为第一手数据n间接获取的数据间接获取的数据从报纸、图书、杂志、统计年鉴、网络等渠道从报纸、图书、杂志、统计年鉴、网络等渠道获得获得又称为第二手数据又称为第二手数据25直接数据直接数据n对于社会经济管理和决策而对于社会经济管理和决策而言,主要通过统计调查的方言,主要通过统计调查的方式获取数据式获取数据n统计调查方法统计调查方法普查普查l为特定目的,一次性全面

28、调查为特定目的,一次性全面调查l优点:资料全面、准确性高;优点:资料全面、准确性高;l缺点:费用比较高,应用范围缺点:费用比较高,应用范围比较狭窄。一般适用于为社会比较狭窄。一般适用于为社会提供基础全面的资料提供基础全面的资料抽样调查抽样调查l随机样本推断总体规律性随机样本推断总体规律性l l具有经济性、时效性强、适应具有经济性、时效性强、适应具有经济性、时效性强、适应具有经济性、时效性强、适应面广、准确性高等特点面广、准确性高等特点面广、准确性高等特点面广、准确性高等特点l应用最广泛、最重要应用最广泛、最重要26统计调查组织方式统计调查组织方式重点调查重点调查抽样调查抽样调查普查普查典型调查

29、典型调查统计报表统计报表统统计计调调查查组组织织方方式式我国现行统计调我国现行统计调查体系,是以查体系,是以普普查、统计报表为查、统计报表为基础基础,以,以抽样调抽样调查为主要方式查为主要方式、辅之以重点调查辅之以重点调查典型调查典型调查的一种的一种调查体系。调查体系。本小节补本小节补充内容充内容27普查普查(census) n1.为特定目的专门组织的非经常性全面调查为特定目的专门组织的非经常性全面调查n2.通常是一次性或周期性的通常是一次性或周期性的n3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间n4.数据的规范化程度较高数据的规范化程度较高n5.应用范围比较狭窄应用范围比

30、较狭窄总体总体28抽样调查抽样调查(sampling survey) n1. 从总体中随机抽取一部分单位作为从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法来推断总体特征的数据收集方法 总体总体总体总体随机样本随机样本随机样本随机样本 n n2. 具有经济性、时具有经济性、时 效性强、适应面广、效性强、适应面广、准确性高等特点准确性高等特点29重点调查重点调查 重点调查重点调查是从调查对象的全部单位中选择少数是从调查对象的全部单位中选择少数重点单位重点单位进行进行非全面非全面调查调查重点单位重点单位重点单位重点单位是指在

31、所要调查的数量特征上占有较大比重的是指在所要调查的数量特征上占有较大比重的是指在所要调查的数量特征上占有较大比重的是指在所要调查的数量特征上占有较大比重的单位。单位。单位。单位。如若要调查某市人民币储蓄状况,则大型储蓄所如若要调查某市人民币储蓄状况,则大型储蓄所如若要调查某市人民币储蓄状况,则大型储蓄所如若要调查某市人民币储蓄状况,则大型储蓄所则成为重点单位则成为重点单位则成为重点单位则成为重点单位注:注:注:注:重点调查的调查结果不能用于推断总体重点调查的调查结果不能用于推断总体重点调查的调查结果不能用于推断总体重点调查的调查结果不能用于推断总体优点:优点:优点:优点:调查单位少,省时省力,

32、能及时取得较调查单位少,省时省力,能及时取得较调查单位少,省时省力,能及时取得较调查单位少,省时省力,能及时取得较详细的资料;详细的资料;详细的资料;详细的资料;缺点:缺点:缺点:缺点:调查的前提是重点单位要存在调查的前提是重点单位要存在调查的前提是重点单位要存在调查的前提是重点单位要存在30典型调查典型调查 典型调查典型调查是从调查对象的全部单位中是从调查对象的全部单位中选择少数选择少数典型单位典型单位进行进行非全面非全面调查调查调查目的是描述和揭示事物的本质特征和调查目的是描述和揭示事物的本质特征和规律,其调查结果也不能用于推断总体。规律,其调查结果也不能用于推断总体。优点优点:代表性好、

33、省时省力、资料详细;:代表性好、省时省力、资料详细;缺点缺点:典型单位选择的好与坏直接关系到:典型单位选择的好与坏直接关系到统计结果统计结果31统计报表统计报表 统计报表统计报表是按照国家或上级部门有关法是按照国家或上级部门有关法规的规定,规的规定,自上而下地统一布置自上而下地统一布置、自下而上自下而上地逐级提供地逐级提供基本统计数据的一种调查方式基本统计数据的一种调查方式统计报表的资料来源是基层单位的原始记录统计报表的资料来源是基层单位的原始记录优点优点:准确性高、完整性好、:准确性高、完整性好、 便于资料积累;便于资料积累;缺点缺点:缺乏灵活性,时效性差:缺乏灵活性,时效性差32间接数据间

34、接数据n利用各种现成的利用各种现成的数据数据报纸、图书、杂报纸、图书、杂志、统计年鉴志、统计年鉴从专业数据公司从专业数据公司购买购买互联网互联网33间接取得的数据间接取得的数据InternetInternethttp/http/WWW.WWW.中国统计年中国统计年中国统计年中国统计年鉴鉴鉴鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社1.统

35、统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如各类统计年鉴如各类统计年鉴2.各各类类经经济济信信息息中中心心、信信息息咨咨询询机机构构、专业调查机构等提供的数据专业调查机构等提供的数据3.各各类类专专业业期期刊刊、报报纸纸、书书籍籍所所提提供供的的资料资料4.各各种种会会议议,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性性、学学术术性性研研讨讨会会上上交交流流的的有关资料有关资料5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料 34提供统计数据的部分政府网站提供统计数据的部分政府网站中国政府及相关机构中国政府及相关机构 网址网址数据内容数据

36、内容国家统计局国家统计局http:/统计年鉴、统计统计年鉴、统计月报等月报等国务院发展研究中心国务院发展研究中心信息网信息网http:/宏观经济、财经、宏观经济、财经、货币金融等货币金融等 中国经济信息网中国经济信息网http:/经济信息及各类经济信息及各类网站网站华通数据中心华通数据中心http:/国家统计局授权国家统计局授权的数据中心的数据中心中国决策信息网中国决策信息网http:/决策知识及案例决策知识及案例三农数据网三农数据网http:/三农信息、论坛三农信息、论坛及相关网站及相关网站35提供统计数据的部分政府网站提供统计数据的部分政府网站美国政府机构美国政府机构 网址网址数据内容数据

37、内容人口普查局人口普查局http:/www.census.gov人口和家庭等人口和家庭等联邦储备局联邦储备局http:/www.bog.frb.fed.us货币供应、信货币供应、信誉、汇率等誉、汇率等预算编制办公室预算编制办公室http:/www.whitehouse.gov/omb财政收入、支财政收入、支出、债券等出、债券等商务部商务部http:/www.doc.gov商业、工业等商业、工业等36数据的搜集方法数据的搜集方法访问调查访问调查问卷调查问卷调查文案调查文案调查观察调查观察调查实验调查实验调查数数据据的的搜搜集集方方法法利用现有的各种文献资利用现有的各种文献资料进行调查的方法。是料

38、进行调查的方法。是一切调查方法的起点一切调查方法的起点是以问卷的形式由被调查者是以问卷的形式由被调查者填答进行调查的方法。填答进行调查的方法。通过调查者与被调查者之间通过调查者与被调查者之间的访谈获取资料的方法的访谈获取资料的方法报刊问卷报刊问卷邮寄问卷邮寄问卷留置问卷留置问卷直接访问直接访问间接访问间接访问 (电话调查)(电话调查)调查者利用自身感觉器官或调查者利用自身感觉器官或观察工具搜集资料的方法观察工具搜集资料的方法通过实验方式确定因通过实验方式确定因果联系的方法果联系的方法371.5 统计数据的质量统计数据的质量n统计数据的统计数据的质量控制质量控制问题是贯穿于统计研问题是贯穿于统计

39、研究全过程究全过程的重要问题的重要问题n不同的统计工作阶段,不同的统计工作阶段,统计数据误差的原因统计数据误差的原因不同,严重程度也不不同,严重程度也不同。同。38统计调查阶段的误差统计调查阶段的误差统计调查阶段统计调查阶段(直接收集数据)(直接收集数据)非抽样误差非抽样误差填报、抄录、不完整抽样等错误填报、抄录、不完整抽样等错误被调查者不合作被调查者不合作人为干扰(虚报、瞒报)人为干扰(虚报、瞒报)抽样误差抽样误差利用样本推断总体时产生利用样本推断总体时产生这类误差可以避免这类误差可以避免加强统计人员责任心、科学抽样等加强统计人员责任心、科学抽样等这类误差无法避免这类误差无法避免但可以计量、

40、控制,如加大样本量但可以计量、控制,如加大样本量39抽样误差抽样误差(sampling error)1.由于抽样的随机性所带来的误差由于抽样的随机性所带来的误差 2.所有样本可能的结果与总体真值之间的平所有样本可能的结果与总体真值之间的平均性差异均性差异 3.影响抽样误差大小的因素影响抽样误差大小的因素样本量的大小样本量的大小总体的变异性总体的变异性40非抽样误差非抽样误差(non-sampling error)1.相对于抽样误差而言相对于抽样误差而言2.除抽样误差之外的,由于其他原因造成的除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异样本观察结果与总体真值之间的差异3.

41、存在于所有的调查之中存在于所有的调查之中概率抽样,非概率抽样,全面性调查概率抽样,非概率抽样,全面性调查4.有抽样框误差、回答误差、无回答误差、有抽样框误差、回答误差、无回答误差、调查员误差、测量误差调查员误差、测量误差41误差的控制误差的控制1.抽样误差可计算和控制抽样误差可计算和控制2.非抽样误差的控制非抽样误差的控制调查员的挑选调查员的挑选调查员的培训调查员的培训督导员的调查专业水平督导员的调查专业水平调查过程控制调查过程控制l调查结果进行检验、评估调查结果进行检验、评估l现场调查人员进行奖惩的制度现场调查人员进行奖惩的制度421.6 统计学的基本概念统计学的基本概念一、统计总体、总体单

42、位和样本一、统计总体、总体单位和样本n n1.统计总体统计总体(population)是客观存在的、在某一性质基础上结合起来的是客观存在的、在某一性质基础上结合起来的是客观存在的、在某一性质基础上结合起来的是客观存在的、在某一性质基础上结合起来的许多个别事物的整体。许多个别事物的整体。许多个别事物的整体。许多个别事物的整体。总体分为有限总体和无限总体总体分为有限总体和无限总体l有限总体的范围能够明确确定,且元素的数目是有有限总体的范围能够明确确定,且元素的数目是有限的限的l无限总体所包括的元素是无限的,不可数的无限总体所包括的元素是无限的,不可数的n n总体的三个特征:总体的三个特征:(1)

43、(1) 大量性大量性大量性大量性 (2) (2) 同质性同质性同质性同质性 (3 3)差异性)差异性)差异性)差异性43n n2.总体单位总体单位构成总体的这些个别事物构成总体的这些个别事物构成总体的这些个别事物构成总体的这些个别事物l总体所研究的全部个体总体所研究的全部个体(数据数据) 的集合,其中的的集合,其中的每一个元素称为个体每一个元素称为个体 n n3.样本样本 (sample)从总体中抽取的部分总体单位构成的整体从总体中抽取的部分总体单位构成的整体从总体中抽取的部分总体单位构成的整体从总体中抽取的部分总体单位构成的整体构成样本的元素的数目称为样本容量构成样本的元素的数目称为样本容量

44、 44统计总体、总体单位和样本三者关系统计总体、总体单位和样本三者关系总体单位总体单位总体总体样本样本注意:注意:三者依据研究对象的不同,具有相对性三者依据研究对象的不同,具有相对性45 为了解经管学院为了解经管学院09级级3班的学习情况,班的学习情况,校学习部特对该班进行了一次调查,问:校学习部特对该班进行了一次调查,问:此次调查中总体是什么?总体单位是什么此次调查中总体是什么?总体单位是什么? 如果校学习部想了解经管学院所有班如果校学习部想了解经管学院所有班级的学习状况,这时总体是什么?总体单级的学习状况,这时总体是什么?总体单位呢?若学习部在抽样调查中,选中了位呢?若学习部在抽样调查中,

45、选中了3班、班、5班,问班,问3班和班和5班组成的整体,我们班组成的整体,我们称为什么?称为什么?46二、参数和统计量二、参数和统计量1.参数参数(parameter)描述总体特征的概括性数字度量,是描述总体特征的概括性数字度量,是研究者研究者想要了解的想要了解的总体的某种特征值总体的某种特征值所关心的参数主要有总体均值所关心的参数主要有总体均值( )、标准差、标准差( )、总体比例、总体比例( )等等总体参数通常用希腊字母表示总体参数通常用希腊字母表示 补充内容补充内容472.统计量统计量(statistic)用用来来描描述述样样本本特特征征的的概概括括性性数数字字度度量量,它它是是根根据据

46、样样本本数数据据计计算算出出来来的的一一些些量量,是是样样本本的的函数函数所所关关心心的的样样本本统统计计量量有有样样本本均均值值( x)、样样本本标准差标准差(s)、样本比例、样本比例(p)等等样本统计量通常用小写英文字母表示样本统计量通常用小写英文字母表示 48参数和统计量参数和统计量平均数平均数平均数平均数标准差标准差标准差标准差比例比例比例比例参数参数 统计量统计量 x xs sp p总体总体总体总体 样本样本样本样本49三、标志和标志表现三、标志和标志表现1.1.什么是标志?什么是标志?什么是标志?什么是标志?总体各单位普遍具有的属性或特征总体各单位普遍具有的属性或特征总体各单位普遍

47、具有的属性或特征总体各单位普遍具有的属性或特征统计研究是从登记标志开始,并通过对标志的综合来反映总统计研究是从登记标志开始,并通过对标志的综合来反映总统计研究是从登记标志开始,并通过对标志的综合来反映总统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。体的数量特征,因此标志是统计研究的起点。体的数量特征,因此标志是统计研究的起点。体的数量特征,因此标志是统计研究的起点。2.2.什么是标志表现?什么是标志表现?什么是标志表现?什么是标志表现?即标志特征在各单位的具体表现即标志特征在各单位的具体表现即标志特征在各单位的具体表现即标志特征在各单位的具体表现如

48、果说标志是统计所要调查的项目,那么标志表现是调查如果说标志是统计所要调查的项目,那么标志表现是调查如果说标志是统计所要调查的项目,那么标志表现是调查如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现所得结果,标志的实际体现所得结果,标志的实际体现所得结果,标志的实际体现补充内容补充内容50标标标标志志志志的的的的分分分分类类类类数量标志数量标志 品质标志品质标志表明总体单位属性表明总体单位属性方面的特征,只能方面的特征,只能用文字、语言来描用文字、语言来描述,如年龄、性别述,如年龄、性别表明总体单位数量表明总体单位数量方面的特征,可以方面的特征,可以用数值来表现,如用数

49、值来表现,如工资、身高工资、身高不变标志不变标志 变异标志变异标志 一个总体中各单一个总体中各单位有关标志的具位有关标志的具体表现都相同体表现都相同一个标志在总体一个标志在总体各单位的具体表各单位的具体表现不同现不同 51 标志表现有标志表现有品质标志表现品质标志表现和和数量标数量标志表现志表现之分之分 品质标志表现品质标志表现品质标志表现品质标志表现只能用文字表述,因此往往不能只能用文字表述,因此往往不能只能用文字表述,因此往往不能只能用文字表述,因此往往不能转化为统计指标,但对其对应的单位进行总计时转化为统计指标,但对其对应的单位进行总计时转化为统计指标,但对其对应的单位进行总计时转化为统

50、计指标,但对其对应的单位进行总计时就形成统计指标。就形成统计指标。就形成统计指标。就形成统计指标。 数量标志表现数量标志表现数量标志表现数量标志表现是一具体数值,也称是一具体数值,也称是一具体数值,也称是一具体数值,也称标志值标志值标志值标志值。 在统计研究中,品质标志主要作为在统计研究中,品质标志主要作为统计分组的统计分组的依据依据,以便计算出不同组别的总体单位数。数量标,以便计算出不同组别的总体单位数。数量标志除作为分组依据计算单位数外,还志除作为分组依据计算单位数外,还可以直接进行可以直接进行许多其它计算许多其它计算,如计算平均年龄、平均工资等。,如计算平均年龄、平均工资等。 52标志标

51、志标志表现标志表现标志表现标志表现品质标志品质标志数量标志数量标志性别性别性别性别民族民族民族民族宗教信仰宗教信仰宗教信仰宗教信仰家庭住址家庭住址家庭住址家庭住址年龄年龄年龄年龄身高身高身高身高体重体重体重体重文文字字表表述述数数据据表表述述(标标志志值值)男男汉族汉族佛教佛教43岁岁182cm75公斤公斤北京路北京路北京路北京路6 6号号号号53 四、统计指标与指标体系四、统计指标与指标体系 统计指标是反映统计指标是反映统计统计总体总体数量特征数量特征的概念和数值的概念和数值 基本要素基本要素基本要素基本要素指标的取值:反映所研究现象的规模和水平指标的取值:反映所研究现象的规模和水平指标的取

52、值:反映所研究现象的规模和水平指标的取值:反映所研究现象的规模和水平指标的概念指标的概念指标的概念指标的概念( (名称名称名称名称) ):是对所研究现象本质的抽象概括:是对所研究现象本质的抽象概括:是对所研究现象本质的抽象概括:是对所研究现象本质的抽象概括 如如2000年我国年我国国内生产总值国内生产总值894035亿元亿元国内生产总值国内生产总值894035亿元54n完整的统计指标完整的统计指标包括四项内容:包括四项内容: n1、指标名称指标名称,说明所反映现象数量特,说明所反映现象数量特征的性质和内容。征的性质和内容。 n2、统计的时间界限和空间范围统计的时间界限和空间范围。 n3、计量单

53、位计量单位。 n4、指标的数值指标的数值。 n例如,中国例如,中国1983年全国钢产量年全国钢产量4002万万吨,就是一个完整的统计指标。吨,就是一个完整的统计指标。n 统计学中的统计指标,一般是统计学中的统计指标,一般是泛指社会泛指社会经济现象某种数量特征经济现象某种数量特征,即没有具体规定其,即没有具体规定其时、空界限和没有数值的统计指标名称(如时、空界限和没有数值的统计指标名称(如“钢产量钢产量”)。)。 55质量指标质量指标例如,人口的年龄构成、农业例如,人口的年龄构成、农业一轻工业一轻工业重工业比例、平均单产、平均工资等等。重工业比例、平均单产、平均工资等等。 数量指标数量指标例如,

54、人口数、企业数、工资总额、商品销售额例如,人口数、企业数、工资总额、商品销售额等等等等 统统计计指指标标的的分分类类也称为也称为总量指标总量指标,用,用绝绝对数来对数来表示。反映现象表示。反映现象或过程的总规模和水平或过程的总规模和水平是总量指标的是总量指标的派生指标派生指标,用用相对数或平均数相对数或平均数来表来表示,以反映现象之间的示,以反映现象之间的内在联系相对比关系内在联系相对比关系如人口总数、如人口总数、企业总数、职企业总数、职工总数、工资工总数、工资总额总额如职工平均工资、如职工平均工资、人口密度、工人人口密度、工人出勤率出勤率 统计指标的分类统计指标的分类56n指标和标志既有明显

55、的区别,又有密切的联系,二指标和标志既有明显的区别,又有密切的联系,二者的主要区别是者的主要区别是:n(1)指标是说明)指标是说明总体总体特征的,而标志是说明特征的,而标志是说明总体单位总体单位特征的;特征的;n(2)标志有不能用数值表示的品质标志和能)标志有不能用数值表示的品质标志和能用数值表示的数量标志两种,而用数值表示的数量标志两种,而指标都必须是能用指标都必须是能用数值表示的数值表示的。n指标和标志的联系主要表现在指标和标志的联系主要表现在:n(1)有许多统计指标的数值是直接从总体单)有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;位的数量标志值汇总而来的;n(2)指标与数

56、量标志之间存在着转化的关系。)指标与数量标志之间存在着转化的关系。由于总体和单位的概念会随着研究目的不同而变化由于总体和单位的概念会随着研究目的不同而变化由于总体和单位的概念会随着研究目的不同而变化由于总体和单位的概念会随着研究目的不同而变化研究全国工业企业的情况,则各企研究全国工业企业的情况,则各企业的职工人数是总体单位的标志,业的职工人数是总体单位的标志,而如果研究目的变成某一企业的职而如果研究目的变成某一企业的职工状况,则该企业变成一个总体,工状况,则该企业变成一个总体,企业的职工人数变成了统计指标企业的职工人数变成了统计指标57统计指标体系统计指标体系统计指标体系统计指标体系意义意义意

57、义意义概念概念概念概念一个统计指标只反映总体的某一个一个统计指标只反映总体的某一个数量特征,说明现象某一侧面的情数量特征,说明现象某一侧面的情况。客观现象是复杂的,要反映其况。客观现象是复杂的,要反映其全貌、描述现象发展的全过程,只全貌、描述现象发展的全过程,只靠单个统计指标是不够的,需要设靠单个统计指标是不够的,需要设立统计指标体系。立统计指标体系。 统计指标体系是由统计指标体系是由一系列相互联系一系列相互联系的统计指标的统计指标所组成的有机整体用以所组成的有机整体用以反映所研究现象各方面相互依存、反映所研究现象各方面相互依存、相互制约的关系。相互制约的关系。 统计指标体系统计指标体系581

58、、下列标志中,属于数量标志的有哪些?品质、下列标志中,属于数量标志的有哪些?品质标志有哪些?标志有哪些?A 工资工资 B 年龄年龄 C 性别性别 D 民族民族 E 体重体重2、某班为调查总体,则每一名学生的统计学成、某班为调查总体,则每一名学生的统计学成绩是标志还是指标?全班平均统计学成绩呢?绩是标志还是指标?全班平均统计学成绩呢?3、下列指标中属于数量指标的有哪些?、下列指标中属于数量指标的有哪些?A 人口密度人口密度 B 国土面积国土面积 C 人口总额人口总额 D 平均平均GDP增长率增长率 E 平均人口密度平均人口密度 59本章小结本章小结1.统计数据与统计学统计数据与统计学2.统计学的

59、产生和发展统计学的产生和发展3.统计学的分科统计学的分科4.统计学与其他学科的关系统计学与其他学科的关系5.统计数据的来源统计数据的来源6.统计数据的质量控制统计数据的质量控制7.统计学的基本概念统计学的基本概念60n控制图控制图control chartcontrol chartn根据假设检验的原理构造一种图,用于监测生产过程是否处于控制根据假设检验的原理构造一种图,用于监测生产过程是否处于控制状态。它是统计状态。它是统计质量管理质量管理的一种重要手段和工具。的一种重要手段和工具。 n作用作用n在生产过程中,产品质量由于受随机因素和系统因素的影响而产生在生产过程中,产品质量由于受随机因素和系

60、统因素的影响而产生变差;前者由大量微小的偶然因素叠加而成,后者则是由可辨识的、作变差;前者由大量微小的偶然因素叠加而成,后者则是由可辨识的、作用明显的原因所引起,经采取适当措施可以发现和排除。用明显的原因所引起,经采取适当措施可以发现和排除。n当一生产过程仅受随机因素的影响,从而产品的质量特征的平均值和变当一生产过程仅受随机因素的影响,从而产品的质量特征的平均值和变差都基本保持稳定时差都基本保持稳定时, ,称之为处于控制状态。此时称之为处于控制状态。此时, ,产品的质量特征是服产品的质量特征是服从确定概率分布的随机变量,它的分布从确定概率分布的随机变量,它的分布( (或其中的未知参数或其中的未

61、知参数) )可依据较长可依据较长时期在稳定状态下取得的观测数据用统计方法进行估计。分布确定以后,时期在稳定状态下取得的观测数据用统计方法进行估计。分布确定以后,质量特征的数学模型随之确定。为检验其后的生产过程是否也处于控制质量特征的数学模型随之确定。为检验其后的生产过程是否也处于控制状态,就需要检验上述质量特征是否符合这种数学模型。状态,就需要检验上述质量特征是否符合这种数学模型。n 为此,每隔一定时间,在生产线上抽取一个大小固定的样本,计算为此,每隔一定时间,在生产线上抽取一个大小固定的样本,计算其质量特征,若其数值符合这种数学模型,就认为生产过程正常,否则,其质量特征,若其数值符合这种数学

62、模型,就认为生产过程正常,否则,就认为生产中出现某种系统性变化,或者说过程失去控制。这时,就需就认为生产中出现某种系统性变化,或者说过程失去控制。这时,就需要考虑采取包括停产检查在内的各种措施,以期查明原因并将其排除,要考虑采取包括停产检查在内的各种措施,以期查明原因并将其排除,以恢复正常生产,不使失控状态延续而发展下去。以恢复正常生产,不使失控状态延续而发展下去。 通常应用最广的控制通常应用最广的控制图是图是W.A.W.A.休哈特在休哈特在19251925年提出的,一般称之为休哈特控制图。年提出的,一般称之为休哈特控制图。61n、田口方法的特点、田口方法的特点n(1)“源流”管理理论。田口方

63、法认为,开发设计阶段是保证产品质量的源流,是上游,制造和检验阶段是下游。在质量管理中,“抓好上游管理,下游管理就很容易”,若设计质量水平上不去,生产制造中就很难造出高质量的产品。n(2)产品开发的三次设计法。产品开发设计(包括生产工艺设计)可以分为三个阶段进行,即系统设计、参数设计、容差设计。参数设计是核心,传统的多数设计是先追求目标值,通过筛选元器件来减少波动,这样做的结果是,尽管都是一级品的器件,但整机由于参数搭配不佳而性能不稳定。田口方法则先追求产品的稳定性,强调为了使产品对各种非控制因素不敏感可以使用低级品元件通过分析质量特性与元部件之间的非线性关系(交互作用)找出使稳定性达到最佳水平

64、的组合。产品的三次设计方法能从根本上解决内外干扰引起的质量波动问题,利用三次设计这一有效工具,设计出的产品质量好、价格便宜、性能稳定。 62n(3)质量与成本的平衡性。引入质量损失函数这个工具使工程技术人员可以从技术和经济两个方面分析产品的设计、制造、使用、报废等过程,使产品在整个寿命周期内社会总损失最小。在产品设计中,采用容差设计技术,使得质量和成本达到平衡,设计和生产出价廉物美的产品,提高产品的竞争力。 n(4)新颖、实用的正交试验设计技术。使用综合误差因素法、动态特性设计等先进技术,用误差因素模拟各种干扰(如噪声),使得试验设计更具有工程特色,大大提高试验效率,增加试验设计的科学性,其试验设计出的最优结果在加工过程和顾客环境下都达到最优。采用这种技术可大大节约试验费用。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号