应用统计学:经济与管理中的数据分析1

上传人:ji****n 文档编号:47746659 上传时间:2018-07-04 格式:PDF 页数:29 大小:366.87KB
返回 下载 相关 举报
应用统计学:经济与管理中的数据分析1_第1页
第1页 / 共29页
应用统计学:经济与管理中的数据分析1_第2页
第2页 / 共29页
应用统计学:经济与管理中的数据分析1_第3页
第3页 / 共29页
应用统计学:经济与管理中的数据分析1_第4页
第4页 / 共29页
应用统计学:经济与管理中的数据分析1_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《应用统计学:经济与管理中的数据分析1》由会员分享,可在线阅读,更多相关《应用统计学:经济与管理中的数据分析1(29页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章 绪论绪论 统计与统计学统计与统计学 统计数据的计量与类型统计数据的计量与类型 统计分析的基本概念统计分析的基本概念 统计学分科统计学分科 统计学的产生和发展统计学的产生和发展 统计学在经济管理中的应用统计学在经济管理中的应用 1.11.1 统计与统计学统计与统计学 统计的含义统计的含义 学习统计学的意义学习统计学的意义 统计学研究对象的特点统计学研究对象的特点 客观现象内在数量规律性客观现象内在数量规律性 1-3 “Statistics”一词有多种含义: 统计工作数据的收集、整理和分析工作 统计数据统计工作的结果(复数) 统计学分析统计数据的方法和技术(单数) 定义:统计学是关于

2、数据收集、整理、归纳、定义:统计学是关于数据收集、整理、归纳、 分析,并可进而加以推论的方法论科学。分析,并可进而加以推论的方法论科学。 目的:(1)对数据集进行描述; (2)利用样本数据对总体作出推断。 一、统计的含义一、统计的含义 1-4 “管理就是决策”管理就是决策” 西蒙(H. A. Simon) 决策成败的关键就在于能否对系统的状态、规 律有充分的认识和准确的判断。 系统分析与决策的进程: (1)对系统的描述性分析 (2)对系统的解析性分析 (3)对系统的预测性分析 (4) 决策阶段 二、学习统计学的意义二、学习统计学的意义 1-5 统计学的研究对象:客观事物的数量特征和数 量关系。

3、 (1)数量性:)数量性:统计学侧重于对客观现象的数 量的研究。 (2)总体性:)总体性:统计学是研究总体的数量特征 及其分布规律性 。 (3)变异性:)变异性:统计上把总体各单位由于随机 因素引起的某一标志表现的差异称为变异。 三、统计学研究对象的特点三、统计学研究对象的特点 1-6 (1)人口性别比例的研究)人口性别比例的研究 男婴:女婴107:100 (新生) 男婴的死亡率女婴死亡率 青年与中年男性与女性人数基本持平 老年男性死亡率老年女性死亡率 人口在性别上保持大体平衡,保证了人类社会 的进化与发展。 (2)赌博游戏)赌博游戏 (3)医学研究)医学研究 四、客观现象内在数量规律性四、客

4、观现象内在数量规律性 1-7 “抛硬币”试验(均匀硬币)抛硬币”试验(均匀硬币) n=5n=50n=500试验 序号nHfn(H)nHfn(H)nHfn(H)120.4220.442510.502230.6250.502490.498310.2210.422560.512451.0250.502530.506510.2240.482510.502620.4210.422460.492740.8180.362440.488820.4240.482580.516930.6270.542620.5241030.6310.622470.4940.61-8 必然性(总体):必然性(总体):客观事物的内在

5、本质原因决 定的,比较稳定的,有规律可循。 偶然性(个体):偶然性(个体):客观事物的非本质原因决定 的,使事物的表现形式(随机性)与必然性 (规律性)发生偏移,形成了数据的千差万别。 统计研究的目的:统计研究的目的: 通过多次观察和重复试验,利用统计方法可以 揭示偶然性后面的必然性,发现研究系统的数 量规律性。 大数定理方法论(大数定理方法论(law of large number):): 大量随机现象的平均结果具有稳定性的法则。 1.21.2 统计数据的计量与类型统计数据的计量与类型 统计数据的计量尺度统计数据的计量尺度 统计数据的类型统计数据的类型 1-10 低级低级 高级高级 粗略粗略

6、 精确精确 定类尺度定类尺度 (nominal scale) 定序尺度定序尺度 (ordinal scale) 定距尺度定距尺度 (interval scale) 定比尺度定比尺度 (ration scale) 定定 性性 数数 据据 定定 量量 数数 据据 一、统计数据的计量尺度一、统计数据的计量尺度 1-11 样本 号身高 cm年 龄性 别籍 贯喜好 颜色体 质 No116621女北京红好 No216820女山东蓝中 No317321男江苏绿好 No417519男浙江黄差 No516920男上海紫中 N学生基本情况统计表学生基本情况统计表 定类尺度定类尺度 定序尺度定序尺度 定比尺度定比尺

7、度 1-12 统计 数据 类型 按计量 尺度 按收集 方法 按时间 状况 分类 数据 顺序 数据 数值型 数据 观测 数据 实验 数据 截面 数据 时间序 列数据 定性数据定性数据 品质数据品质数据 定量定量 数据数据 二、统计数据的类型二、统计数据的类型 1.31.3 统计分析的基本概念统计分析的基本概念 总体与样本总体与样本 总体参数与样本统计量总体参数与样本统计量 变量变量 1-14 1、总体(、总体(population) 研究对象的全体。研究对象的全体。 注意:统计学中的总体是一组测量值。 个体:个体:组成总体的每一单元,也称为总体单位。 总体容量总体容量(population si

8、ze):总体中所包含的全部 单位数,通常用N 表示。 2、样本(、样本(sample) 总体的一个数据子集。总体的一个数据子集。 样本容量样本容量(sample size):样本中包含的总体单位 个数,通常用n表示。 大样本 n30;小样本 n30。 一、总体与样本一、总体与样本 1-15 1、总体参数(、总体参数(population parameter) 用来描述总体特征的概括性数字量度。 2、样本统计量(、样本统计量(sample statistics) 用来描述样本特征的概括性数字量度。 总体参数总体参数 (未知的常数)(未知的常数) 2p2sxp 样本统计量样本统计量 (已知的随机变

9、量)(已知的随机变量) 估计估计 二、总体参数与样本统计量二、总体参数与样本统计量 1-16 调查问题:调查问题: 在奥运会期间,首都全体居民中比平时增加了收 看电视(收听广播)时间的居民所占的比例p1? 增加收视(收听)时间原因为“对奥运会报道特 别感兴趣”的比例p2? 抽取1220位居民,有1028名“在奥运会期间,比平时 增加了收看电视(收听广播)时间”,其中又有668 名是因为“对奥运会报道特别感兴趣”而增加的。 区片(乡)居民点居民 问题: 描述总体与样本; 总体参数与样本统计量是什么? 对总体所作的推断。 %)%(p%)%.(p.p .p 365338465001028668843

10、01220102821211-17 变量:变量:说明现象某种特征的概念,其特点是从 一次观察到另一次观察会呈现出差别。 变量值变量值:变量的取值。 (1)非数值型变量)非数值型变量 分类变量(categorical variable) 顺序变量(rank variable) (2)数值型变量)数值型变量 离散型变量(discrete variable) 连续型变量(continuous variable) 二、变量(二、变量(Variable) 1.41.4 统计学分科统计学分科 描述性统计与推断性统计描述性统计与推断性统计 理论统计学与应用统计学理论统计学与应用统计学 1-19 1、描述统计

11、学(、描述统计学( descriptive statistics ) 研究数据的搜集、整理和描述的统计学分支。 2、推断统计学(、推断统计学( inferential statistics ) 研究如何根据样本数据对总体进行推断的统计 学分支。 当采用了正确的抽样方法,推断性统计学还能 为所做的推断提供某种可靠性量度(以概率形 式表述)。 包括:参数估计、假设检验、方差分析等 一、描述统计与推断统计一、描述统计与推断统计 1-20 反映客观反映客观 现象的数据现象的数据 总体内在的总体内在的 数量规律性数量规律性 概率论概率论 描述描述 统计统计 推断推断 统计统计 样本数据样本数据 总体数据

12、总体数据 分布理论分布理论 大数定律大数定律 中心极限定理中心极限定理 实验设计法实验设计法 大量观察法大量观察法 1-21 软饮料购买次数频数分布表编号软饮料频数频率1Coke Classic1938%2Diet Coke816%3Dr.Pepper510%4Pepsi-Cola1224%5Sprite612%合 计50100%例:例:50次购买软饮料的次购买软饮料的 样本数据(略)样本数据(略) 问题:最受欢迎的软饮问题:最受欢迎的软饮 料是什么?料是什么? 软饮料购买频率饼图38.0%16.0%10.0%24.0%12.0%Coke Classic Diet Coke Dr.Pepper

13、 Pepsi-Cola Sprite软饮料购买次数条形图19851260246810121416182012345品牌代号频数定性定性代码代码 1-22 例:例:某电子公司的产品设计小组开发了一种新 型灯泡灯丝,要测试新灯泡的平均寿命。 选择一个包含50个新灯丝灯泡的样本,希望利 用样本数据对所有灯泡总体的使用寿命平均值 进行推断。 50只灯泡的耐用时数数据如下:(单位:小时)只灯泡的耐用时数数据如下:(单位:小时) 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866

14、905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 853 981 916 818 946 926 895 967 920 978 821 924 798 850 1-23 统计学家可能声明新灯泡总体平均寿命为 925.42小时,误差为22小时。统计学家也可 以声明他有95%把握确信从900.7小时到944.7 小时的区间包含总体平均寿命值。 组号组限区间 组中值频数频率 (1)(2)(3)(4)(5) 1750-80077512.0% 2800-85082548.0% 3850-9008751224.0% 4900-95

15、09251836.0% 5950-1000975816.0% 61000-1050102548.0% 71050-1100107512.0% 81100-1150112524.0% 合计50100.0%2.0%8.0%24.0%36.0%16.0%8.0%2.0%4.0%0%5%10%15%20%25%30%35%40%750- 800800- 850850- 900900- 950950- 10001000- 10501050- 11001100- 1150耐用时数组限(小时)比率211925.42,()(1)71.618nnii iixxnsxxn1-24 1、理论统计学(、理论统计学( theoretical statistics ) 着重于阐述

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号