统计基础1教材

上传人:我** 文档编号:116127541 上传时间:2019-11-15 格式:PPT 页数:102 大小:1.43MB
返回 下载 相关 举报
统计基础1教材_第1页
第1页 / 共102页
统计基础1教材_第2页
第2页 / 共102页
统计基础1教材_第3页
第3页 / 共102页
统计基础1教材_第4页
第4页 / 共102页
统计基础1教材_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《统计基础1教材》由会员分享,可在线阅读,更多相关《统计基础1教材(102页珍藏版)》请在金锄头文库上搜索。

1、统 计 建 模 统计方法 描述统计推断统计 参数估计假设检验 # 统计方法 一般地说,统计学的研究对象是客观事物 的数量特征和数量关系,以便找到客观事 物中所蕴含的客观规律性。 数量特征:数量水平、数量规模 数量关系:比例、平均数、速度等 # 描述统计 统计学研究如何收集、整理、分析和解释数据收集、整理、分析和解释数据, ,以 便从中作出正确推断的认识方法论科学. 1. 数据搜集:取得数据 2 数据整理: 分类与汇总 3. 数据分析:分析数据 4 数据解释:结果的说明 内容 搜集数据 整理数据 展示数据 描述性分析 目的 描述数据特征 找出数据的基本 规律 0 0 2525 5050 Q1Q1

2、Q2Q2Q3Q3Q4Q4 ¥ x x = 30 = 30 s s 2 2 = 105 = 105 量:是事物属性的重要方面,事物的量和事物的质密切 联系.是客观存在的. 我们要了解事物的质,就要了解事物的量的特征、 量的 界限、量的关系等。 数:量的特征、 量的界限、量的关系等需要数来反映 。如,自然数、相对数、平均数等 # 量 指标: 是说明总体的综合数量特征的概念 和数值。 一个完整的统计指标包括指标名称和指 标数值两个部分。 # 指 标 例: 2002年中国国内生产总值预计达到 102000 多亿元。 时间空间经济概念 数量 计量单位 指标名称 指标的取值 举例说明统计指标的概念 数量指

3、标(总量指标) 指标分类 质量指标 相 对 指 标 平 均 指 标 统计指标的分类 统计指标的分类(1) 数量指标:反映现象总规模、总水平和 工作总量 的统计指标。 如:人口总数、企业总数、工资总额等。 一般用 绝对数表示。 统计指标按其所反映的总体内容的不同,可分为 数量指标与质量指标 质量指标:反映现象相对水平和工作质量好坏 的统计指标。 如:平均成绩、劳动生产率、出生率等。一般 用平均数或相对数表示。 相对指标有:结构相对指标、比例相对 指标、比较相对指标、强度相对指标、 计划完成程度相对指标 平均指标:算数平均数、调和平均数、 几何平均数 另外还有反映数据特征的指标有 离散指标 分布的

4、偏度和峰度指标标 # 数据的显示 分类数据的显示频数分布表 (例题分析) 【例例】一一家市场调查公司家市场调查公司 为研究不同品牌饮料的市场为研究不同品牌饮料的市场 占有率,对随机抽取的一家占有率,对随机抽取的一家 超市进行了调查。调查员在超市进行了调查。调查员在 某天对某天对5050名顾客购买饮料的名顾客购买饮料的 品牌进行了记录,如果一个品牌进行了记录,如果一个 顾客购买某一品牌的饮料,顾客购买某一品牌的饮料, 就将这一饮料的品牌名字记就将这一饮料的品牌名字记 录一次录一次 。右。右边边边边就是就是记录记录记录记录 的的 原始数据原始数据 绿色绿色 健康饮品健康饮品 分类数据的图示条形图

5、用宽度相同的条形的高度或长短来表示各类别 数据的图形 有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条形图, 也可以放在横轴,称为柱形图 分类数据的图示条形图 分类数据的显示饼图 也称圆形图,是用圆形及圆内扇形的角度来表示 数值大小的图形 主要用于表示总体或样本中各组成部分所占的比 例,对于研究结构性问题十分有用 绘制圆形图时,总体中各部分所占的百分比用园 内的各个扇形角度表示,这些扇形的中心角度, 是按各部分数据百分比占3600的相应比例确定的 分类数据的图示饼图 顺序数据的频数分布表 【例例】在一项城在一项城 市住房问题的研市住房问题的研

6、究中,研究人员究中,研究人员 在甲乙两个城市在甲乙两个城市 各抽样调查各抽样调查300300户户 ,其中的一个问,其中的一个问 题是:题是:“您对您您对您 家庭目前的住房家庭目前的住房 状况是否满意?状况是否满意? 1 1非常非常 不满意;不满意;2 2不满不满 意;意;3 3一般;一般;4 4 满意;满意;5 5非常非常 满意。满意。 甲城市家庭对对住房状况评评价的频频数分布 回答类别类别 甲城市 户户数 (户户) 百分比 (%) 向上累积积 向下累积积 户户数 (户户) 百分比 (%) 户户数 (户户) 百分比 (%) 非常不满满 意 不满满意 一般 满满意 非常满满意 24 108 93

7、 45 30 8 36 31 15 10 24 132 225 270 300 8.0 44.0 75.0 90.0 100.0 300 276 168 75 30 100.0 92 56 25 10 合计计300100.0 顺序数据的频数分布表 (例题分析) 乙城市家庭对对住房状况评评价的频频数分布 回答类别类别 乙城市 户户数 (户户) 百分比 (%) 向上累积积 向下累积积 户户数 (户户) 百分比 (%) 户户数 (户户) 百分比 (%) 非常不满满意 不满满意 一般 满满意 非常满满意 21 99 78 64 38 7.0 33.0 26.0 21.3 12.7 21 120 198

8、 262 300 7.0 40.0 66.0 87.3 100.0 300 279 180 102 38 100.0 93.0 60.0 34.0 12.7 合计计300100.0 顺序数据的图示累计频数分布图 24 300 132 225 270 0 100 200 300 400 非常 不满意 不满意 一般 满意 非常 满意 累 积 户 数 (户) (a)向上累积 276 168 30 300 75 0 100 200 300 400 非常 不满意 不满意 一般 满意 非常 满意 累 积 户 数 (户) (b)向上累积 甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频

9、数分布 环形图 环形图中间有一个“空洞”,总体中的每一部分 数据用环中的一段表示 环形图与圆形图类似,但又有区别 圆形图只能显示一个总体各部分所占 的比例 环形图则可以同时绘制多个总体的数 据系列,每一个总体的数据系列为一个环 环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据 环形图 8% 36% 31% 15% 7% 33% 26% 21% 13% 10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价 图表的作用 1.真实、准确地展示和反映数据 2.直观、高效地表达复杂的数据和观点 3.启发思考数据的本质、分析数据揭示的 规律 , 以较小的空间承载较多的

10、信息 A picture is worth a thousand words. 表格 适于呈现较多的精确数值或无明显规 律的复杂分类数据和平行、对比、相关关 系的描述。 表格的基本结构 序号、标题 项目栏 表体 脚注 顶线、栏目线、底线(三线表) (一般没有竖线) 图的种类 线形图:二个变量之间的定量关系(趋势 、连续变化) 条形图:自变量为分类数据 直方图:自变量为定序数据 饼形图: 比例 怎样正确地使用图表怎样正确地使用图表 1. 确定主题-你想表达什么观点? 2. 图表还是文字更有效? 3. 那种图表最适合你的目的? 4. 是否真实、有效地展示了数据? 5. 是否启发读者思考数据的本质和

11、规律? 6. 是否表达了你的观点? 选用哪种图表? 表:侧重数字、描述。适用于很多数据, 但缺乏趋势 图:侧重表现关联、趋势、因果关系等 # 推断统计 内容 参数估计 假设检验 目的 对总体特征 作出推断 样样 本本 总体总体 描述统计与推断统计的关系 反映客观现反映客观现 象的数据象的数据 总体内在的总体内在的 数量规律性数量规律性 推断统计推断统计 (利用样本信息和概率(利用样本信息和概率 论对总体的数量特征进论对总体的数量特征进 行估计和检验等)行估计和检验等) 概率论概率论 (包括分布理论、大数定律(包括分布理论、大数定律 和中心极限定理等)和中心极限定理等) 描述统计描述统计 (统计

12、数据的搜集、整(统计数据的搜集、整 理、显示和分析等)理、显示和分析等) 总体数据总体数据 样本数据样本数据 参数估计 什么是参数估计? 参数是刻画总体某方面的概率特性的数量 当这个数量是未知的时候,从总体抽出一个 样本,用某种方法对这个未知参数进行估计 就是参数估计 例如,X N ( , 2) 点估计区间估计 若, 2未知,通过构造样本的函数,给出它 们的估计值或取值范围就是参数估计的内容 参数估计的类型 点估计 估计未知参数的值; 区间估计 估计未知参数的取值范围,使 得这个范围包含未知参数真值的概率为给定的值 点估计 估计未知参数的值 6.1 点估计 点估计的思想方法 设总体X 的分布函

13、数的形式已知,但它含有 一个或多个未知参数:1,2, ,k 设X1, X2, Xn为总体的一个样本构造k个统计量: 随机变量 当测得一组样本值(x1, x2, xn)时,代入上述统 计量,即可得到 k 个数: 数值 称数为未知参数的估计值, 问题 如何构造统计量? 如何评价估计量的好坏? 对应的统计量为未知参数的估计量 矩法 用样本的 k 阶矩作为总体的 k 阶矩的估 计量,建立含有待估计参数的方程,从而可解出待 估计参数 一般地,不论总体服从什么分布,总体期望 与方差 2存在,则它们的矩估计量分别为: 两种常用的点估计方法(矩法和极大似然法) q 事实上,按矩法原理,令 设待估计的参数为 设

14、总体的r 阶矩存在,记为 设X1, X2, Xn为一样本,样本的 r 阶矩为 令 含未知参数1,2, ,k的方程组 解方程组,得 k 个统计量: 未知参数1,2, ,k 的矩估计量 未知参数1,2, ,k 的矩估计值 代入一组样本值得k个数: 解 例1 解方程组得到a, b的矩估计量分别为 区间估计 估计未知参数的取值范围,使 得这个范围包含未知参数真值的 概率为给定的值 引例 已知 X N ( ,1), 不同样本算得的 的估计值不同, 因此除了给出 的点估计外, 还希望根据 所给的样本确定一个随机区间, 使其包含 参数真值的概率达到指定的要求. 的无偏、有效点估计为 随机变量常数 如引例中,

15、要找一个区间,使其包含 的 真值的概率为0.95. ( 设 n = 5 ) 取 查表得 这说明 即 称随机区间 为未知参数 的置信度为0.95的置信区间. 反复抽取容量为5的样本,都可得 一个区间,此区间不一定包含未知参数 的真值, 而包含真值的区间占95%. 置信区间的意义 若测得 一组样本值, 它可能包含也可能不包含 的真值, 反复 则得一区间(1.86 0.877, 1.86 + 0.877) 抽样得到的区间中有95%包含 的真值. 算得 当置信区间为 时 区间的长度为 达到最短 取 = 0.05 设 为待估参数, 是一给定的数, ( 0 50, 的置信区间 令 Zi = Xi -Yi , i = 1,2, n, 可以将它们看成来 自正态总体 Z N ( 1 2 , 12 + 22) 的样本 仿单个正态总体公式(2) 的置信区间为 (4) 未知, 但 n = m , 的置信区间 取统计量 (5) 方差比的置信区间 ( 1 , 2 未知) 因此, 方差比的置信区间为 取统计量 (6) 方差比的置信区间 ( 1 , 2 已知) 因此, 方差比 的置信区间为 例2 某厂利用两条自动化流水线罐装番 茄酱. 现分别 从两条

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号