《精编》描述统计-数据的收集与数字特征描述

上传人:tang****xu3 文档编号:133785640 上传时间:2020-05-30 格式:PPT 页数:69 大小:538KB
返回 下载 相关 举报
《精编》描述统计-数据的收集与数字特征描述_第1页
第1页 / 共69页
《精编》描述统计-数据的收集与数字特征描述_第2页
第2页 / 共69页
《精编》描述统计-数据的收集与数字特征描述_第3页
第3页 / 共69页
《精编》描述统计-数据的收集与数字特征描述_第4页
第4页 / 共69页
《精编》描述统计-数据的收集与数字特征描述_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《《精编》描述统计-数据的收集与数字特征描述》由会员分享,可在线阅读,更多相关《《精编》描述统计-数据的收集与数字特征描述(69页珍藏版)》请在金锄头文库上搜索。

1、第十一章描述统计 概率论是研究随机现象统计规律的学问 它为数理统计奠定了理论基础 所谓数理统计 是以概率论为基础 通过合理地获取随机现象的少量数据资料 估计和检验反映随机现象的某种数字特征 或分析和判断随机现象所具有的统计规律性的学问 数理统计的应用相当广泛 它已成为工业 农业 商业 医药卫生 教育 社会学 经济学 生物学 气象学等各领域必不可少的数学工具和分析方法 因此又被称为统计技术 描述统计是通过图表或数学方法 对数据资料进行整理 分析 并对数据的分布状态 数字特征和随机变量之间关系进行估计和描述的方法 它是统计技术的重要组成部分 并在以后各章的统计推断技术中被应用 11 1数据的收集

2、11 2数字特征描述 估计 11 3分布状态描述 频数直方图 11 4排列图 因果分析图 趋势图 11 1数据的收集 科学研究中 若无定量分析 就不会有明确的概念 也就不易找出科学的规律 质量管理如果不进行定量分析 也就不会有明确的质量概念 就不会有科学的质量管理 因此质量管理是一种以数据为基础的活动 人们必须通过有目的的搜集数据 从中获取有关产品质量或生产状态的正确情报 从而做出正确的判断和决策 更有效地管理生产 一数据及其实质二总体 个体 样本 样品三数据收集的原则四数据的分类 一数据及其实质 数据 在质量管理的各项活动中 记录有关科学试验 质量特征 生产状态及管理现状得到的数字资料统称为

3、数据 实质 收集的数据绝大多数都既具有随机性 偶然性 又具有统计规律性 也就是说它们具有随机现象的某些特征 或者说是随机变量的一组取值 二总体 个体 样本 样品 1总体与个体定义 研究对象的全体 称为总体或母体 组成总体的每个单元称为个体 研究对象的全体 指的是研究对象某个数量指标的全部取值 由于一个数量指标通常就是一个随机变量 因此 总体是指某随机变量的取值的全体 而其中的每个值都是一个个体 例如 工厂生产一批晶体管 共10000件 其直流放大系数是一个随机变量 10000件产品直流放大系数数据的全体称为总体 而其中的一个数据则是一个个体 如果要研究的不是一个 而是几个数量指标 如对一批晶体

4、管不仅要研究其直流放大系数 还有研究集电极 发射电极反向电流时 则要分为几个总体来研究 总体的有限和无限类型随研究的问题而定 对于上述的一批晶体管而言 总体是有限的 但有时根据研究的需要 我们常把相同条件下的生产的所有晶体管看成一个总体 显然 此时 它是一个无限总体 2样本与样品3样本与总体 2样本与样品 定义 从总体中随机抽取的若干个个体的总和称为样本或子样 组成样本的每个个体称为样品 样本中所有的样品的数目称为样本容量或子样大小 样本容量常用符号n代表例 从批量为10 000的一批晶体管中随机抽取20件进行检查 被抽查的20件产品称为样本 而其中每一件产品称为样品 样本大小为20 由于人们

5、通常只获得样本数据 故简称为数据 3样本与总体 人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和分布规律进行推断 估计和检验 自然 由样本推断和估计总体很难做到完全精确和可靠 但是必须采取措施获得比较精确和具有一定可靠性的推断 其措施涉及两方面的问题 即抽取样本的方法和统计推断的方法 当样本的抽取满足下列两个条件时 样本将能很好地反映总体的统计规律性 1 样本容量n足够大 样本容量越大 推断的结论越准确 可靠性越高 2 采用随机抽样 即总体中每个个体被抽到的机会均等 即使一个个体被抽取后 总体的成分不变 换句话说 每个样品的抽取都是一次独立 重复试验 至于应采用的统计推断方法将在以后

6、各章讨论 样本与总体的关系 个体具有随机性总体具有统计规律性 总体 样本 样本随机性样本具有统计规律性 条件 抽样方法正确 n足够大 随机抽取 统计推断方法正确 结果 样本的统计规律性在一定程度上反映总体的统计规律性 决定 三数据收集的原则 数据的收集是一项重要的基础工作 为了给质量管理工作提供可靠的准确的情报 搜集数据时 必须遵循以下原则1随机抽样2数据的分层3明确数据收集的目的和方法4作好数据记录 保证数据真实 可靠 准确 1随机抽样 定义 是指从总体抽取样品时 使每个个体被抽到的机会均等以使所抽取的样本数据能够很好地代表总体的抽样方法 方法 鉴于实际情况产品的大小 形状 存取状态等方面的

7、差异及条件限制 常用的随机抽样方法为 1 简单随机抽样法 单纯随机抽样 抽签法 或掷骰子法 随机数表法 2 分层随机抽样 3 系统随机抽样 4 多级随机抽样 随机数表法 1 定义 用随机数表查出样本号码的方法 2 步骤 随机决定所用数表页码 瞎子点点法或掷骰子法 决定起点 瞎子点点法 查样本号数 N 10 查一位数字即可 取到n个样品为止 重复的数字取消 11 n 100 查两位数字 大于n的以n除之取余数 重复数字去掉 n 100 向下取三位 大于n的以n除之取余数 重复数字去掉 3 例 从批量N 50的产品中抽n 4的样本采用掷骰子采用掷骰子法确定选随机数表 I 用瞎子点点法确定起点为11

8、行第1列 随机号码为18 18 07 92 45 44 取18 7 42 45 分层随机抽样 定义 将总体按产品的某些特征把整批产品划分为若干层 即小批 即分为层 同一层内的产品质量尽可能均匀一致 在各层内分别用简单随机抽样法抽取一定数量的个体组成一个样本的方法 分层按比例随机抽样 若按各层在整批中所占比例分别在各层内抽取就称为分层按比例随机抽样 例 某批产品批量为N 1600 由A B C三条生产线加工而成 NA 800 NB 640 NC 160 取n 150的样本 解 系统随机抽样法 间隔随机抽样 定义 当批中产品可以按某个次序排列时 给批中每个产品编号1 N 以整数部分为抽样间隔 用简

9、单随机抽样法在1至之间随机抽取的一个整数作为第一个单位产品号码 每隔个产品抽取一个 直到抽出n个样本为止 例 某工序每天生产200件产品 规定巡检员在一天中抽取n 10的样本进行检查 试用系统随机抽样确定抽取的样本号码解 第一个样品号码用抽签法确定为13 则被抽取的样品号码为13 33 53 193 多级随机抽样法 定义 整批产品由许多群组成 每群又分若干组组成 以前三种方法任一种抽取一定数量的群 该群的单位产品组成样本 称为整群抽样法或一级随机抽样法 若在各群中按随机抽样法抽取若干组组成样本 称为二阶段或二级随机抽样 例 某产品批N 20000 分为200箱 每箱100个 分为4盒 每盒25

10、个 抽取n 100的样本解 从200箱中随机抽取1箱 作为样本为整群随机抽样 从200箱中随机抽取4箱 每箱中随机抽取1盒作为样本称为二级随机抽样 从200箱中随机抽取10箱 每箱中随机抽取2盒 每盒中随机抽取5个作为样本 称为三级随机抽样 2数据的分层 定义 所谓数据的分层就是将收集来的样本数据根据不同的使用目的和要求 按其性质 来源 影响因素等对其进行分类的方法 它是分析产品质量问题产生原因的有效方法 注意事项 1 数据的分层与数据收集目的紧密联系 目的不同 分层的方法与粗细也不同 2 分层的粗细与对生产过程了解的程度有关 3 分层是一项细致的工作 分层不当 将会造成问题原因不清的后果 分

11、层原则 操作人员 工艺装备 加工方法 时间 材料 环境 其他 例1例2 例1 在磨床上加工某零件外圆 由甲乙两工人操作各磨100个零件 其产生废品45件 试分析废品产生的原因 若只对工人 不对不合格原因进行分层 两工人的废品率相差无几 找不出重点 若只对不合格原因 不对工人进行分层 则会得到主要因素为锥度不合格 碰伤两原因 对工人及不合格原因分层后 甲工人主要因素为碰伤 乙工人主要因素为锥度不合格 例2 在某产品装配过程中 经常发现齿轮箱盖漏油的现象 为解决该问题 对该工艺进行了现场调查 收集数据n 50 漏油数f 19 试用分层法找出影响产品质量的原因1通过分析 造成漏油的原因有两个 1 齿

12、轮箱密封垫是由甲 乙两厂分别供给的 2 涂粘结剂的工人A B C操作方法不同2为分析问题原因 采用分层法分别对操作者和齿轮箱垫供货单位分层3措施 采用乙厂的齿轮箱垫 工人B的操作方法4效果 漏油率不但未降低 反而增加了5再次分析原因 只是单纯地分别考虑不同工人 不同供应厂造成的漏油情况 而没有进一步考虑不同工人用不同供应厂提供的齿轮箱垫造成的漏油情况 即由于没进行更细致的综合分析造成的 作综合分层结论 使用甲厂齿轮箱垫时B的操作方法好使用乙厂的齿轮箱垫时A的操作方法好采用措施后漏油率大大降低 操作者分层表 齿轮箱垫供货单位分层表 综合分层表 供货厂 操作者 3明确数据收集的目的及方法 目的通常

13、有下列几种 1 为掌握生产现状收集数据 2 为分析问题收集数据 3 为判定产品质量合格与否收集数据 4 为控制生产状态收集数据 5 为掌握与调节工艺状态收集数据 目的不同 收集的方法 数量 时间 地点 取样方式 测试方法 精确度以及定性质量指标数量化的方法及标准等 不同 4作好数据记录 保证数据真实 可信 准确 1 为避免数据遗漏 在收集的同时进行数据整理和简单的分层 应尽量使用预先设计的数据记录表格 调查表 调查表是为了掌握生产和试验现场情况 根据分层的思想设计出的数据及不合格记录表格 是收集数据并对数据进行粗略整理的有效工具 根据使用目的 使用场合 使用对象以及使用范围不同 调查表的形式

14、内容也多种多样 在实际中可以灵活设计和应用 2 注意记录与数据有关的数据背景 如测试时间 地点 数量 测试者 零件号 批号 名称规格及必要的环境条件等 有利于分析问题 且可以避免不同条件的数据混淆 3 数据必须真实 可靠 准确 不良项目调查表 部位 缺陷项目 缺陷位置调查表 机翼划伤位置记录表 单位 车间 工段 日期 年月日 操作者 填号者 严重划伤 轻划伤 0 压坑 四数据的分类 不同的样本数据来源于不同的总体 即是不同的随机变量的一组 某些 取值 不同的随机变量有不同的统计规律 因此在进行数据分析前必须分清数据的类型1计量值数据 可以连续数值的数据如长度 温度 硬度 强度 化学成分 时间它

15、是连续型随机变量的一组取值具有连续型随机变量的分布特征2计数值数据 是对单位产品或产品上的缺陷进行检查时得到正整数数据如不合格品数 出勤人员 疵点数等注意 表示百分率的数据 如出勤率 不合格品率 退修率等 其类型取决于其分子数据的类型分类 1 计件值数据 对产品按件检查时得到的数据 如批产品中的不合格品数 2 计点值数据 检查单件产品上质量缺陷时得到的数据如单位棉织品上的疵点数 铸件上的砂眼数 收音机底版焊点数等 3顺序值数据 为了把定性指标定量化 按某种标准进行评分以比较优势程序 确定评定等级或类别得到的数据 11 2数字特征描述 估计 一统计量二样本平均值三众数四中位数五极差六样本方差七样

16、本均方差 一统计量 描述样本数据统计性质的度量值称为统计特征量 简称统计量 统计量是随机变量X数字特征的估计值统计量的数值大小是由收集的样本数据决定的 统计量是样本数据的函数 但其中不包含未知的参数 如果说 在一个函数中 既包括样本数据 又有未知参数 那么这个函数就不能称为统计量 鉴于样本抽取的随机性 作为样本的函数 统计量也是一个随机变量 统计量的分布是由X的分布决定的常用统计量有样本平均值 中位数 众数 极差R 方差S2 均方差S等 二样本平均值 1概念从总体中随机抽取大小为n的样本 其数据分别为x1 x2 xn 则其样本平均值记为样本平均值是总体X数学期望 的估计值若样本数据的种类数为k 第j种数据的数值为xj xj出现的频数为fj 此时可用下式计算 例12性质 例1 从某工序加工的一批零件中随机抽取样本大小为12的数据 其尺寸分别为 25 5 25 8 25 9 25 7 25 8 25 6 25 9 25 8 25 8 25 6 25 9 25 8 试估计该批零件的均值 解 或 2性质 是一个随机变量 若总体的数学期望为 方差为 2 则随机变量的数学期望和方差分别为 可以看出

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号