a中级统计分析工具

上传人:飞*** 文档编号:50738254 上传时间:2018-08-10 格式:PPT 页数:84 大小:2.29MB
返回 下载 相关 举报
a中级统计分析工具_第1页
第1页 / 共84页
a中级统计分析工具_第2页
第2页 / 共84页
a中级统计分析工具_第3页
第3页 / 共84页
a中级统计分析工具_第4页
第4页 / 共84页
a中级统计分析工具_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《a中级统计分析工具》由会员分享,可在线阅读,更多相关《a中级统计分析工具(84页珍藏版)》请在金锄头文库上搜索。

1、中 级 统 计 分 析 Senior Process Statistical Analysis统 计 过 程 分 析基 础 知 识 数据统计分析目的和作用 数据63 60 64 62 63 64 63 62 66 64 60 62 61 65 62 63 66 63 67 64 63 62 65 63 65 61 62 64 63 61平均值:63.1 最大值:67 最小值:60 样本数:30数据的分类和特点 压力泵的一组读数(Mpa): 200,215.3,211.5,218.2,220 产品表面刮伤数(处): 1,5,3,6,8,101)连续的读数,不一定是整数,一般需要专用 的量具、仪器

2、进行测量后读数计量性的数 据2)不连续的数据,自然数,一般通过计数得到 ,不一定需要专用的量具、仪器来测量计 数性的数据ONOFF统计分析的关键参数?中级统计分析中的关键参数 计量性数据 度量分布位置的参数 均值 中位数 众数 度量离散程度的参数 标准差 极 差 计数性数据 度量分布中的比例 度量分布中的比率中级统计分析技术应用数据类型单样本双样本成对样本多个样本 可视化工具圆点图箱式图散布图 圆点图等值线Tukey 均值多变量 散点图直方图箱式图差异分析圆点图茎叶图箱式图位置检验(正态假设) 单样本t检验双样本 t 检验成对样本t 检验方差分析ANOVA位置检验(无分布假 设) Fisher

3、检验Tukey 末数检验Fisher检验Kruskal-Wallis检验Wilcoxon检验Kruskal-Wallis检验Wilcoxon检验变异检验 单样本2检验 F检验 Bartlett (正态)Levene (无分布假设)比例检验 单样本 比例双样本 比例检验或相关 P控制图+置信区间比率检验柏松比率检验U控制图+置信区间可 视 化 工 具Visualize Tools计量性数据的分布可视化 圆点图: 检查并比较分布 箱式图: 检查并比较分布 比较变量的汇总或单个值 直方图 检查并比较分布 茎叶图 检查并比较分布圆点图 使用点图估计数据的形状和中心趋势。点图与直方图 类似,分为多个区间

4、。但是,具有少量数据时,点图 可能比直方图更有用,原因在于: 一般情况下,点图比直方图包含的区间更多。 每个点都表示单独的观测值(或者少量观测值)。 点图对于比较数据组也非常有用。点图-单变量 示例您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。 如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧 ,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一 个点图来评估数据并确定样本与目标值 18 的接近程度。解释结果 大多数瓶盖紧固时的扭矩在 14 到 24 之间。只有 1 个瓶盖很松,扭矩小于 11。但是,分布呈正向偏斜 ,有些瓶盖拧

5、得过紧。许多瓶盖需要大于 24 的扭矩才能打开,5 个瓶盖的扭矩大于 33,这几乎是目标值的两倍。点图-多变量 示例您的公司在 2 台机器上生产塑料管件,您想检验管件直径的一致性。 您要测量 2 台机器在 3 周内生产的管件,每周各测量 10 个管件。创 建一个内部含组(按机器分组每个星期的符号)的点图来检验分布情 况。 解释结果 机器 2 生产的管件的直径在各周似乎都比较稳定。但是,机器 1 生产的管件的直 径变异性每周都在增加: 第 1 个星期的直径范围约为 4.3 到 5.2 第 2 个星期的直径范围约为 5.0 到 7.0 第 3 个星期的直径范围约为 4.9 到 8.8箱图四分位数

6、四分位数是将数据样本分成四个相等部分的值。利用四分位 数,可以快速评估数据集的展开和中心趋势 这是了解数据 的重要前期步骤。 下四分位数 (Q1)25% 的数据小于等于此值。 第二个四分位数 (Q2)中位数。 50% 的数据小于等于此值。 上四分位数 (Q3)75% 的数据小于等于此值。 四分位间距下四分位数与上四分位数之间的距离 (Q3-Q1);因 此,它跨越数据中间部分,即 50%。Q1: 计算k=(n+1)/4,如果结果是整数,那么Q1=Xk,否则Q1=1/2(XINT(k)-1+XINT(k)+1)。Q2: 计算k=2(n+1)/4,如果结果是整数,那么Q2=Xk,否则Q2=1/2(X

7、INT(k)-1+XINT(k)+1)。Q3:计算k=3(n+1)/4,如果结果是整数,那么Q3=Xk,否则Q3=1/2(XINT(k)-1+XINT(k)+1)。IQR: Q3-Q1例如,对于以下数据: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 求:Q1,Q2, Q3, IQR。结果如下:Q1 = 14.25 Q2(中位数)= 42 Q3 = 46.50 四分位间距 = 46.50 - 14.25,或 32.25箱图 箱线图(也称为方框须线图)可用来评估和比较样本分布 。25%25%25%25%最大值:Q3 + 1.5 (Q3 - Q1) 最小值:Q1- 1

8、.5 (Q3 - Q1)Q3:3rd四分位数 Q2:中位数:2nd 四分为数Q1:1st 四分位数异常点:箱图两边的胡须长度不 能够超过1.5(Q3-Q1),超过着两 根胡须的观察值使用不同的符号 表示箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样本放在四所住宅 内,然后测量 60 天后的耐用性。创建一个箱线图来检验耐用性得 分的分布情况。该箱线图显示: 耐用性得分的中位数为 12.95 四分位数间距为 10.575 到 17.24。 没有出现异常值。 间距为 7.03 到 22.5。 中位数上方较长的上部须线 和较大的方框表明数据略呈 正偏斜分布 - 分布的右尾长于 左尾箱图示

9、例-多变量绘制前面点图中所用多变量的例子。您的公司2台设备都生产塑料管件,您很关心直径的一致性问题。 您要测量每台机器在 3 周内生产的管件,每周各测量 10 个管件。 创建一个箱线图来检验分布情况。 直方图-示例与观察用于检查样本数据的形状和分布情况。直方图将样本值划分为许多称为区间 的间隔。条形表示落于每个区 间内的观测值的数量(频率)。 示例:您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如 果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消 费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个 直方图来评估数据并确定样本与

10、目标值 18 的接近程度。直 方 图 常见的直方图型态常见的直方图型态 正常型说明:中间高,两边低,有集中趋势.结论:左右对称分配(常态分配),显示制程在正常 运转直 方 图缺齿型(凹凸不平型)说明 :高低不一,有缺齿情形。不正常的分配,系因 测定值或换算方法有偏差,次数分配不当所形成。结论: :稽查员对测定值有偏好现象,如对5、10之数 字偏好;或是假造数据。测量仪器不精密或组数的宽 度不是倍数时亦有此情况直 方 图切边型(断裂型) 说明:有一端被切断结论:原因为数据经过全检过,或制程本身有经过 全检过,会出现的形状。若剔除某规格以上时,则 切边在靠近右边形成直 方 图离岛型说明:在右端或左

11、端形成小岛. 结论: 测定有错误,工程调节错误或使用不同原料所 引起。一定有异常原因存在,只在去除,即可合乎 制和要求,制出合规格的制品直 方 图高原型说明:形状似高原状。结论: 不同平均值的分配混在一起,应层别 之后再做直方图比较直 方 图双峰型说明:有两个高峰出现.结论: 有两种分配相混合,例如两部机器或两家不同 供应商,有差异时,会出现此种形状,因测定值受 不同的原因影响,应予层别后再作直方图直 方 图偏态型(偏态分配) 说 明: 高处偏向一边,另一边低,拖长尾巴。可分偏右 边,偏左边偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形 状.偏左边:例如,成分含有高纯度的

12、含有率等,不能取到某值以上的值时,就会 出现的形状.结 论:尾巴拖长时,应检讨是否在技术上能够接受,工具磨损或松动时,亦 有此种现象发生. 茎叶图-基础 该图类似于直方图,只不过它不是使用条 形而是使用实际数据值的数字来表示每个 区间(行)的频率 比直方图更简单,不用计算 可以对数据进行重新组织,直方图不可 不用电脑可手工直接进行绘制 快速可视化 将数据4 5 5 16 6 756茎叶图-示例 55 45 49 66 53 41 58 56 60 63 4 591 5 5386 6 603作业题 如果数字为小数怎么做法呢? 601.4 601.6 598.0 601.4 599.4 600.0

13、 600.2 601.2 598.4 599.0 601.2 601.0 600.8 597.6 601.6 599.4 601.2 598.4 599.2 598.8茎叶图显示: EX. 茎叶图 EX. N = 20 叶单位 = 0.101 597 64 598 0445 598 89 599 02449 599 (2) 600 029 600 88 601 0222442 601 66变量 平均值 最小值 中位数 最大值 EX. 599.99 597.60 600.10 601.60散布图 用于通过相对于一个变量绘制另一个变量来图示说 明两个变量之间的关系。 散点图也可用于绘制随时间变化的

14、变量。 简单形式分组 (两组数据)简单+拟合分组+拟合散布图-简单 示例No.12345678910X261014182226303438Y481216202428323640散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满足顾客的需要。市场 调查显示,如果两次放电之间等待的时间超过 5.25 秒,顾客就会变 得很不耐烦。您收集了分别使用过不同时间的电池的一个样本,并在每个电池放电 后立即测量了其剩余电压(放电后电压),还测量了各电池再次放电 之前必须等待的时间(放电恢复时间)。创建一个散点图来检查结果 。在 5.25 秒的临界放电恢复时间处包括一条参考线。计数型数据的分布可视化

15、条形图 饼图条形图 用于比较数据类别的某种度量。每个条形都可以表示某个 类别的计数、某个类别的函数(如平均值、合计或标准差 )或某个表格中的汇总值。 颜色密度 蓝色高红色低 红色低 蓝色高 红色高 红色低 蓝色低条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门板因喷 漆瑕疵而被拒收。您怀疑时间段与瑕疵类型之间存在一定的关系。创 建一个条形图以确定每种喷漆瑕疵的门板拒收数,并按时间段聚类。 选择递减顺序以查看按从最大到最小排列的最外层类别。饼图 用于显示每个数据类别相对于整个数据集的比率 。 简 单 假 设 检 验 分 析Basic Hypothesis Test Analysis假设检验基础知识 原材料改变前后产品参数是否一致? 过程参数改变前后产品质量是否有变化? 缺陷分类和比例是否随着某些因素而存在差异? 同样的产品不同的生产线生产,只见是否有差异 ? 几条生产线不同的生产班次的产品之间有无变异 ? 假 设 检 验假设检验的流程定义检验目标 声明原假设:H0 VS HA选择风险、和 样本量n收集数据并 检验假设检验统计和置信区间 计算P值P5 或 单侧:H

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号