中级统计分析工具

上传人:蜀歌 文档编号:146800876 上传时间:2020-10-04 格式:PDF 页数:84 大小:1.32MB
返回 下载 相关 举报
中级统计分析工具_第1页
第1页 / 共84页
中级统计分析工具_第2页
第2页 / 共84页
中级统计分析工具_第3页
第3页 / 共84页
中级统计分析工具_第4页
第4页 / 共84页
中级统计分析工具_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《中级统计分析工具》由会员分享,可在线阅读,更多相关《中级统计分析工具(84页珍藏版)》请在金锄头文库上搜索。

1、中中 级级 统统 计计 分分 析析中中 级级 统统 计计 分分 析析 Senior Process Statistical Analysis 统统 计计 过过 程程 分分 析析统统 计计 过过 程程 分分 析析 基基知知基基 础础 知知 识识 数据统计分析目的和作用 63 60 64 62 63 64 数据 63 60 64 62 63 64 63 62 66 64 60 62 61 65 62 63 66 63 9 均值63 1 数据直方图数据直方图 正态性拟合 9 数据直方图数据直方图 67 64 63 62 65 63 65 61 62 64 63 61 8 7 均值63.1 标准差1.

2、729 N30 8 7 6 平均值:63.1 最大值67 6 5 频频率率 6 5 4 频率频率 最大值:67 最小值:60 样本数:30 4 3 频频 3 2 1 样本数:30 2 1 6766656463626160 0 数据数据 66646260 0 数据数据 数据的分类和特点 压力泵的一组读数(Mpa): 1)连续的读数,不一定是整数,一般需要专用 的量具、仪器进行测量后读数计量性的数 压力泵的组读数(Mpa): 200,215.3,211.5,218.2,220 据 产品表面刮伤数(处) 产品表面刮伤数(处): 1,5,3,6,8,101,5,3,6,8,10 2)不连续的数据,自然

3、数,一般通过计数得到 ,不一定需要专用的量具、仪器来测量计 数性的数据 ON OFF 数性的数据 统计分析的关键参数 ? 中级统计分析中的关键参数 计量性数据 度量分布位置的参数 计数性数据 度量分布中的比例 度量分布位置的参数 均值 度量分布中的比例 中位数 众数 度量离散程度的参数 度量分布中的比率 标准差 极 差 中级统计分析技术应用 数据类型 单样本双样本成对样本多个样本 数据类型 单样本双样本成对样本多个样本 圆点图 箱式 散布图 点 等值线 均值 多变量 散点 可视化工具可视化工具 箱式图圆点图Tukey 均值散点图 直方图箱式图差异分析圆点图 茎叶图箱式图茎叶图箱式图 位置检验位

4、置检验(正态假设正态假设) 单样本t检验双样本 t 检验成对样本t 检验方差分析ANOVA Fi h 检验T k末数检验Fi h 检验 位置检验位置检验(无分布假 设 无分布假 设) Fisher检验Tukey 末数检验Fisher检验 Kruskal-Wallis检验 Wilcoxon检验Kruskal-Wallis检验Wilcoxon检验 Bl(正态) 变异检验变异检验单样本2检验F检验 Bartlett (正态) Levene (无分布假设) 比例检验比例检验 单样本 比例 双样本 比例检验或相关 P控制图+置信区间比例检验比例检验 比例比例检验或相关 P控制图+置信区间 比率检验比率检

5、验柏松比率检验U控制图+置信区间 可可 视视 化化 工工 具具可可 视视 化化 工工 具具 Visualize Tools 计量性数据的分布可视化 点 圆点图: 检查并比较分布 箱式图: 检查并比较分布 检查并比较分布 比较变量的汇总或单个值 直方图 检查并比较分布 茎叶图 检查并比较分布 圆点图 使用点图估计数据的形状和中心趋势。点图与直方图 类似,分为多个区间。但是,具有少量数据时,点图 能比直方图更有用原在可能比直方图更有用,原因在于: 一般情况下,点图比直方图包含的区间更多。 每个点都表示单独的观测值(或者少量观测值)。 点图对于比较数据组也非常有用 点图对于比较数据组也非常有用。 点

6、图-单变量 示例 您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。 如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧, 消费者可能很难打开(尤其是在洗浴过程中)。 圆点图圆点图 洗发水瓶盖扭力 消费者可能很难打开(尤其是在洗浴过程中)。 您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一 个点图来评估数据并确定样本与目标值 18 的接近程度。 解释结果解释结果 大多数瓶盖紧固时的扭矩在 14 到 24 之间。只有 1 个瓶盖很松,扭矩小于 11。但是,分布呈正向偏斜 ,有些瓶盖拧得过紧。许多瓶盖需要大于 24 个点图来评估数据并确定样本与目标值 18 的接近程度。 的扭矩

7、才能打开,5 个瓶盖的扭矩大于 33,这几乎是目标值的两倍。 36322824201612 扭扭矩矩扭扭矩矩 点图-多变量 示例 解释结果解释结果 您的公司在 2 台机器上生产塑料管件,您想检验管件直径的一致性。 您要测量 2 台机器在 3 周内生产的管件,每周各测量 10 个管件。创 建一个内部含组(按机器分组每个星期的符号)的点图来检验分布情 解释结果解释结果 机器 2 生产的管件的直径在各周似乎都比较稳定。但是,机器 1 生产的管件的直 径变异性每周都在增加: 第 1 个星期的直径范围约为 4.3 到 5.2 建个内部含组(按机器分组每个星期的符号)的点图来检验分布情 况。 第 1 个星

8、期的直径范围约为 4.3 到 5.2 第 2 个星期的直径范围约为 5.0 到 7.0 第 3 个星期的直径范围约为 4.9 到 8.8 箱图四分位数四分位数 四分位数是将数据样本分成四个相等部分的值。利用四分位 数,可以快速评估数据集的展开和中心趋势 这是了解数据 的重要前期步 Q1: 计算k=(n+1)/4,如果结果是整数,那么 Q1=Xk,否则 Q1 1/2(XX) 例如,对于以下数据: 7 9 16 36 39 45 45 46 48 51 的重要前期步骤。 下四分位数 (Q1)25% 的数据小于等于此值。 Q1=1/2(XINT(k)-1+XINT(k)+1)。 Q2: 计算k=2(

9、n+1)/4 如果结果是整数那么 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 求: 第二个四分位数 (Q2)中位数。 50% 的数据小于等于此值 Q2: 计算k=2(n+1)/4,如果结果是整数,那么 Q2=Xk,否则 Q2=1/2(XINT(k)-1+XINT(k)+1)。 Q1,Q2, Q3, IQR。 50% 的数据小于等于此值。 上四分位数 (Q3)75% 的数据小于等于此值。 ( INT(k) 1INT(k) 1) Q3:计算k=3(n+1)/4,如果结果是整数,那么 Q3 X否则 结果如下: Q114 2 四分位间距下四分位数与上四分位数之间的距离

10、(Q3-Q1);因 此,它跨越数据中间部分,即 50%。 Q3=Xk,否则 Q3=1/2(XINT(k)-1+XINT(k)+1)。 Q1 = 14.25 Q2(中位数)= 42 Q3 = 46 50 IQR: Q3-Q1 Q3 = 46.50 四分位间距 = 46.50 - 14.25,或 32.25 箱图 箱线图(也称为方框须线图)可用来评估和比较样本分布。 25% 最大值:Q3 + 1.5 (Q3 - Q1) 25% 25% 最() Q3:3rd四分位数 Q2:中位数:2nd四分为数 25% 中位数分为数 Q1:1st四分位数 25% 最小值:Q1- 1.5 (Q3 - Q1) 25%

11、异常点:箱图两边的胡须长度不 能够超过1.5(Q3-Q1),超过着 根胡须的察值使的符两根胡须的观察值使用不同的符 号表示 箱图示例-单变量 您想要检验地毯产品的总体耐用性。地毯产品的样本放在四所住宅 内,然后测量 60 天后的耐用性。创建一个箱线图来检验耐用性得 分的分布情况。 22.5 耐用性 的箱线图耐用性 的箱线图 该箱线图显示: 分的分布情况。 20.0 耐用性得分的中位数为 12.95 17.5 15.0 性性 四分位数间距为 10.575 到 17.24。 没有出现异常值 12.5 耐用耐用性性 没有出现异常值。 间距为 7.03 到 22.5。 10.0 7.5 中位数上方较长

12、的上部须线 和较大的方框表明数据略呈 5.0 正偏斜分布 - 分布的右尾长于 左尾 箱图示例-多变量 绘制前面点图中所用多变量的例子。 您的公司2台设备都生产塑料管件,您很关心直径的一致性问题。 您量每台机在内生产的管件每各量个管件 第 1 个 星 期 , 第 2 个 星 期 , 第 3 个 星 期 的 箱 线 图第 1 个 星 期 , 第 2 个 星 期 , 第 3 个 星 期 的 箱 线 图 您要测量每台机器在 3 周内生产的管件,每周各测量 10 个管件。 创建一个箱线图来检验分布情况。 9 8 7 据据 6 数数据据 5 4 机 器21 第 3 个 星 期第 2 个 星 期第 1 个

13、星 期第 3 个 星 期第 2 个 星 期第 1 个 星 期 4 直方图-示例与观察 用于检查样本数据的形状和分布情况。 直方图将样本值划分为许多称为区间 的间隔。条形表示落于每个区 间内的值的数量频率 14 扭矩 的直方图扭矩 的直方图 间内的观测值的数量(频率)。 12 10 示例: 您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如 10 8 频率频率 果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消 费者可能很难打开(尤其是在洗浴过程中)。 6 4 您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个 直方图来评估数据并确定样本与目标值 18 的接近程度。 2

14、0 36322824201612 扭矩扭矩 直 方 图直 方 图 常见的直方图型态常见的直方图型态常见的直方图型态常见的直方图型态 常见的直方图型态常见的直方图型态常见的直方图型态常见的直方图型态 正常型正常型正常型正常型 说明:中间高,两边低,有集中趋势. 结论:左右对称分配(常态分配),显示制程在正常 运转运转 直 方 图直 方 图 缺齿型缺齿型(凹凸不平型凹凸不平型)缺齿型缺齿型(凹凸不平型凹凸不平型) 说明 :高低不一,有缺齿情形。不正常的分配,系因 测定值或换算方法有偏差次数分配不当所形成测定值或换算方法有偏差,次数分配不当所形成。 结论: :稽查员对测定值有偏好现象,如对5、10之

15、数 字偏好;或是假造数据。测量仪器不精密或组数的宽字偏好;或是假造数据。测量仪器不精密或组数的宽 度不是倍数时亦有此情况 直 方 图直 方 图 切边型切边型(断裂型断裂型)切边型切边型(断裂型断裂型) 说明:有一端被切断说明:有端被切断 结论:原因为数据经过全检过,或制程本身有经过 全检过,会出现的形状。若剔除某规格以上时,则 切边在靠近右边形成 直 方 图直 方 图 离岛型离岛型 说明:在右端或左端形成小岛. 结论 测定有错误程节错误或使用原料所结论: 测定有错误,工程调节错误或使用不同原料所 引起。一定有异常原因存在,只在去除,即可合乎 制和要求,制出合规格的制品 直 方 图直 方 图 高

16、原型高原型 说明 形状似高原状说明:形状似高原状。 结论: 不同平均值的分配混在一起应层别结论: 不同平均值的分配混在一起,应层别 之后再做直方图比较 直 方 图直 方 图 双峰型双峰型双峰型双峰型 说明:有两个高峰出现说明:有两个高峰出现. 结论: 有两种分配相混合,例如两部机器或两家不同 供应商有差异时会出现此种形状因测定值受供应商,有差异时,会出现此种形状,因测定值受 不同的原因影响,应予层别后再作直方图 直 方 图直 方 图 偏态型偏态型(偏态分配偏态分配)偏态型偏态型(偏态分配偏态分配) 说 明:高处偏向一边,另一边低,拖长尾巴。可分偏右说 明:高处偏向边,另边低,拖长尾巴。可分偏右 边,偏左边 偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形 状. 偏左边:例如,成分含有高纯度的含有率等,不能取到某值以上的值时,就会 出现的形状.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号