统计培训

上传人:jiups****uk12 文档编号:45651478 上传时间:2018-06-18 格式:PPT 页数:55 大小:1.56MB
返回 下载 相关 举报
统计培训_第1页
第1页 / 共55页
统计培训_第2页
第2页 / 共55页
统计培训_第3页
第3页 / 共55页
统计培训_第4页
第4页 / 共55页
统计培训_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《统计培训》由会员分享,可在线阅读,更多相关《统计培训(55页珍藏版)》请在金锄头文库上搜索。

1、统计基础知识与 excel在统计分析中的应用 1 统计基础知识 2 统计图和统计表 3 excel在统计分析中的应用主要内容1 统计基础知识1.1 统计描述的意义1.2 频数表1.3 集中趋势的描述1.4 离散趋势的描述1.5 抽样误差1.6 正态分布1.1 统计描述的意义 社会活动看似杂乱无章,对个体来说有很多不确定性,但总 体上都是服从一些统计规律的。 科研工作有很多数据,统计描述就是对这些数据进行加工和 提炼,找出规律、预测未知。 统计描述是最简洁有力的语言。 统计描述通过描述性指标和统计图(表)反映资料的分布规 律及其数量特征。1.2 频数表Table 1.某单位1999年的101名职

2、工的血清总胆固醇含量。频数表:将变量值分为不同数量的组段,清点各组段的例数。 意义:概括了解变量值在各组段的分布和规律。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.

3、274.523.194.593.753.984.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.261.确定全距:R=最大值最小值=5.71-2.35=3.362.定组数(8-13组)和组距:各组段的起点和终点分别称为上限和下限,某组段的组中值为该组段的 (上限+下限)/2。相邻两组段的下限之差为组距。常用全距的1/10取 整做组距。3.36/10=0.3360.33.写出组段的下限:第

4、1组段值小于或等于最小变量值,并以整数为好。如2.34. 列出频数表:变量(x)归为下限x上限。计量资料频数表的编制步骤Table 1. 100名职工血清总胆固醇频数表组段频数ff(%) 2.3-11.02.6-33.0 2.9-66.0 3.2-88.0 3.5-1717.0 3.8-2020.04.1-1717.0 4.4-1212.0 4.7-88.0 5.0-55.0 5.3-22.0 5.3-5.611.0 合计100100.0频数分布图直方图正态分布:频数分布的集中位置在中间,左右两侧大致对称。正偏态分布:频数分布不对称,集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一

5、侧。1.3 集中趋势的描述描述对象:描述同质观察值平均水平或中心位置。1.3.1 均数(average,mean):基本公式:加权法公式:应用范围:适用于正态或类似正态分布的数值变量资料。1.3.2 几何均数(G)应用范围:适用于数值呈倍数变化或数据经过对数变换后呈正态分布的数值变量资料。基本公式 :加权法公式 :1.3.3 中位数定义:将一组变量值由小到大依次排列,居以中间位 次的观察值即为中位数使用范围:适用于描述偏态分布资料的平均水平。n为偶数n为奇数1.3.4 百分位数(percentile)定义:将一组变量值由小到大依次排列,nX%为第x百分位数的秩 次,其对应的变量值(x)为第x百

6、分位数,记为Px。中位数即为P50。第p百分位数的计算: 第1步:以递增顺序排列原始数据(即从小到大排列)。 第2步:计算指数i=np% 第3步: l)若i不是整数,将i向上取整。 大于i的毗邻整数即为第p百分位数的位置。 2) 若i是整数,则第p百分位数是第i项 与第(il)项数据的平均值。 1.4 离散程度的描述1.4.1 全距( Range,R):定义:R=最大值 最小值意义:R值越大,表示该组数据的变异越大。缺点:数据利用不全,部分信息损失,在例数少时结果不稳定。仅考虑最大值与最小值之差,不能反映组内其他观察值的 变异度。描述对象:反映一组同质观察值的变异度1.4.2 四分位数间距(q

7、uartile, 简记为Q):定义:为上四分位数QU与下四分位数QL之差。Q=P75%-P25%意义:作为变异指标比极差稳定。常用于表示偏态分布资料的变异。Q越大,变异度越大;反之,Q越小,变异度越小。1.4.3 方差和标准差(standard deviation, STDEV)总体方差(2)总体标准差()样本标准差(s)1.4.4 变异系数(CV)应用:2.比较组单位相同,但均数相差悬殊的组间变异程度.CV越大,表示数据变异越大。常用于衡量方法、仪器的精密度。公式:1.组间单位不同时变异程度的比较。意义:1.5 抽样误差 1.5.1 抽样误差抽样误差:由于个体变异的存在,抽样研究所造成的样本

8、统计量与总体参数之间的差异,称为抽样误差。均数的抽样误差:这种由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。样本均数的标准差称均数的标准误1.5.2 标准误( standard error) 定义:公式:意义:反映均数抽样误差大小的指标。标准误大,表示抽样误差大;标准误小,表示抽样误差小。1.6 正态分布频数分布与正态分布曲线示意图正态分布曲线下面积的含义1.表示变量值(x)在a-b区间变量值所占全部(总体)变量 值的比例或概率(p)。2.变量值在整个曲线下的面积为100%,或出现的概率为1。正态分布曲线理论上的特征(1)以X=为中心, X值呈钟型分布。(2)在 X=处,f(x

9、)取最大值。(3)正态分布由 、决定 正态分布的位置和形状。随不同,曲线位置不同,称为位置参数。越大,曲线形状不同, 称为形状参数。正态分布参数位置变化示意图正态分布变异度不同变化示意图2 统计表与统计图2.1 统计表2.1.1 统计表的结构医院有效病例无效病例合计甲121830乙31940丙205070合计6377140表2 2002年某地三医院同种感冒药治疗鼻塞的效果横标目纵标目表号 标题横标目名称2.1.2 编制统计表的原则 重点突出,一张表只表达一个中心内容。 主语在左,宾语在右,从左至右构成一句完整而通顺的话。 简单明了,文字、数字与线条尽量简洁。2.1.3 编制统计表的要求标题:概

10、括说明表的内容,必要时注明时间和地点,列于表的 上方居中。字数一般不超过20个。标目:简明确切,有单位的要注明单位。横标目列于表的左侧, 为被研究的事物;纵标目列于表的上端,为横标目的统计指标。数字:一律用阿拉伯字表示;同一指标的小数位数应一致并对齐。表 中暂缺或无数字者分别以“”和“”表示,数字为零者要记做 “0”,表内不留空格。线条:除表的顶线、底线、纵标目下、合计上的横线外,其余线 均省略;顶线和底线应略粗。表的左上角不宜用斜线。2.2 统计图条图 (bar chart) 圆图(pie chart) 百分比条图(percent bar chart) 线图(line graph) 直方图(

11、histogram) 散点图(scatter diagram) 统计地图(statistical map) 2.2.1 统计图的种类1.按资料的性质和分析目的选用适合的图形:间断性资料选用条图、圆 图、百分条图;连续性资料选用线图、直方图。 2.要有标题,扼要说明资料的内容,必要时注明时间、地点,一般写在 图的下面。 3.条图、线图和直方图都有纵轴与横轴。纵横坐标长度的比例一般约5: 7(或7:5)为宜。 4.纵轴和横轴应标注标目及其单位;标明尺度。 5.比较不同事物时,用不同的线条或颜色表示,要附图例说明。2.2.2 绘制统计图的基本要求2.2.3 条图用直条的长度表示相互独立的统计指标的大

12、小,可分为:单式条图; 复式条图;分段条图 误差条图图2-17 2000年三大城市四苗接种率()图2-27 四种营养素喂养小白鼠 三周后所增体重(克)图2-26 老、中、青三代的结核 菌素阳性率与强阳性率()3 excel在统计分析中的应用3.1 利用excel进行T检验3.2 利用excel进行直线相关方程计算3.1 利用excel进行T检验小鼠对 子号12345678910实验组3.0 2.32.41.14.03.72.71.92.61.3对照组3.6 4.54.24.43.75.67.04.15.04.5表 1 某化合物抑瘤实验的结果Step 1 建立excel表格Step 2 选择TT

13、EST函数Step 3 输入各个参数Step 4 点击“确定”,返回P值Step 5 结果分析P0.05, 小概率事件,实验组与对照组存在显 著性差异,说明该药物有效。在柱状图中, P0.05 用*标识, P 0.01时,用*表示。P0.05, 实验组与对照组没有显著性差 异,说明该药物无效 3.2 利用excel进行直线相关方程计算药物浓度 (g/l)00.010.020.030.040.050.060.070.080.1OD76000.1150.2440.3840.5260.6480.7820.9061.0291.262表 1 不同药物浓度的吸收值 Step 1 建立excel文件Step 2 插入-图表-散点图Step 3 输入横标目和纵标目Step 4 点击“完成”小数位数 不一致Step 5 修改坐标轴右键-坐标轴格式-数字-选数值,小数位数为2Step 6 添加趋势线天津艾赛博生物技术有限公司 (机密)Step 7 完成Thank you!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号