第2章-SAS的描述统计功能课件

上传人:夏日****8 文档编号:281327397 上传时间:2022-04-23 格式:PPT 页数:87 大小:1.63MB
返回 下载 相关 举报
第2章-SAS的描述统计功能课件_第1页
第1页 / 共87页
第2章-SAS的描述统计功能课件_第2页
第2页 / 共87页
第2章-SAS的描述统计功能课件_第3页
第3页 / 共87页
第2章-SAS的描述统计功能课件_第4页
第4页 / 共87页
第2章-SAS的描述统计功能课件_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《第2章-SAS的描述统计功能课件》由会员分享,可在线阅读,更多相关《第2章-SAS的描述统计功能课件(87页珍藏版)》请在金锄头文库上搜索。

1、第三次课第三次课应用软件应用软件(SAS)1主要内容主要内容一、一、了解了解SAS中描述性统计量中描述性统计量 1. 了解描述性统计的概念了解描述性统计的概念 2. 掌握掌握SAS中常见的描述性统计量中常见的描述性统计量二、在二、在SAS中计算统计量中计算统计量 1. 用用“INSIGHT”计算统计量计算统计量 2. 用用“分析家分析家”计算统计量计算统计量 3. 编程计算统计量编程计算统计量2第二章第二章 SASSAS的描述统计功能的描述统计功能第二章 SAS的描述统计功能n 2.1 描述性统计的基本概念描述性统计的基本概念n 2.2 在在SAS中计算统计量中计算统计量n 2.3 统计图形统

2、计图形3第二章第二章 SASSAS的描述统计功能的描述统计功能2.1 描述性统计的基本概念描述性统计的基本概念n 一、统计学的基本概念一、统计学的基本概念n 二、表示数据位置的统计量二、表示数据位置的统计量n 三、表示数据分散程度的统计量三、表示数据分散程度的统计量n 四、表示数据分布形状的统计量四、表示数据分布形状的统计量n 五、其它统计量五、其它统计量4对数据进行频数统计、计算特征统计量、将数据图对数据进行频数统计、计算特征统计量、将数据图形化的过程。形化的过程。描述性统计:描述性统计:目的:目的:为了揭示数据的集中趋势、分散程度、和数据分布为了揭示数据的集中趋势、分散程度、和数据分布形态

3、,展示极端数据,形态,展示极端数据,最后作出说明现象本质的初步结论。最后作出说明现象本质的初步结论。5一、统计学的基本概念一、统计学的基本概念1. 总体与样本总体与样本总体总体(population): 所研究对象的全体组成的集合。所研究对象的全体组成的集合。样本样本(sample): 从总体中抽取的部分对象(个体)组成的集合。从总体中抽取的部分对象(个体)组成的集合。 样本中包含个体的个数称为样本中包含个体的个数称为样本容量样本容量。 样本常用样本常用n个随机变量个随机变量X1,X2,Xn表示,表示, 其观测值(样本数据)则表示为其观测值(样本数据)则表示为x1,.,xn第二章第二章 2.1

4、 描述性统计的基本概念描述性统计的基本概念62. 参数与统计量参数与统计量参数参数(parameter): 是用来描述总体特征的概括性值。是用来描述总体特征的概括性值。 如总体平均值(如总体平均值()、总体方差()、总体方差( 2)。)。 统计量统计量(statistics):第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念是用来描述样本特征的概括性值。是用来描述样本特征的概括性值。如样本均值(如样本均值( )、样本方差()、样本方差( )、)、样本比例(样本比例( P )等。)等。7二、表示数据位置的统计量二、表示数据位置的统计量 一组观测数据一组观测数据x1,.,xn, 常见

5、的位置统计量:常见的位置统计量:均值,中位数,分位数,众数均值,中位数,分位数,众数1. 均值(均值(Mean) 均均值值是是所所有有观观测测值值的的平平均均值值,是是描描述述数数据据取取值值中中心位置的一个度量:心位置的一个度量:第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念82. 中位数(中位数(Median或或Med)中位数是描述观测值数据中心位置的统计量,中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。大体上比中位数大(小)的数据为观测值的一半。优点:优点:它不受个别极端数据的影响,具有稳健性。它不受个别极端数据的影响,具有稳健性。中

6、位数的计算方法是:中位数的计算方法是:首先将数据从小到大排序为:首先将数据从小到大排序为:x(1),.,x(n),然后计算:然后计算:第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念93. 众数(众数(Mode)观测值中出现观测值中出现最多最多的数称为众数。的数称为众数。4. 百分位数(百分位数(Percentile) 分位数也是描述数据分布和位置的统计量。分位数也是描述数据分布和位置的统计量。0.5分位数分位数就是中位数,就是中位数,0.75分位数和分位数和0.25分位数又分别称为分位数又分别称为上、下四分上、下四分 位数位数,并分别记为,并分别记为Q3和和Q1。第二章第二章

7、2.1 描述性统计的基本概念描述性统计的基本概念10三、表示数据分散程度的统计量三、表示数据分散程度的统计量1. 极差极差(Range)与)与半极差半极差(Interquartile range) 极差极差 = maxxi minxi 极差就是数据中的最大值和最小值之间的差极差就是数据中的最大值和最小值之间的差半极差半极差= Q3 Q1, 半极差描述了中间半数观测值的散布情况半极差描述了中间半数观测值的散布情况2. 方差方差(Variance或或Var) 方差反映了观测值与均值的偏离程度方差反映了观测值与均值的偏离程度第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念113. 标准

8、差标准差(Standard deviation或或Std Dev) 方差的开方称为标准差:方差的开方称为标准差: 标准差的量纲与原变量一致。标准差的量纲与原变量一致。4. 变异系数变异系数(Coefficient of Variation或或CV) 变变异异系系数数是是将将标标准准差差表表示示为为均均值值的的百百分分数数,是是观观测测数数据据分分散散性性的的一一个个度度量量,它它在在比比较较用用不不同同单单位位测测量的数据的分散性时是有用的量的数据的分散性时是有用的.第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念12四、四、表示数据分布形状的统计量表示数据分布形状的统计量描述数

9、据分布形状的指标:描述数据分布形状的指标:偏度偏度,峰度峰度1. 偏度(偏度(skewness) 偏度是刻画数据对称性的指标偏度是刻画数据对称性的指标 关于均值对称的数据其偏度为关于均值对称的数据其偏度为0; 左侧更为分散的数据,其偏度为负,称为左偏;左侧更为分散的数据,其偏度为负,称为左偏; 右侧更为分散的数据,其偏度为正,称为右偏。右侧更为分散的数据,其偏度为正,称为右偏。第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念132. 峰度(峰度(kurtosis) 峰度描述数据向分布尾端散布的趋势。峰度描述数据向分布尾端散布的趋势。 利利用用峰峰度度研研究究数数据据分分布布的的形

10、形状状是是以以正正态态分分布布为为标标准准(假定正态分布的方差与所研究分布的方差相等假定正态分布的方差与所研究分布的方差相等)第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念 近似于标准正态分布,则峰度接近于零;近似于标准正态分布,则峰度接近于零; 尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更分散,则峰度为正,称为轻尾; 尾部较正态分布更集中,则峰度为负,称为厚尾。尾部较正态分布更集中,则峰度为负,称为厚尾。14五、其它统计量五、其它统计量1. 均均值值的的标标准准误误差差(Std Error Mean或或Std Mean或或Std error)2. 校正平方和校

11、正平方和(Corrected sum of squares)第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念153. 未校正平方和未校正平方和(Uncorrected sum of squares)第二章第二章 2.1 描述性统计的基本概念描述性统计的基本概念4. k阶原点矩阶原点矩其中其中A1即为均值即为均值5. k阶中心矩阶中心矩16第二章第二章 SASSAS的描述统计功能的描述统计功能2.2 在在SAS中计算统计量中计算统计量 n 一、一、 用用 INSIGHT 计算统计量计算统计量n 二、二、 用用“分析家分析家”计算统计量计算统计量n 三、三、 编程实现描述性统计编程实

12、现描述性统计17二、用二、用INSIGHT计算统计量计算统计量1. 实例数据实例数据【例例2-1】下下表表为为两两个个不不同同地地区区居居民民家家庭庭收收入入和和支支出出情况的抽样调查(单位:元),情况的抽样调查(单位:元),试试分分别别就就两两个个地地区区的的家家庭庭收收入入和和支支出出情情况况做做描描述述统统计。计。18家庭家庭编号编号地区地区编号编号家庭家庭总收入总收入家庭家庭总支出总支出家庭家庭编号编号地区地区编号编号家庭家庭总收入总收入家庭家庭总支出总支出1 12 2179417941550155016162 222002200206020602 22 217161716136513

13、6517171 127302730223622363 31 1341034102730273018181 124962496145514554 42 2176517651530153019191 117601760104010405 52 2218421841900190020201 128202820236623666 62 2205020502050205021212 222502250196619667 72 2246024602184218422221 131703170240024008 81 1197619761170117023232 212001200125012509 91

14、1285028502496249624242 2177617761350135010101 1427542752760276025252 2198019801794179411112 2201020101275127526261 1245524552550255012121 1223622361810181027272 2108010801380138013131 1330533052820282028282 2198619861200120014141 1240024001976197629291 1336933692305230515152 2225022501970197030302 2

15、153015301316131619 将将 数数 据据 通通 过过 Excel导导 入入 到到 SAS数数 据据 集集Sasuser.Exam2_1,4个变量名分别为:个变量名分别为:ID、R_ID、Income和和Outgo,相相应应的的标标签签名名为为家家庭庭编编号号、地地区区编编号号、家家庭庭总总收收入入和家庭总支出。和家庭总支出。202. 在在INSIGHT中打开数据集中打开数据集 在菜单中选择在菜单中选择“Solution ”“Analysis”“Interactive Data Analysis ”,打开打开“SAS/INSIGHT Open”对话框,对话框,在对话框中选择数据集:

16、在对话框中选择数据集: Sasuser.Exam2_1 ,单击单击“Open” ,即可在,即可在INSIGHT中打开数据窗口。中打开数据窗口。213. 计算统计量计算统计量 选择菜单选择菜单“Analyze”“Distribution (Y)”,打开打开“Distribution (Y)”对话框。对话框。在数据集在数据集Exam2_1的变量列表中,的变量列表中,选择选择Income为分析变量,选择为分析变量,选择R_Id为分组变量。为分组变量。 22选择选项选择选项矩统计量和分位数矩统计量和分位数,单击,单击“OK”按钮,按钮,可可得得到到变变量量Income按按“R_Id”分分组组的的各各种种矩矩统统计计量量(Moments)和分位数()和分位数(Quantiles)。)。2324二、用二、用“分析家分析家”计算统计量计算统计量1. 启动启动“分析家分析家”选择主菜单选择主菜单“Solutions(解决方案)(解决方案)”“Analysis(分分析析)”“Analyst(分分析析家家)”,打开打开“分析家分析家”窗口。窗口。 选择主菜单选择主菜单“File(文件)(文件)” “Ope

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号