描述性研究统计资料.doc

上传人:F****n 文档编号:89904374 上传时间:2019-06-04 格式:DOCX 页数:17 大小:19.55KB
返回 下载 相关 举报
描述性研究统计资料.doc_第1页
第1页 / 共17页
描述性研究统计资料.doc_第2页
第2页 / 共17页
描述性研究统计资料.doc_第3页
第3页 / 共17页
描述性研究统计资料.doc_第4页
第4页 / 共17页
描述性研究统计资料.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《描述性研究统计资料.doc》由会员分享,可在线阅读,更多相关《描述性研究统计资料.doc(17页珍藏版)》请在金锄头文库上搜索。

1、描述性研究统计资料篇一:R语言之描述性统计分析练习笔记R 14章笔记/*20XX年9月15日10:14:47:多组数据的描述统计分析*/*先画散点图*/plot,ylab=Sdistance) /*添加拟合曲线*/lines,lwd=2)/*还可以使用loess 函数,该函数适用于处理多维的情况,而lowess只处理二维的情况*/ 结果如图:012051015Speed2025 /*标明数据的具体位置*/ rug) rug) /*添加单变量的箱形图*/ oplayout,2,2,byrow=T),c,c) par)plotrug) rug) title par)boxplottitle,lin

2、e=0) par)boxplot title,line=1) par结果图如下:cars data12010080Stance604020 5 10152025Speed二维等高线图:library zcontour/contour函数三维透视图:persp/persp函数/*20XX年9月16日15:33:05 多组数据的图形描述练习*/*产生五个样本容量为10标准正态分布的样本*/ nd/*画多数据的散点图*/plot 或者用“pairs”也可以产生 /*画矩阵图*/matplot /*框须图*/ boxplot多组数据的概述:与单组数据情形类似,直接用summary 就可以了以数据框st

3、ate.x77为例,首先用summary得到各个变量的最小值min,1分位数1st Qu,中位数median,均值mean,三分位数3rd Qu,最大值max;进一步利用函数aggregate,mean)得到不同地区的均值统计结果:aggregate 函数说明:格式为:aggregate(x,by,FUN,),其中x为数据框,by指定分组变量,fun用来计算的统计函数标准差与协方差阵的计算多变量的标准差仍然用函数sd 、协方差阵:函数var相关系数的计算格式:cor),分别为:皮尔逊相关系数、肯德尔相关系数、斯皮尔曼相关系数例题:x cor 1 0.769 cor 1 1 cor 1 1 20

4、XX年9月17日08:39:06 分组数据的图形概括 关于杜鹃鸟蛋的例子library data cuckoos使用条件散点图:函数coplot 格式:coplotcoplot:表示对于因子a,变量x与y的条件散点图coplot:表示对于两个因子a,b,变量x与y的条件散点图 不同种类杜鹃鸟的蛋长度与宽度散点图:coplot由于版本原因,上面的命令并没有得到结果,显示“找不到breadth”这个变量, 因此我们将这三个变量通过如下命令: xGiven : z15.016.017.015.016.017.0x515.016.017.0y 5 20XX年9月29日15:21:12 分类数据的描述性

5、统计分析 1、列联表的制作 方法一:通过矩阵建立列联表命令:Eye.Haircolnames篇二:统计学数据的描述性分析习题一、判断题(把正确的符号“”或错误的符号“”填写在题后的括号中。) 1、众数是总体中出现最多的次数。()2、权数对算术平均数的影响作用只表现为各组出现次数的多少,与各组次数占总数的比重无关。 ()二、单项选择题 1、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。A.标准差系数 B.平均差 C.全距 D.均方差2、某车间7位工人的日产零件数为16、20、25、23、12、35、27件,则它的全距为( )A、 25 B、17、C、23 D

6、、103、某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足( )。 A、算术平均数中位数众数 B、众数中位数算术平均数 C、中位数算术平均数众数 D、算术平均数中位数众数 4、对于一个右偏的频数分布,一般情况下( )的值最大。A、中位数B、众数C、算术平均数 D、调和平均数6甲乙两数列,甲数列的标准差?甲大于乙数列的标准差?乙,则两个数列的平均数的代表性为()A、甲大于乙 B、乙大于甲 C、相同 D、无法判断 7、权数对算术平均数的影响作用,实质上取决于( ) A、作为权数的各组单位数占总

7、体单位数比重的大小 B、各组标志值占总体标志总量比重的大小 C、标志值本身的大小 D、标志值数量的多少8某变量数列如下:53,55,54,57,56,55,54,55,则其中位数为()A、54 B、55C、56.5 D、57 9如果某个分布是极度右偏,则其偏度系数为()A、-0.3 B、0.3 C、-2.9 D、2.9 三、多项选择题1、平均数的种类有()。A、算术平均数 B、众数 C、中位数 D、调和平均数 E、几何平均数2、在什么条件下,加权算术平均数等于简单算术平均数( )。 A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为1 E、各组次数占总次数的比重相等

8、 四、计算题1某企业产品的有关资料如下: 试指出哪一年的总平均成本高,为什么? 2有甲乙两个品种的粮食作物,经播种实验后得知甲品种的平均亩产量为998斤,标准差为试研究两个品种的平均亩产量,以确定哪一种具有较大稳定性,更有推广价值。3. 为了了解大学生每月伙食费的支出情况,在北京某高校随机抽取了250名学生进行调查,得到样本数据如下:根据表中的样本数据:(1)每月伙食支出在200300之间的人数占总人数的百分比是多少? (2)计算大学生每月伙食费的算术平均数;(3)计算大学生每月伙食的样本标准差4、某厂甲、乙两个工人班组,每班组有8名工人,每个班组每个工人的月生产量记录如下:甲班组:20、40

9、、60、70、80、100、120、70 乙班组:67、68、69、70、71、72、73、70 计算甲、乙两组工人平均每人产量;计算全距,平均差、标准差,标准差系数;比较甲、乙两组的平均每人产量的代表性。一、判断题 1、 2、 二、单项选择题1、A 2、C3、D 4、C 6、D7、A8、B 9、D 三、多项选择题1、ABCDE 2、ADE 四、计算题1、解:1998年平均单位产品成本: 1999年平均单位产品成本: x?m?2100?3000?1500?6600?19.41元m0340?x15?20?30x?xff?215*15?75*20?50*?1500?1500?18.3元215?75

10、?50340 所以由以上结果可知1998年的总成本高。 2 解:甲组:V甲?乙组:x?甲x?162.7?0.16 998?xf?847.1公斤/亩 ?f?乙? 2 ?(x?x)f?170.1?fV乙? ?乙 x乙?170.1?0.2 847.1V乙 V甲 所以甲组更有代表性,更稳定、更值得推广3、解:(1)每月伙食费支出在200300元之间的人数占总人数的百分比:(2)算术平均数:110?90?80%250?xffiii?125?10?175?20?225?110?275?90?325?15?375?5?244250(3)样本标准差:s?46.884、解甲班组:平均每人产量 ?x?70件 全距

11、 R?xmax?xmin?120?20?100件n平均差 AD?x?n?x?7000?22.5件 标准差 ?29.6件 8n82标准差系数 V?29.6?42.29% 70乙班组:平均每人产量 ?x?70件 全距 R?xmax?xmin?73?67?6件 n平均差 AD=?x?n?8?1.5件2?3.5?x?28标准差 ?5.00% ?3.5件 标准差系数 V?70n8分析说明:从甲、乙两组计算结果看出,尽管两组的平均每人产量相同,但乙班组的标志变异指标值均小于甲班组,所以,乙班组的人均产量的代表性较好。篇三:matlab中数据的统计描述和分析第十章 数据的统计描述和分析 数理统计研究的对象是

12、受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。 数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在统计工作中经常使用。面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。我们将用Matlab的统计工具箱来实现数据的统计描述和分析。1 统计的基本概念1.1 总体和样本总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及

13、废品分类),学校全体学生的身高。总体中的每一个基本单位称为个体,个体的特征用一个变量(如x)来表示,如一件产品是合格品记x?0,是废品记x?1;一个身高170(cm)的学生记x?170。从总体中随机产生的若干个个体的集合称为样本,或子样,如n件产品,100名学生的身高,或者一根轴直径的10次测量。实际上这就是从总体中随机取得的一批数据,不妨记作x1,x2,?,xn,n称为样本容量。简单地说,统计的任务是由样本推断总体。 1.2 频数表和直方图一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助Matlab这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。-122-例1 学生的身高和体重学校随机抽取100名学生,测量他们的身高和体重,所得数据如表(i) 数据输入数据输入通常有两种方法,一种是在交互环境中直接输入,如果在统计中数据量比较大,这样作不太方便;

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号