定量分析----统计分析法

上传人:tian****1990 文档编号:81527443 上传时间:2019-02-21 格式:PPT 页数:114 大小:3.37MB
返回 下载 相关 举报
定量分析----统计分析法_第1页
第1页 / 共114页
定量分析----统计分析法_第2页
第2页 / 共114页
定量分析----统计分析法_第3页
第3页 / 共114页
定量分析----统计分析法_第4页
第4页 / 共114页
定量分析----统计分析法_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《定量分析----统计分析法》由会员分享,可在线阅读,更多相关《定量分析----统计分析法(114页珍藏版)》请在金锄头文库上搜索。

1、定量分析-统计分析法,统计分析法:运用建立在数学科学基础之上的各种方法去收集、整理和分析事物量的资料的工作方法。,描述性统计:将研究中所搜集到的数据资料进行归纳整理,用统计图表和统计量数来帮助说明研究对象的特征、内部联系或横向比较结果。 推断性统计:根据样本中所包含的信息去推断总体的情况。,一、思想信息的获取方法 二、思想信息的分析方法 (一)思想信息分析的特点 (二)思想信息的定量分析-统计分析法 1、描述性统计,描述性统计,集中量数 差异量数 地位量数 相关系数,(1)集中量数,集中量数是描述数据集中趋势的统计量数。 集中量数的意义:代表一群数据的典型情况;与另一研究对象进行比较。,(1)

2、集中量数,集中量数是描述数据集中趋势的统计量数。 集中量数的意义:代表一群数据的典型情况;与另一研究对象进行比较。 集中量数主要有:算术平均数(Mean) 、中数(Median) 、众数(Mode),算术平均数,中数与众数,中数:位于一组数据中较大一半与较小一半中间位置的那个数。 众数:次数分布中出现次数最多的那个数的数值。,(2)差异量数,差异量数是描述一组数据离中趋势的量数,也就是数据的离散程度。 常用的差异量数有:方差、标准差(Standard deviation) 、全距、,方差( s2或2 )和标准差(s或 ),样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越

3、大,样本数据的波动就越大。 样本中各数据与样本平均数的差的平方和的平均数叫做样本方差。 样本方差的算术平方根叫做样本标准差 。,方差与标准差,A、B两组各有5位学生参加同一次能力测验,A组的分数为68、69、70、71、72,B组的分数为45、62、70、78、95。请问哪组学生能力差异小?,思考,A、B两组各有5位学生参加同一次能力测验,A组的分数为68、69、70、71、72,B组的分数为45、62、70、78、95。请问哪组学生能力差异小? 解答:求其标准差。 这两组的平均数都是70,但A组的标准差为1.41,B组的标准差为16.6,说明A组比B组能力差异小 。,(3)地位量数,地位量数

4、是描述单个数据在样本或总体中地位的量数。 地位量数有名次、百分等级、标准分数,百分等级,某省考生的高考成绩单: 考号 姓名 语文 数学 外语 物理 理综 综合分 10050516 张华 592 598 642 581 619 636 百分等级 82.1 83.7 92.2 79.1 88.3 91.3,百分等级也称百分位,反映的是某个观测分数以下数据个数占总个数的比例,在0100之间取值。,标准分数(z),标准分数(stardard score):一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置。 在统计中,变量值与其平均数的离差除以标准差后的值,称为标准分数

5、,也Z分数。,某五名大学生参加公务员考试,其申论和行政职业能力测验的成绩如下: 申论: 82、79、90、88、66 行政职业能力测验:76、84、96、91、68 其中,小王的申论成绩为88,行政职业能力测验成绩为91,请问小王哪门成绩好?,思考,解答:求其标准分数。,思考,该大学生两个分数的标准分数都是正数,说明他两门考课程考试成绩皆高于该组平均分数; 因为申论标准分数的绝对值大于职业行政能力准标分数的绝对值,说明申论成绩距离平均分的差距要大于职业行政能力距离平均分的差距,即申论成绩更为突出。,(4)相关系数, 相关的界定: 函数关系 两种现象或变量之间存在确定的严格的依存关系,这种关系可

6、用函数关系式表达。 相关关系 两种现象或变量之间存在不确定的不严格的依存关系。,计件工资总额与零件数量 身高与体重 血压与年龄 商品的销售量与单价 数学成绩的好坏与物理成绩的好坏 商品销售与广告 粮食生产与施肥量 吸烟与身体健康,这些变量中哪些是相关关系,哪些是函数关系?,(4)相关系数, 相关的分类: A 按相关的性质分,有正相关和负相关 B 按相关的形式分,有线性相关和非线性相关 C 按影响因素多少分,有单相关和复相关 D 按相关的程度分,有完全相关、不完全相关和不相关,(4)相关系数, 相关的分类: A 按相关的性质分,有正相关和负相关。 正相关:两个变量按照相同的方向变化 负相关指:两

7、个变量按照相反的方向变化,(4)相关系数, 相关的分类: B按相关的形式分,有线性相关和非线性相关 线性相关(直线相关):即当自变量变动时,因变量也随之发生大致均等的变动。 非线性相关(曲线相关):即当自变量发生变动时,因变量也发生变动,但其增加或减少不是均等的。,散点图(散布图):变量X、Y的全部可能取值在直角坐标系中形成的图形。,示例,为研究学习时间与学习成绩之间的关系,测得出下数据:,(4)相关系数, 相关的分类: C按影响因素多少分,有单相关和复相关。 单相关:两个变量之间的相关称为单相关; 复相关:一个因变量与两个或两上以上自变量之间的相关称为复相关或多元相关。,(4)相关系数, 相

8、关的分类: D按相关的程度分,有完全相关、不完全相关和不相关 完全相关:指某变量的变化,另一变量有一确定的值对它对应。 不完全相关:指两个变量之间有数量联系,但是数量是不确定的关系。 零相关:指两个现象在数量上完全独立,在一定的形式下,互不影响,互不相干的关系。,(4)相关系数,相关系数 相关系数是描述两个变量之间相关关系的一种量数。用符号p或r表示。 相关系数的性质:有界性、方向性 有界性:相关系数的取值范围在-1,1,方向性:两个变量之间相关关系的性质可以由其符号反映出来。 r 0,正相关 r 0,负相关 r =0,零相关,相关系数计算方法 A 皮尔逊积差相关 适用条件: 两列数据都是连续

9、变量,且两列变量各自总体的分布呈正态分布; 两列变量之间的关系是线性的。,(4)相关系数,连续变量:在一定区间内可以任意取值的变量叫连续变量。,正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。 特征: 正态分布的中央点(均数)最高,然后逐渐向两侧下降; 以均数为中心,两端对称; 永远不与x轴相交的钟形曲线; 正态曲线下的面积分布有一定规律:正负一个标准差之间,包含总面积的68.26%;正负1.96个标准差之间,包含总面积的95%;正负2.58个标准差之间,包含总面积的99%。,正态分布有两个重要参数: 位置参数:均数,均数决定正态曲线的中心位置; 形状参数

10、:标准差,标准差决定正态曲线的陡峭或扁平程度。,均值相同,标准差不同的正态分布曲线,标准差相同、均数不同的 正态分布曲线,正态分布的简单判断方式,绘制数据的条形图,如果数据来自正态分布,条形图呈现“钟形”分布。,皮尔逊积差相关,以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。,公务员业绩评分资料表,计算领导与群众评分之间的相关程度,以此判定领导与群众对公务人员测评的一致性程度。,解答:设领导评分为X,群体评分为Y,用积差相关法测定二者之间的相关程度。,相关系数计算方法 B 斯皮尔曼等级相关(用符号rp表示) 适用条件: A 适用于一列或两列变量皆为等级变量的数据资料

11、; B 两列变量之间的关系是线性的。,(4)相关系数,斯皮尔曼等级相关计算公式,D:成对数据的等级之差 N:成对数据的个数,10名学生的学习成绩与其品德等级统计表,计算二者的相关程度。,赋予等级时注意: 对两列变量赋予等级的方向要一致; 对于相同的等级要以它们占等级位置的平均数赋予等级。,10名学生的学习成绩与其品德等级统计表,计算二者的相关程度。,10名学生的学习成绩与其品德等级统计表,计算二者的相关程度。,=1-6x108.510x(102-1)=0.3425,一、思想信息的获取方法 二、思想信息的分析方法 (一)思想信息分析的特点 (二)思想信息分析的优化 (三)思想信息的定量分析-统计

12、分析法 1、描述性统计 2、推断性统计,-假设检验,假设检验亦称“显著性检验(Test of statistical significance)”,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,(1)什么是假设检验,(2)假设检验的基本思想,假设检验的基本思想是小概率原理。 小概率原理是指小概率事件在一次试验中基本上不会发生。,显著性水平:即概率水平,统计检验中所规定的小概率的数量标准。一般用符号a表示。,(3)假设检验的基本步骤,第一,提出虚无假设H0。 研究假设: H1: 0 虚无假设:H0: =0 第二,计算统计量。 即选定统计方法,由样本观察值

13、按相应的公式计算出统计量的大小,如t值等。 第三,确定显著性水平,并查出临界值。 显著性水平: 0.05或0.01 第四,作出推断统计:将统计量与临界值进行比较,从而作出拒绝还是接受虚无假设的判断。,自由度(df):样本变量中可以自由取值的个数,一般为df=n-1。,(3)假设检验的基本步骤,第一,提出虚无假设H0 。 研究假设: H1: 0 虚无假设:H0: =0 第二,计算统计量。 即选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如t值等。 第三,确定显著性水平,并查出临界值。 显著性水平: 0.05或0.01 第四,作出推断统计:将统计量与临界值进行比较,从而作出拒绝还是接受

14、虚无假设的判断。 如果|t|t(df),则p0.05或p0.01,接受虚无假设H0,表明无显著差异。,(4)平均数差异的t检验,t 检验的应用条件: 样本来自正态分布总体; 两样本均数比较时,要求两样本相应的总体方差相等,即方差齐性。,t检验的三种类型,单样本t检验(One-Sample T Test) 独立样本t检验(Independent-Sample T Test) 配对样本t检验(Paires-Sample T Test),单样本t检验(One-Sample T Test),单样本t检验适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有

15、差别。,以往通过大规模调查已知某地新生儿出生体重为3.30千克。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42千克,标准差为0.40,问该地难产儿出生体重是否与一般新生儿体重不同?,单个样本t检验案例分析,单个样本t检验检验步骤,A 建立虚无假设:H0:0(即假设该地难产儿与一般新生儿平均出生体重相同),单个样本t检验检验步骤,B 计算t值 ,n=35 ,S=0.40, 0=3.30,,单个样本t检验检验步骤,B计算t值,C 确定显著性水平0.05,自由度df=34,查t值表,得临界值t0.05(34)=,单个样本t检验检验步骤,2.032,D 作出统计推断 |t|=1

16、.77,t0.05(34)= 2.032 |t|t0.05(34),说明出现这种情况的概率高于5%,所以接受虚无假设H0,即难产儿与一般新生儿平均出生体重相同。,单个样本t检验检验步骤,独立样本t检验(Independent-Sample T Test),适用于两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。,用特质愤怒量表对40名大学生进行测试,其中男大学生22名,特质愤怒量表平均得分18分,标准差是4,女大学生18名,特质愤怒量表平均得分19分,标准差3.9。问男女大学生的特质愤怒水平是否存在显著差异?, 独立样本t检验-案例分析,A 建立虚无假设:H0:0(即假设男女大学生特质愤怒水平无显著差异),独立样本t检验-案例分析,B计算t值,独立样本t检验-案例分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号