薪酬设计回归分析调查报告20页word

上传人:工**** 文档编号:561128020 上传时间:2024-02-29 格式:DOCX 页数:24 大小:94.10KB
返回 下载 相关 举报
薪酬设计回归分析调查报告20页word_第1页
第1页 / 共24页
薪酬设计回归分析调查报告20页word_第2页
第2页 / 共24页
薪酬设计回归分析调查报告20页word_第3页
第3页 / 共24页
薪酬设计回归分析调查报告20页word_第4页
第4页 / 共24页
薪酬设计回归分析调查报告20页word_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《薪酬设计回归分析调查报告20页word》由会员分享,可在线阅读,更多相关《薪酬设计回归分析调查报告20页word(24页珍藏版)》请在金锄头文库上搜索。

1、相关与回归分析第一节简单线性相关分析一、相关关系的概念与种类(一)相关关系的概念在自然界和人类社会中,普遍着存在现象之间的相互依赖、相互制约的关系。一些现象 在数量上的发展变化经常伴随着另一些现象数量上的发展变化。现象间的数量关系可分为两 种基本类型:函数关系。它是指现象间存在的严格依存的、确定的因果关系,一种现象的 数量变化必然决定着另一种现象的数量变化,这种关系可通过精确的数学表达式来反映,比 如,圆面积同其半径的关系为s=nr2,自由落体落下的距离同时间的关系为h=1 gt2,等等。相关关系。指的是现象之间确实存在着数量关系,但这种关系不是严格确定的,当一种现 象的数量发生变化时,另一种

2、现象的数量可能在一定范围内发生变化,出现不同的数值。比 如,单位产品成本同产量之间的关系,一般说来,当工厂规模扩大,产品产量增加时,单位 产品成本会随之下降,这种变化趋势体现了规模经济的效应,具有客观性和普遍性。但由于 影响产品成本的因素众多,有主要的,也有次要的,有必然的,也有偶然的,有随机的,也 有非随机的,有观察得到的,也有观察不到的,等等。同一产量水平下,可能会出现各种各 样的单位成本,或者某一确定的单位成本对应着不同的产量,两者的关系不是唯一确定的。 粮食收获量与施肥量之间、商品价格与需求量之间、身高与体重之间等都具有类似的特征, 这种关系就是相关关系。函数关系与相关关系既有区别,又

3、有联系。由于观察和实验中的误差,函数关系往往通 过相关关系表现出来;而当对现象之间的内在联系和规律性了解得更加清楚的时候,相关关 系又可能转化为函数关系。在社会经济领域里,一般说来,函数关系反映了现象间关系的理 想化状态,相关关系则反映了现象间关系的现实化状态,只有在大量观察时,在平均的意义 上,它才能被描述。综上所述,相关关系是现象之间确实存在的,但关系数值不固定的相互依存关系。相关 分析则是研究一个变量与另一个变量或另一组变量之间相关密切程度和相关方向的一种统 计分析方法。(二)相关关系的种类现象之间的相关关系是很复杂的,从不同的角度看,相关关系有不同的种类。1. 固定相关和随机相关。按变

4、量的性质(是否是随机变量),相关关系可分固定相关和随 机相关。固定相关是指一个随机变量与另一个或一组非随机变量之间的的相关关系。例如, 农作物的施肥量是一个可控制的变量,农作物收获量是一个不确定的变量,两个变量之间的 关系表现为一个随机变量与另一个非随机变量之间的固定相关。随机相关是指一个随机变量 与另一个或一组随机变量之间的相关关系。例如,大学生的身高和体重之间的关系就是两个 随机变量之间的随机相关关系,如果观察某一身高的一组学生时,其体重各不相同,会形成 一个分布;如果观察某一体重的一组学生时,其身高也不相同并形成一个分布,两个变量均 为随机变量。2. 简单相关和多元相关。按变量的多少,相

5、关关系可分为简单相关和多元相关。简单相 关,又称单相关,是指一个随机变量与另一个随机变量或非随机变量之间的相关关系;多元 相关,又称复相关,是指一个随机变量与另一组随机变量或非随机变量之间的相关关系。按变量之间的相关方向不同,简单相关又可分为正相关和负相关。当自变量的值增加, 因变量的值也相应地增加;自变量的值减少,因变量的值也随之减少时,这样的相关关系就 是正相关。反之,当自变量的值增加时,因变量的值随之减少;自变量的值减少时,因变量 的值反而增加,具有这种特点的相关关系就是负相关。多元相关可进一步分解为简单相关和偏相关。偏相关是指在测定一个随机变量与某个或 某些随机变量或非随机变量之间的相

6、互关系后,该随机变量与某一新增加的随机量或非随变 量之间的相关关系,又称之为净相关。3. 线性相关和非线性相关。按变量之间的相关形式,相关关系可分为线性相关和非线性 相关。若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系表现为线性组合 时,则称它们之间的相关关系为线性相关。反之,若一随机变量与另一个或一组随机变量或 非随机变量之间的相关关系不能表现为线性组合,而只能表现为非线性组合时,则称它们之 间的相关关系为非线性相关。4. 完全相关、不完全相关和不相关。按变量之间的相关程度不同,相关关系可分为完全 相关、不完全相关和不相关。若一个变量的值完全由另一个或一组变量的值所决定,则称变

7、 量之间的这种相关关系为完全相关,即函数关系。若一个变量的值与另一个或一组变量的值 有关,但其中要受到随机因素的影响,则称变量之间的这种相关关系为不完全相关。若一个 变量的值完全不受另一个或一组变量值的影响,则称变量之间不相关。大量社会经济现象之 间的相关关系都属于不完全相关,不完全相关是相关分析的基本内容。完全相关和不相关可 视为相关关系中的特例。二、简单线性相关图表判定两变量之间的相关程度和相关方向是简单线性相关分析的重要内容之一。其最简 单、最直观的方法就是列相关表、绘制相关图。简单线性相关关系有固定简单线性相关与随机简单线性相关之分。简单线性相关图表可 用于直观地表明这两类简单线性相关

8、变量之间的相关程度和相关方向。(一)固定简单线性相关图表已知有两个变量,设y是随机变量,x是非随机变量,对应于x的每一个给定的取值, y有多个可能的取值,但在一次试验中,y只取其中一个可能值。由于x是非随机变量,在 实验中其取值可以控制并重复进行,所以在n次试验中,x可能取n个相同或不同的值,相 应地也有n个y的值,即得到一一对应的样本资料(x,y)。将这些数据按x的取值由小到大 依次对应排列,即构成固定简单线性相关表,又称之为一维相关表。例9.1某地区居民人均收入水平(x)与其食品支出占生活费支出比重(y)之间具有相 关关系,编制相关表如下(见表9-1):表9-1 一维相关表人均收入水平(元

9、)x2803203905306506707908809101050食品支出占生活费支出比重(%)y68.367.566.264.956.760.254.449.050.543.6从表9-1可以粗略看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重 有下降的趋势。将一一对应的(x,y)描点于坐标系上,即构成散点图,又称相关图。在相关图上,以横 轴表示非随机变量(x),以纵轴表示随机变量(y),通过观察各对变量值坐标点的分布状况, 可以大致判断变量之间相关的形态、方向和密切程度。图9-2几种常见的相关散点图利用表9-1资料,可绘制相关图如下(见图9-1):图9-1居民人均收入水平与其食品

10、支出的关系图从图9-1可以看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重明显 降低,并大致呈线性下降趋势,即负线性相关。一些常见的相关分布状态可用下述各图表示(见图9-2):较显著的线性正相关较显著的线性负相关不相关不显著的线性负相关1113行和 (f)表9-2二维相关表81012141618收获重(公斤)y260240220200180160列和(f)斤公量获收亩每均平(二)随机简单线性相关图表设x、y为两个随机变量,将观测值(x,y)分组之后按顺序排列,x从小到大排列,y 从大到小排列,形成一棋盘式平衡表,称之为二维相关表。例9.2某地区为研究降雨量和农作物平均每亩收获量的关

11、系,从40个降雨量不同的 试验田中获得40对数据。用x表示降雨量,y表示平均每亩收获量。据此可编出二维相关 表如下(见表9-2)。该表中,中间每一格列出的是x、y的联合频数,它表明x和y同时取某值的次数;最 后一列每一格是每一行的联合频数的和,它表明y取某值的次数;最后一行每一格则是每一 列的联合频数的和,它表明x取某值的次数。1 212 2223511363121113 6141151从表9-2可以粗略看出,降雨量与收获量之间大致呈线性正相关关系。 利用表9-2资料,可绘制相关图如下(见图9-3):280260240220200180160140120100806040200246810 1

12、2 14 16 18 20降雨量(毫米)图9-3降雨量与收获量之间相关图三、简单相关系数(一)简单相关系数的意义简单线性相关图表虽然直观,但不能精确地描述现象间的相关关系。测量两个变量之间 线性相关程度和相关方向的指标,称为简单相关系数。总体相关系数一般用R表示,定义式为c b 2,、R =以(式 9.1)b b式中,bX和b y表示变量X和Y的标准差,对有限总体而言,其计算公式为b =(X WX )2 (式9.2)x k N叫-)2 (式 9.3)Nb 2Xy表示两个变量X和Y之间的协方差,计算公式为b 2 xy = (X x( Xf(式 9.4)这里,变量X和Y为总体变量,N为总体单位数,

13、日x和H y分别为变量X及Y的总体 平均数,计算式为H =三(式 9.5)x NYYH = (式 9.6) y N要理解相关系数R的意义,首先要明确协方差b2XY和标准差b X、b Y在反映变量之间 相关关系中的作用。协方差b2反映了变量X和Y的共变性,可以显示两个变量的相关方向和相关关系的 XY密切程度,它可能出现以下几种情况:第一,所有相关点均为正相关,则b2 XY 0,说明两个变量之间正线性相关。第二,所有相关点均为负相关,则b2 XY 0,说明两个变量之间负线性相关。XY第三,在全部相关点中,既有正相关、又有负相关和零相关,在计算协方差时就会出现 正负抵销。抵销的结果如为正数则是正相关

14、,如为负数则是负相关。数值大表示相关程度强, 数值小则表示相关关系弱。若正、负全部低销掉了,结果为零,则表示不相关。第三种情况是实际经济生活中最常见到的情况。此外,还有两种极端的情况:当所有相 关点都是零相关时,抵销结果为零,表示两个变量完全没有相关关系。当所有相关点全部落在直线上时,表示两个变量完全线性相关,即存在函数关系。进一步,相关系数是一个界于+1和-1之间的数,即-1WRW1,若R=1,说明两个变量 之间存在完全正线性相关;若R=-1说明两个变量之间存在完全负线性相关;若0 R 1, 说明两个变量之间存在一定程度的正线性相关;若-1 R 0,说明两个变量之间存在一 定程度的负线性相关

15、;若R=0,说明两个变量之间没有线性相关关系。(二)简单相关系数的计算在实际工作中,总体相关系数R 一般是未知的,往往需要用样本资料推断总体的相关情 况,因而需要计算样本相关系数。1.固定简单线性相关系数的计算设x和y为样本变量,其中y为随机变量,x为非随机变量,n为样本容量,x、亍分 别为变量x及y的样本平均数,s,、和s2.分别表示变量x和y的样本标准差及它们之 间的样本协方差,其计算为x =笠(式 9.7)ny =剪(式 9.8)n(, 一 X )2s =: (式 9.9)x nZ( y y )2,s = J 3 刀(式 9.10)y ns 2 =冬习心2(式9.11)xyn于是,就可得到与总体相关系数计算形式相同的样本相关系数(记为r)的公式s 2r = xysxsy经过简单的推导,上式还可变化为下面易于计算的形式nLxy 一 xy(式 9.12)r = 一 一 .

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号