双变量描述统计 社会调查研究方法课件

上传人:油条 文档编号:49132538 上传时间:2018-07-24 格式:PPT 页数:25 大小:249.50KB
返回 下载 相关 举报
双变量描述统计 社会调查研究方法课件_第1页
第1页 / 共25页
双变量描述统计 社会调查研究方法课件_第2页
第2页 / 共25页
双变量描述统计 社会调查研究方法课件_第3页
第3页 / 共25页
双变量描述统计 社会调查研究方法课件_第4页
第4页 / 共25页
双变量描述统计 社会调查研究方法课件_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《双变量描述统计 社会调查研究方法课件》由会员分享,可在线阅读,更多相关《双变量描述统计 社会调查研究方法课件(25页珍藏版)》请在金锄头文库上搜索。

1、双变量描述统计v交互分类表v简化相关与削减误差v相关分析两个定类变量:Lambda,tau-y两个定序变量:Gamma,dy两个定距变量:积矩相关定序变量与定距变量:相关比例 定类变量与定序变量: Lambda,tau-y定类变量与定距变量:相关比例与非线性相关v一元方差分析v一元回归分析相关分析的作用与种类 一、相关分析的概念及与函数关系的区别(一)相关关系:客观现象之间存在的相互依存关系 。相关分析:对现象间相关关系密切程度的研究。(二)相关关系与函数关系的区别函数关系:变量之间是一种完全确定性的关系,并 可用数学公式表示出来。相关关系:变量间不是完全确定的关系,且不能用 数学公式准确表示

2、出来。v二、相关分析的作用、确定现象之间有无关系。、确定相关关系表现形式。 3、确定相关关系的密切程度和方向。 三、相关关系的种类(一)按依存关系:因果关系、分不清因果的 依存关系。(二)按自变量的多少:单相关、复相关。(三)按相关形式:线性相关、非线性相关。(四)按相关关系的程度:不相关、完全相关 、不完全相关。(五)按相关关系方向:正相关、负相关。 Lambda相关测量法v含义:简写为,表明以一个定类变量的值来预测 另一个定类变量的值时,如果以众数作为预测的标 准,可以消除多少误差。0,1v公式:(对称) =(mx+my-Mx-My)/(2n-Mx-My)v(不对称)y=(mx+my)/(

3、n-My)v缺陷:若全部众数集中在某一行, y=0;若全部 众数集中在某一行和某一列, =0。性 别 男女总数总数表1 100名青年人的性别与志愿快乐家庭理想工作增长见闻10300101040y=(40+30-50)/(100-50)=0.40志愿Tau-y相关测量法v含义:属于不对称相关测量法,表明以一个定类变 量的值来预测另一个定类变量的值时,可以消除多 少误差。敏感性高于Lambda 。0,1v公式:E1=(n-Fy)Fy/nE2=(Fy-f)f/Fxtau-y=(E1-E2)/E1以表1资料为例,E1=40(100-40)/100+50(100-50 )/100+10(100-10)/

4、100=58E2=45tau-y=(58-45)/58=0.224Gammav同序对(same-order pair或concordant pair)异序对(different-order pair或discordant pair)同分对(tie pair):Tx、Ty、TxyvG=(Ns-Nd)/(Ns+Nd)分母表示预测任何一对个案的相对等级是可能犯的 错误;分子表示以一对个案在一个变量上的相对等 级来预测另一变量上的相对等级时所能减少的误差 。-1,1表表2 2 五所工厂的工人积极性与产量五所工厂的工人积极性与产量工厂工厂积极性等级积极性等级产量等级产量等级A AB BC CDDE E5

5、 55 53 33 33 33 34 41 11 11 1G=G=(2-42-4)/ /(2+42+4)=-0.33=-0.33dy 相关测量法vdy=(Ns-Nd)/(Ns+Nd+Ty) -1,1v续上例, dy=(4-3)/(4+3+2)=0.11vNs=m-1m-1 n-1n-1i=1i=1 j=1j=1mmn nk=i+1k=i+1 l=j+1l=j+1f fij ijf fk kl l( ( ) ) NdNdTyTy表表3 3 住户人口密度与婆媳冲突的关系住户人口密度与婆媳冲突的关系婆媳冲突婆媳冲突住户密度住户密度高高高高中中中中总数总数总数总数低低低低232320204 41111

6、555528288 827272424uuNs=6003Ns=6003NdNd=2204=2204TyTy=4141=4141G=0.463G=0.463dydy=0.308=0.308积矩相关系数vpearson积矩相关系数:判定两个变量相互关系密 切程度的指标,-1,+1决定系数r含义:以一个变量来预测另一个变量,能减少 的误差比例。0,12 2表4 某企业生产产品的月产量与生产费用资料如下:月产量 x生产费用 y回归预 测值1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.062 86 80 110 115 132 135 1601.44 4.00 9.61 14.44 25

7、37.21 51.84 643844 7396 6400 12100 13225 17424 18225 2560074.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.066.9 77.12 91.3 100.33 115 129.99 144.17 154.4936.4880207.54104,2144544.6880.0y y2 2简单线性回归模型v简单线性回归方程线性关系表现为正线性关系负线性关系没有线性关系最小二乘法最小二乘法的基本思想是:=Q2表5 Pizza连锁店的学生人数和季度销售收入数据连锁店学生人数x销售收入yxy1 2 3 4 5 6

8、 7 8 9 102 6 8 8 12 16 20 20 22 2658 105 88 118 117 137 157 169 149 202116 630 704 944 1404 2192 3140 3380 3278 52524 36 64 64 144 256 400 400 484 676合计1401300210402528Pizza连锁店的回归方程b=5 a=60如果我们相信,应用最小二乘法得到的回归方 程能满意的描述了x和y之间的关系,那么对 于一个已知的x就可以预测y值了。显著性检验F检验 离差平方和的分解v实际观察值和估计回归直线的离差称为残差 ,所以残差平方和是实际观察值关

9、于估计的 回归直线变异性的度量v估计量的标准误差构建新的统计量:F相关比率vCorrelation ratio,又称为eta平方系数(见些 为E 系数)v含义:根据自变量的一个值来预测因变量的 均值,能减少的误差比率。0,1v公式:2 2E E2 2= (Y-EY)(Y-EY)2 22 2 (Y-EY)(Y-EY) (Y-(Y-EYiEYi) )- -2 2= niEniE Yi - Yi - nEnE Yi Yi Y - Y - nEnE Y Y2 22 22 22 2表6 20名学生的家庭职业背景对语文水平的影响语语 文文 水水 平平: 得得 分分职业种类职业种类干部干部工人工人农民农民7878 82 82 9191 9090 8585 8181 838352 52 5959 7373 6161 8080 5151 6464 54548383 7575 8282 7878 80807 784.2984.29 4.404.408 861.7561.75 9.649.645 579.6079.60 2.872.87n ni iEYiEYi SiSiE =0.70 E=0.84 E =0.70 E=0.842 2vniEYi-nEYiY-nEY

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号