高级社会统计学_复习资料.doc

上传人:hs****ma 文档编号:543096245 上传时间:2023-04-02 格式:DOC 页数:8 大小:46KB
返回 下载 相关 举报
高级社会统计学_复习资料.doc_第1页
第1页 / 共8页
高级社会统计学_复习资料.doc_第2页
第2页 / 共8页
高级社会统计学_复习资料.doc_第3页
第3页 / 共8页
高级社会统计学_复习资料.doc_第4页
第4页 / 共8页
高级社会统计学_复习资料.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《高级社会统计学_复习资料.doc》由会员分享,可在线阅读,更多相关《高级社会统计学_复习资料.doc(8页珍藏版)》请在金锄头文库上搜索。

1、高统期末考试资料整理1、参数:是一个变量。我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。备择假设有三种形式,以H0为 =Z0为例,当

2、H0被否定,可能被采用的H1为 Z0, Z0或 Z04、非参数检验:也称自由检定法,指对分布类型已知总体进行参数检验之外,所有检验方法的总称,这类方法的使用不需要对总体分布作任何事先的假定,例如:正态分布等,同时从检验内容来说,也不是检验总体分布的某些参数,例如均值等,而是检验总体某些有关的性质。5、非参数检验与参数检验的区别非参数检验的限制比参数检验少,无需任何假定,无需限制变量类型,且计算量小,简单易行 但非参数检验与参数检验相比,效率较差,不精确,检验相同的问题,需要比参数检验更大的样本量非参数检验显著,参数检验不一定显著,但参数检验显著,非参数检验必定显著6、选择相关系数的标准 看两个

3、变量的变量层次 看两个变量是否对称7、假设检验与区间估计的逻辑有哪些不同不同 假设检验从总体到样本,即事先对总体参数值或分布形式作出某种假设,然后利用样本来判断这个原假设是否成立区间估计从样本到总体,即根据样本计算出一个范围来对未知参数进行估计相同:区间估计与假设检验的统计处理时相通的,实际上假设检验的接受域也正是区间估计的置信区间8、相关关系的特点:现象之间确实存在着数量上的依存关系。就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。现象间的数量依存关系值是不确定的。就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。9、相关系数:指

4、线性相关系数,对两个变量之间线性相关程度的度量。相关程度有强弱之分,一般是在-1到1之间,相关系数越趋于0,关系越弱,相关系数与趋于绝对值1时,关系越强。10、参数估计:即根据抽样结果合理地、科学地猜测总体参数的具体值或其范围。参数估计包括参数的点估计和区间估计两种11、统计值:关于调查样本中某一变量的综合描述,是样本特征值,如样本均值,成数及方差12、置信水平:指总体位置参数落在置信区间内的概率。用(1-a)表示,常用的置信水平有99%,95%,90%13、变量分为哪几个层次?定类变量与定序变量之间的相关系数是什么?变量分为四个层次,即定类变量、定序变量、定距变量和定比变量。相关系数是eat

5、214、我们通常根据哪些原则确定原假设与备择假设?推荐答案:原假设是关于总体间参数值相等或总体分布符合某种分布的假设,是待否定的假定,与之相对立,备择假设是指总体间参数值不相等或总体分布不符合某种分布的假设,是待选择的假设原则二:原假设往往是研究者不愿接受而期待拒绝的假设,备择假设往往是研究者希望去证实并且期待接受的假设,研究中的假设一般是备择假设,通常先设立备择假设,再对立的设定原假设原则三:如果研究的目的只在于分析事物间是否有差异,不强调哪个比哪个好,这种情况下的假设比较容易,可以根据原则去理解和假设,这时进行的是双侧检验的情形,原假设设定为H0:U=U0等,备择假设随即设定为其对立面原则

6、四:如果研究的目的在于分析事物哪个比哪个好,这时可以根据原则二去理解和假设,如题目中问“是否更长,大”,即进行右侧检验,原假设设定为:H0:UU0等,反之,则进行左侧检验,原假设为H0:UU0等。15、何为列联表?制作列联表的原则有哪些?1)列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。2)制作原则:第一行是自变量的取值,第二行是因变量的取值16、接受域:接受H0的区间,抽样所获数据计算的统计量值小于临界值,则接受H0。17、临界值:把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率即为显著水平,(Z)=1-,Z

7、称作临界值。(详见教材p232)18、推断统计:主要用于抽样调查,以抽样调查获得的信息材料通过推断统计进行简化处理,以便从样本的统计值推断总体的参数值。19、抽样分布:指统计量的分布。抽样分布是在同一总体反复不断抽取不同样本时,各个样本可能出现的样本统计值的分布情况20、假设检验中选择统计量的一般原则是什么?假设检验是通过样本计算某个统计量进行的,选择统计量的一般原则首先是确定是大样本还是小样本,然后根据总体方差是一直还是未知选择统计量21、试比较相关系数与回归系数的关系相关系数r表示的是两变量之间的疏密程度,回归系数b是回归直线的斜率,说明回归直线的陡度。相关关系r表现了真实数据与回归直线靠

8、拢的程度22、总体均值检验时,哪些情况下可以使用Z检验答:总体均值检验使用Z检验时的假定条件如下: 连个样本都是独立的随机样本 两个总体都服从正态分布 如总体不服从正态分布,可以用正态分布来近似23、小概率原则:它是假设检验的基本思想,包括两个部分,一是指概率很小的随机事件在一次观察中不可能出现;二是如果小概率事件在一次观察中出现了,那么假设就是错误的。(小概率原理:在日常生活中,人们习惯于把概率很小的事件,当做在一次观察中不可能出现的事件。)24、散点图:散点图是相关关系的图形表示,数据点在直角坐系平面上的分布图。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的回归方程对数据点进

9、行拟合。25、回归方程:是研究自变量x不同取值时,因变量y平均值的变化。当因变量y的平均值与自变量x呈线性规律时,称做线性回归方程。26、拒绝域:是在显著性水平a下,小概率事件发生后,拒绝原假设H0的区间。27、简述点估计与区间估计的含义。他们之间的区别与联系有哪些1)点估计:指用样本计算出来的一个数来估计未知参数,由于它只是一个点值所以称为参数的点估计。2)区间估计:是通过样本计算出一个范围来对位置参数进行估计3)区别4)联系28、简述置信度和置信区间的含义,并说明他们之间的关系是什么1)含义:用Q(X1,X2,X3.Xn)作为未知参数Q的估计值,那么包含未知参数估计值的区间就为置信区间;用

10、置信度1-a来测量置信区间估计的可靠性2)关系:在样本容量一定的情况下,置信区间和置信度是相互制约的,置信度越大,即估计的可靠性愈大,则相应的置信区间也愈宽,估计的愈不精确,例如,某班的考试成绩,如果估计区间为0-100分,显然这样的估计永远可靠,因为任何考试的结果,平均成绩都不会超出估计的范围总之,置信度与置信区间的关系表达式:相互制约,置信度越大,置信区间越宽。 29、中心极限定理对社会调查的意义有哪些?中心极限定理在社会调查中有着重要的意义。因为在抽样调查中被研究对象的总体分布往往是未知的。在这种情况下,中心极限定理告诉我们,只要样本容量足够大,样本均值的分布都是已知的,且都接近正态分布

11、。这样就给未知分布总体的研究奠定了理论基础,对社会调查有着很实用的理论意义。30、PRE:指消减误差比例,就是表示用一个现象来解释另一个现象时,能够减除百分之几的错误。在测量变量的相关程度时,假定现象x与现象y有关,用x去测量y的误差的相对差值与不知y与x有关时预测y的全部误差之比:即PRE=(E1-E2)/E131、独立样本:从两个总体中分别独立的随机抽取一个样本进行比较研究32、相关样本:又称配对样本。它只有一个样本,但样本中每个个体要先后测量两次,这样所有个体先观测的值看做是来自第一个总体的样本值,所有个体先后观测的值看作是来自另一个总体的样本值,以此来比较研究连个总体之间的不同。33、

12、非对称关系:数学中,若 R为集合A到B上的关系,对集合中任意元素a与b(aA,bB),下述语句保持有效,则A到B上的二元关系R是非对称的:若 aRb,且 bRa ,那么,a = b 。其数学表述为:任取aA,bB, aRb且bRaa=b。34、为什么要进行假设检验,简述假设检验的步骤。1)原因: 社会现象具有随机性或非确定性,同时也有规律性 一切具有随机性质的社会现象进行局部推论总体时难免有误会 当总体很大时,一般都采用抽样调查来检验命题假设 假设检验实际上就是人们来意常识性地进行盘顿和决策的小概率原理2)步骤: 根据实际问题作出假设,假设包括原假设H0和备择假设H1两部分,原假设必须写出,备择假设在双边检验的情况下可不写根据样本确定合适的检验统计量根据问题的需要给出显著性水平的大小搜集数据,计算检验统计量的值作出统计决策,若样本统计量的值落入拒绝域,则拒绝H0接受备择假设H1,否则接受H035、假设检验会犯哪两类错误,犯第一类错误的概率是什么。(1)弃真错误:原假设为真时拒绝原假设,在统计中称第一类错误,犯第一类错误的大小就是显著性水平a(2)纳伪错误:接受了未知的不真实状态,把假当成了真,它是在接受原假设时出现的错误,称作第二类错误,犯第二类错误的概率用 b表示36、假设检验和区间估计逻辑有何不同。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号