文档详情

实证研究的设计

suns****4568
实名认证
店铺
PPT
213KB
约52页
文档ID:85175671
实证研究的设计_第1页
1/52

第三部分 实证研究的设计,一 实证研究的本质 二 研究设计在实证研究中所扮演的角色 三 实证研究中的变异量控制,一 实证研究的本质,社会科学中的实证研究取向 * 主张进行科学的测量,如通过试验或者问卷 得到数据 * 判断变量因果关系的前提 实证研究的资料收集 * 研究数据的来源:直接观察;借助测量工具 用于可直接观察和不可以直接观察的对象,实证研究的一般过程,概念与观测,一、概念化 二、建构与测量 三、效度 四、信度 五、测量的原则 六、指数与量表,测量的过程,如果我们要测量一个复杂的概念,如核心能力、吸收能力,则并无现成的测量工具,这时发展测量工具也就成为了研究中的一项重要任务通常,测量是一个演绎过程,先选取一个概念、建构(construct),再发展出一个测量工具,然后进行经验观察测量始于对概念的分析(定义)选取概念 或建构,,发展测量 工具,进行经验 观察,,从抽象建构到具体的测量工具,,能否对以上建构进行通则化?,概念化,概念化是清楚地定义名词的含义的过程,使一般的概念成为经过系统处理的、有秩序和结构的概念 纽曼给出了一个如何研究教师工作士气的例子首先可以收集各种有关士气的解释,如“有信心、开朗、团结、努力的心理状态”;再向教师请教,他们对与工作有关的一些事物的感觉,如学校声誉、学生的学习态度;再思考士气的分析单位(是个人特质、团队特质,或兼有之?)。

概念型定义(conceptual definition),概念化其实就是给出概念型定义 概念型定义:使用其他概念或原始术语(primitive terms)、延伸术语(derived terms)来描述一种概念的定义 原始术语:无法被其他概念定义,如颜色、声音等;原始术语应当是明确的 延伸术语:可以用原始术语来定义 定义必须指出被定义者的独特属性或性质,包含被定义者涵盖的所有案例,并排除不应涵盖的案例定义应该使用清楚的术语,不应陷入循环论证操作化,操作化是指寻找或创造对某个建构适用的测量方法的过程 假定我们把士气确定为整个教师团队的工作心态,又如何测量呢? 可以把士气作为因变量,用一组自变量解释之 也可以进行间接测量,请学生、教学管理人员进行评价操作型定义(operational definition),操作化就是给出操作型定义 许多概念代表的经验属性无法被直接观察到,如“顾客满意”;研究者必须推论概念在经验上的存在性 操作性定义描述一组研究者可以遵循的程序,以建立由概念所描述现象的存在性当现象不能被直接观察时,科学家就必须使用操作型定义 操作型定义可以衔接理论-概念层次和经验-观察层次。

操作型定义就是要定义要做什么和观察什么由概念转变为观察的层级,疏离(estrangement):一种原先曾经联系在一起,现在却分离的感觉;原先的价值、行为合期望曾经融为一体,现在却发生了裂缝 许多管理研究成果只有发展出测量工具后,才具有了可操作性,如顾客满意度的评测、平衡计分卡等 许多人认为“If you can’t measure it, you can’t manage it.”建构的含义,纽曼的解释:“建构是一个经过系统处理的,把观念、事实与印象加以有序排列的想法”也可以说,建构是我们想到的一种构造 有些建构很简单,如投资效益;有些则可能包含很复杂的内容,如吸收能力 反映型指标:组织支持(重视员工福利、关心员工的成长、改善员工的工作环境等) 形成型指标:社会经济地位(教育水平、工资收入、家庭背景等),测量的等级,根据测量的精确程度,可以把测量的尺度分为四种类型: 类别(nominal)——变量值之间没有顺序关系 等级(ordinal)——变量值之间存在着顺序关系,但不能反映出大小的程度严格地讲,对等级变量不能计算算术平均数 等距(interval)——每个邻近测量值的“距离”固定,且可以使用这种“距离”(如温差)测量对象的大小。

等比(ratio)——当变量具有绝对零点时,它们就可以用比例尺度来测量(如收入、地理距离可以用比例测量,“我比你多走了30%的路”)测量的信度与效度,信度(reliability)与效度(validity)是科学测量的核心议题 信度是指一个指标可信赖的程度 可信的指标在每次测量相同的事物时应该能够得到相同的结果 效度是指测量能否正确地反映所研究概念的意义 例:面试成绩能否反映学生的综合素质?,三、效度,在测量中,效度关注于这类问题: 我正在测量我想要测量的项目吗? 三类测量效度,即内容效度、经验效度和建构效度开始讨论内容效度,内容效度所触及的问题是:测量工具将所定义的内容都代表出来了吗?或者说,测量工具适用于测量对象吗? 表面效度 表面效度是某些指标确实能测量某个建构增强表面效度的主要方式,是通过文献分析,把握住公认的测量工具 抽样效度 抽样效度关注的是母体内的各种内容,是否被测量工具(如问卷)充分抽样,经验效度,经验效度关注测量工具与测量结果的关系 经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度 (predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。

构念效度(construct validity),构念效度可以被理解为理论建构的有效性,(研究者选用的工具是否与其所采用的理论假设和概念是否紧密联系在一起). 纽曼:构念效度表现为多重指标测量相同(异)建构时能产生趋同或相区别的结果如果在理论层次上﹐概念X和概念Y是相关的﹐那末﹐在经验层次上对X的测量 与对Y的测量 也相关﹐假如有另一个对X的测量﹐则它也应该与Y的测量 相关﹐这就称作构念效度 例如﹐X为“工作积极性”﹐Y为“对业余学习的重视”﹐X与Y在理论层次上是相关的﹐即工作积极性愈高对业余学习也愈重视将 X以 (对“工作有奔头”的赞成程度)来测量﹐将Y以 (每天进行业余学习的时间)来测量﹐ 与 必然相关现若 X有另一测量法 ′(工作量完成的多少)﹐若 ′与 的测量结果是相关的﹐则称 ′具有构念效度趋同效度,四、信度,信度在社会科学研究中尤其重要,因为许多建构本身都是模糊的比如我们要衡量企业“吸收能力”,如果没有一个清晰的建构,企业管理人员会根据他们自己的理解来判断这一能力的重要性,我们所得的结果就会缺乏可信性稳定性信度,稳定性信度(stability reliability)是跨越时间的信度,它触及的问题是:如果在不同的时间使用同一个测量工具进行测量,能否获得相同的答案。

例:面试的稳定性信度 假如考题数量少,每个面试者出场后又会和待试者讨论,则面试成绩的稳定性信度就会下降代表性信度,代表性信度(representative reliability)是跨越群体的信度,它触及的问题是:如果使用同一个测量工具对不同的群体进行测量,能否得到相同的答案 例:在调查问卷中经常有对受访者收入的调查,假如低收入者倾向于报高自己的收入,高收入者倾向于报低收入,这个工具的代表性信度就较差 为了提高代表性信度,可以现在小范围内进行检验,(subpopulation analysis),等值信度(equivalence reliability),是使用多重测量工具的信度,它所触及的问题是:不同的指标测量相同的建构能否得出一致性结果 一些研究人员使用折半法(split-half method)来检查等值信度例如,问卷有十四个问题,都是问及对某一事物的偏好,把问题随机分成两组,以检验等值信度增进信度的途径,清晰地概念化所有的建构 使用精确的测量等级 使用多重指标 进行试测,五、测量的原则,测量理论的核心是所谓的测量方程式 X = T + S + R X:实际观测值; T:真值; S:系统误差; R:随机误差,非系统的无法避免的误差. 当测量是完美的时候,X = T ,当测量次数越来越多时,随机误差的影响就会减小。

系统误差有许多来源,比如测量缺乏稳定性信度,就会影响到测量效度异质观察的原则,异质观察(heterogeneous observation)是指在所有情形都相同的情况下,各种不同的或异质观察要比一个或许多相近的观察,能够提供更强而有力的证据 两个应用这个原则的方式是: 复制(replication) 三角校正法(triangulation),复制与复制失败的原因,理想的复制是由另一个完全不同的研究者重复同样的研究 复制失败的原因 原始的因果关系的确存在,但复制的情况有所不同,原始因果关系中还存在未说明的情况 复制采用的程序不同,因此不是真正的复制 原始的因果关系是虚假相关 原始的因果关系根本不存在三角校正法,从不同的角度观察事物,以便确实掌握它的正确位置 对管理人员的能力测评就是三角校正法的一个例子六、指数与量表,指数与量表是两类经常使用的测量工具 指数通常是用多个指标合成的一种分数,许多指数都是等距变量 如果定义“学校质量指数”以反映学校质量的变化,我们可以说指数升高或降低,但不能说升高了一倍,因为这个倍数没有实际意义 量表通常用来测量人们的感觉的程度,绝大部分量表都是等级变量构造一个指数,选择一组具有表面效度的指标; 一套测试题从表面看来是否是合适的。

例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度 确定指标的权重; 解决漏失资料问题; 某些研究对象的某个指标值可能不完整; 对指数进行标准化处理 例:我们可以通过给金、银、铜牌不同的权重来定义“奖牌指数”,如果把这个指数除以各国的人口数量,所得结果就更具可比性了量表的尺度,尺度即测量单位的类型:名义尺度、顺序尺度、等距尺度、比例尺度,其对应的测量方法为定类、定序、定比和定量,两种典型的量表,李克特(Likert)量表是经常使用的量表通常用来测量人们对某些事物的态度、或认知程度 使用李克特量表时,我们总是要求受调查者从一组选项中选出一项当选项的数量太多时,就会使人感到困惑常用的量表只有五或七项 沙司通(Thurstone)量表是根据受调查者对某些问题的判断来测定其态度 这个方法首先搜集一系列有关所研究态度的陈述或项目,而后邀请一些评判者将这些陈述按从最不赞同到最赞同方向分为若干类,譬如11类经过淘汰、筛选,形成一套约20条意义明确的陈述,沿着由最不赞同到最赞同的连续统分布开来要求参加态度测量的人在这些陈述中标注他所同意的陈述,所标注的陈述的平均量表值就是他在这一问题上的态度分数。

讨论:新型社会资本量表的开发,社会资本(Social Capital)是资本的一种形式,是指为实现一工具性或情感性的目的,透过社会网络来动员的资源或能力的总和社会资本在社会学,经济学,组织行为学,管理学,以及政治学等学科中,都是一个很重要的概念通过研究人际间的关系结构、位置、强度等,可以对社会现象提供更好的解释各种类型的社会资本,宏观的社会资本、微观的社会资本 论企业家的社会资本运作空间与地区经济的发展 社会资本、文化偏差和在高科技公司中的国外投资:来自中国的证据 组织内社会资本、组织外社会资本 组织成员信任的研究 Social capital and value creation: the role of intrafirm network 个体社会资本、集体社会资本 企业家的社会资本对创业活动的影响 高管团队的社会资本对战略选择的影响,新的问题,从员工到企业家角色转换过程中社会资本的可转移性可否度量?如何度量?,第四部分 二手数据在研究中的使用,二手数据传统与贡献 二手数据的优点 三 把定性数据。

下载提示
相似文档
正为您匹配相似的精品文档