传播学研究方法统计初步推论统计的基本原理

资源描述

《传播学研究方法统计初步推论统计的基本原理》由会员分享，可在线阅读，更多相关《传播学研究方法统计初步推论统计的基本原理（48页珍藏版）》请在金锄头文库上搜索。

1、统计初步推断统计的基本原理,2,“分布”,3,直方图用长条的面积来表示频次或相对频次；折线图用直线连接直方图中条形顶端的中点；当组距逐渐减小时，折线将逐渐平滑为曲线。,某报100期新闻数量的频率分布直方图,25,26,29,31,33,35,新闻数量（条）,频率,30,27,28,32,34,36,20%,10%,15%,5%,25%,200期新闻数量的频率分布直方图,频率,新闻数量（条）,25,26,27,28,29,30,31,32,33,34,35,36,5%,10%,15%,20%,25%,样本容量增大时频率分布直方图,频率,总体密度曲线,新闻数量（条）,总体密度曲线,新闻数量

2、（条）,8,一、正态分布,9,1.1 什么是正态分布？,1、由德国数学家高斯提出，也叫高斯分布； 2、自然界、社会经济生活中大量存在的分布规律； 3、经典统计推断的基础； 4、在所有的分布中，正态分布居于首要位置；,10,1.2 正态分布的基本特征,特征一：一个高峰特征二：一条对称轴特征三：一条渐近线,M0Md=,众值=中位值均值,11,1.3 两个参数的影响（，）,均值（读“miu”）,标准差（的小写形式，读“西格玛”）,形状参数,位置参数,12,1.3.1 对正态曲线的影响,1 2 3,正态曲线的位置由均值决定；,13,1.3.2 对正态曲线的影响,曲线A和B的比较,1

3、4,正态曲线的形状“高，矮，胖，瘦”的特点由标准差决定；当较小时，曲线“高”且“瘦”；当较大时，曲线“矮”且“胖”。,15,1.4 正态曲线下面积的涵义,随机变量的频次总和；一般把正态曲线下的总面积约等于1，这时一定区间内的频次分布表现为概率分布。,16,1.5 正态曲线的一个重要性质,无论正态曲线具有哪种均值和标准差，在均值和横坐标某一点的距离内（用标准差来表示）曲线下的面积是常数。下图说明此意。,17,正态曲线下的面积（图）, -, + ,68.26%,95.44%,二、抽样分布,三种分布：总体分布、样本分布、抽样分布,总体中各元素的观察值所形成的分布分布通常是未知的可

4、以假定它服从某种分布,总体分布 (population distribution),一个样本中各观察值的分布也称经验分布（Empirical distribution ）当样本容量n逐渐增大时，样本分布逐渐接近总体的分布,样本分布 (sample distribution),抽样分布 (sampling distribution),抽样分布的形成过程,是一种理论概率分布样本统计量是随机变量样本均值, 样本比例，样本方差等结果来自容量相同的所有可能样本是进行推断的理论基础，也是抽样推断科学性的重要依据,例：假设有10个人，他们接受教育的年限分别为6,7,8,9,10,11,12,13

5、,14,15年。如果一次抽1个人，那可以有10种抽样方法，可得出10个样本统计值的分布；如果一次抽2个人，那么有45种抽样方法，可以得出45个样本统计值的分布；,如果一次抽3个人，那么有120种抽样方法，可以得出120个样本统计值的分布；如果一次抽4个人，那么有210种抽样方法，可以得出210个样本统计值的分布；如果一次抽5个人，那么有252种抽样方法，可以得出252个样本统计值的分布；,三、统计推断,统计推断,点估计,区间估计,参数估计,假设检验,参数假设检验,非参数假设检验,29,样本与总体, 总体(Population) 所关心的所有元素的集合样本(Sample

6、) 从总体中按一定方式抽取出的一部分元素的集合,30,统计量与参数值, 参数值(Parameter) 总体的数字特征，通常用希腊字母表示；例如总体均值，总体标准差；统计量(Statistic) 样本的概括性测度值，通常用罗马字母表示；例如样本均值，样本标准差S。,（一）参数估计 1.点估计 (point estimate),用样本的估计量直接作为总体参数的估计值例如：用样本均值直接作为总体均值的估计例如：用10位同学的平均身高来估计全班同学的平均身高。没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,2、区间估计 (interv

7、al estimate),在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如，某班级平均分数在7585之间，置信水平是95%,区间估计的图示,（二）假设检验,8.1,若对参数有所了解,但有怀疑猜测需要证实之时,用假设检验的方法来处理,假设检验的一般步骤,3.抽样，根据样本观察值确定接受还是拒绝H0,假设检验的一般提法是：在给定备择假设H1下，利用样本对原假设H0作出判断，若拒绝原假设H0，那就意味着接受备择假设H1，否则，就接受原假设H0。反证法,为什么

8、要通过检验原假设来检验研究假设？,张三、李四在考试中有没有舞弊？曾参杀人、三人成虎的故事？,假设检验的基本思想,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,怎么通过检验原假设来检验研究假设？通过显著性水平显著怎么理解？试着用“显著”造句。发生概率小才称显著。我们常说少见多怪, 也是这个意思，见到概率小的事件,当会另眼相看(显著)。简而言之，显著性水平，就是小概率的标准。,显著性水平即小概率水平为多少？概率是01之间的一个数，因此小概率就是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准，也就是0.05，

9、从此0.05或比0.05小的概率都被认为是小概率。 Fisher没有任何深奥的理由解释他为什么选择0.05，只是说他忽然想起来的常用的值有0.01, 0.05, 0.10,小概率原理发生概率很小的随机事件（小概率事件）在一次实验中几乎是不可能发生的。根据这一原理，可以先假设总体参数的某项取值为真，也就是假设其发生的可能性很大，然后抽取一个样本进行观察，如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大，则说明原来假定的小概率事件在一次实验中发生了，这是一个违背小概率原理的不合理现象，因此有理由怀疑和拒绝原假设；否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。,小概率

10、原理举例：,某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件，经检验有4件次品，问这批产品是否能出厂? 如果假设这批产品的次品率P4，则可计算事件“抽10件产品有4件次品”的出现概率为：可见，概率是相当小的，1万次实验中可能出现4次，然而概率如此小的事件，在一次实验中居然发生了，这是不合理的，而不合理的根源在于假设次品率P4 ，因而认为假设次品率P4是不能成立的，故按质检部门的规定，这批产品不能出厂。,假设检验的两个特点：,第一，假设检验采用逻辑上的反证法，不直接检验一个H1（备择假设）是否成立，而是通过检验相反假设H0（原假设）是否成立来达到目的。,第二，假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的，而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件，并没有统一的界定标准，而是必须根据具体问题而定。如果一旦判断失误，错误地拒绝原假设会造成巨大损失，那么拒绝原假设的概率就应定的小一些；如果一旦判断失误，错误地接受原假设会造成巨大损失，那么拒绝原假设的概率就应定的大一些。小概率通常用表示，又称为检验的显著性水平。通常取0.05或0.01，即把概率不超过0.05或0.01的事件当作小概率事件。,理论是灰色的方法是苍白的生命之树常青（对理论和方法的思考最终又要回到生活和生命）,

展开阅读全文