统计研究的程序与数据搜集方法

上传人:鲁** 文档编号:497945034 上传时间:2022-11-08 格式:DOCX 页数:12 大小:86.80KB
返回 下载 相关 举报
统计研究的程序与数据搜集方法_第1页
第1页 / 共12页
统计研究的程序与数据搜集方法_第2页
第2页 / 共12页
统计研究的程序与数据搜集方法_第3页
第3页 / 共12页
统计研究的程序与数据搜集方法_第4页
第4页 / 共12页
统计研究的程序与数据搜集方法_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《统计研究的程序与数据搜集方法》由会员分享,可在线阅读,更多相关《统计研究的程序与数据搜集方法(12页珍藏版)》请在金锄头文库上搜索。

1、统计研究的程序统计列表、图示、数据搜集方法A、为什么要搜集数据:数据是统计分析的基础日什么是数据搜集:根据统计研究的目的和要求,有组织、有计划地向调查对象搜集原始资料和次级资料。C数据来源数据来源直接来源间接来源实验问卷调查观察各类出版物(一)原始数据的搜集方法1、全面调查(1)定期统计报表制度:严格的报告制度指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度优点:能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要缺点:统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资料质量(2)普查:指国家为详尽了解某项重

2、要的国情国力而专门组织的一次性全面调查由于需要大量的人力、物力和财力,不宜经常进行最近的一次普查:2004年第一次全国经济普查我国人口普查:1953年1964年1982年1990年2000年2010年2、随机抽样调查:根据随机原则推算总体特征,又称概率抽样抽样调查是一种非全面调查,抽样推断的理论基础是概率论。特点:(1)按随机原则选样,即样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会(2)能够保证样本对总体的代表性,即样本单位和总体具有相同的概率分布(3)调查目的是从数量上推算总体数量特征和数量表现,它可以到全面调查的作用(4)抽样误差可以事先计算并控制优点

3、:(1)能用较少的人力、物力和时间达到全面调查的目的(2)调查资料的准确性较高、受人为干扰的可能性较小方式:(1)简单随机抽样,每个个体被抽中的机会相等;选择一个受试对象对其他元素没有影响;使用随机数表,抽签等方式。可以应用Excel中的随机函数rand()根据样本框安排随机样本*样本框:抽样过程中抽取样本的所有抽样单位的名单。如,从全体学生中,直接抽取200名学生作为样本,那么,全体学生的名单(花名册)就是这次抽样的样本框。例:在编号为1-100的学生中随机抽取随机编号=int(rand()*100)+1学会查看Excel的帮助文件( 2)等距抽样,又称机械抽样或系统抽样,常用于电话调查。例

4、如:从一个学生人数为200人的总体中抽取容量为20的样本,将学生的学号排序,假定随机选取学号起点4,然后从总体中选取样点的学号为第4,第14,第24,( 3)类型抽样,又称分层抽样,把总体某种分类标准分为若干群组,这些群组满足互斥性、完备性、和相似性要求,然后在组中按照同样的比例随机选取样本。特点:代表性高,抽样误差低。例如:调查对象按收入分为高、中、低三个层次,然后从每个阶层中或随机抽取( 4)整群抽样,又称聚类抽样。先对总体分类,然后用简单随机抽样选类,最后对选中的类作普查或简单随机抽样调查。较为有效。例如:按照家庭、宿舍楼或街区来抽取调查对象,对抽到的家庭、宿舍楼或街区再作全面或随机调查

5、。3、非概率抽样:不按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。缺点:( 1)由于调查者的主观决策影响抽样的整个过程,因而不能保证样本是否重现了总体的分布结构,样本的代表性往往较小,用这样的样本推论总体是极不可靠的。( 2)误差有时相当大,而且这种误差又无法估计。优点:( 1)很多情况下,严格的随机抽样几乎无法进行,例如调查对象的总体边界不清而无法制作或提供抽样框。( 2)有些研究为了符合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。( 3)随机抽样的操作过程要求严格,实施起来比较麻烦,费时费力,因此如果调查的目的仅是对问题的初步探索,获得研究的线索和提

6、出假设,而不是由样本推论总体,采用随机抽样就不一定是必须的。综上:操作方便、省钱省力,统计上也远较概率抽样简单,而且若能对调查总体和调查对象有较好的了解,抽样也可获得相当的成功。方式:( 1)典型调查在对调查对象有一定了解的基础上,有意识地选择个别或少数有代表性的单位进行调查的一种非全面调查典型单位指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量( 2)重点调查一种非全面调查,它是在被调查总体中选出一部分重点单位进行调查。这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,但只适用于客观存

7、在着重点单位的情况例如:对大型钢铁企业的调查可以了解全国钢铁的生产情况对35个大中型城市的物价调查可以了解全国的物价状况( 3)就近抽样(偶遇抽样、方便抽样、自然抽样)定义:是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。举例:为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生

8、作为调查样本的调查等等。( 4)目标式和判断式抽样(主观抽样、立意抽样):定义:调查者根据研究的目标和自己主观的分析,来选择和确定调查对象的方法。研究者依据主观判断选取可以代表总体的个体作为样本。样本的代表性取决于研究者对总体的了解程度和判断能力。例如:在编制物价指数时,有关产品项目的选择和样本地区的决定等,常采用判断抽样。( 5)滚雪球抽样:定义:当我们无法了解总体情况时,可以从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并询问他们知道的人。如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。例如,要研究退休老人的生活,可以清晨到公园去结识几位

9、散步老人,再通过他们结识其朋友。但是这种方法偏误也很大,那些不好活动、不爱去公园、不爱和别人交往、喜欢一个人在家里活动的老人,你就很难把雪球滚到他们那里去,而他们却代表着另外一种退休后的生活方式。滚雪球抽样是在特定总体的成员难以找的时最适合的一种抽样方法。譬如对获得无家可归者、流动劳工及非法移民等的样本就十分适用。( 6)配额抽样(定额抽样):它与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样。进行定额抽样时,研究者要尽可能的依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有

10、各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽量接近总体情形。例:假设某高校有2000名学生,其中男生占60,女生占40;文科学生和理科学生各占50;一年级学生占40,二年级、三年级、四年级学生分别占30、20和10。现要用定额抽样方法依上述三个变量抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表:男生(60)女生(40)文科(30)理科(30)文科(20)理科(20)年级一二三四一二三四一二三四一二三四人数129631296386428642配额抽样和分层抽样

11、的区别:A分层抽样总体进行分层时,通常依据的一种特征或指标,分层的目的是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小;而配额抽样则是依据多个特征,分层的目的是为了模拟出一个总体B分层抽样在每层进行抽样时,按照一定的比例进行随机抽样;而配额抽样则是根据每一层中分配的数额进行抽样C分层抽样完全根据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样;而配额抽样则是“按事先规定地条件,有目的地寻找”样本单位,在分层和抽样的过程中有很多的人为因素影响(二)次级资料搜集统计资料汇编刊物:各种统计年鉴、调查报告、统计摘要、网上电子资源有用的统计信息网站:中华人民共和国国家

12、统计局:中国统计数据经济中国中国商业报告库和百度也是常用的数据来源特别提示:要学会使用学校图书馆的免费数据库财政学系09级硕士生曾颖同学常用的数据库(详细内容见网络平台中的课件“曾颖的数据库”)1、国研网数据库特点:统计数据库包含宏观数据、金融、教育、行业数据等,但是宏观数据年度跨度不大。适合对个别指标进行跨省、跨时间的统一检索。另外有全文数据库等,包含一些专家学者的文章,可以作为参考。2、中经网&height=708特点:以宏观数据为主,包含国家一级、31个省以及200多个市的数据,与国研网的统计数据库类似,统计项目没有国研网多,但是有些指标年份跨度更大。适合统一检索。3、资讯行特点:非常全

13、的数据库,几乎囊括了所有最新的年鉴。适合寻找数据的来源。缺点在于:没有1995年之前的年鉴,数据不是表格形式,需要自己修改。(可行的方法包括:粘贴到word中,把空白(Aw)替换为制表符(N),或者直接粘贴到excel2007,进行数据分列)。4、统计局数据库特点:最近几年刚出的,还在完善中。可以对统计局出版的年鉴数据进行统一检索。(和1、2很相似)有时候能找到1、2所没有的数据。5、年鉴包括历年统计年鉴以及普查数据、专题数据等,适合浏览年鉴。实际上,目前很多最新年鉴,包括新中国六十年统计资料汇编、2010年统计摘要等都可以在网上下载到excel版本。6、知网文献非常全的学术文献数据库,包括了

14、期刊、学位论文、学术会议论文等。这个加上维普的话,基本上可以把中国比较好的期刊论文都包括了。年鉴中国统计年鉴数据库(挖掘版)&p=提供对统计年鉴的统一检索,但是效果不理想,比较凌乱。列出了500部左右的年鉴,比较全,但是不一定有最新的。可以先在资讯行搜索数据指标所属的年鉴,再在这里找到年鉴。三、调查误差1、登记误差:调查过程中,工作的不准确所造成的误差。(1)偶然性登记误差:调查人员责任心不强、技术不高所造成的观察、测量、计算错误、笔误、错填、遗漏,以及被调查者回答有误、理解有误。特点:一般不具有倾向性,即在数量不会偏向某一方,理论上它可以用某种方法加以消除(2)系统误差:具有明显的倾向性,在数量上往往偏向某一方,又称偏差。A、 有意误差:故意虚报、瞒报、假报、编造、有意歪曲事实。B、 非主观原因所引起的误差。测量工具的不准、调查方式安排不当。例如:使用非概率抽样方法进行的调查可能由于访问时的样本偏倚而出现误差案例1:1936年,富兰克林罗斯福(FranklinRoosevelt)的第一任总统任期届满,共和党候选人、堪萨斯州州长阿尔弗雷德兰登(AlfredLandon)与其竞选总统。为了预测大选结果,文摘杂志(LiteraryDigest)发出了1000万张模拟选票,收回万张。据此,文摘杂志预测兰登将以57%对43%的压倒性优势获胜,但选举的结

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号