论随机抽样文献综述论文范文

上传人:小** 文档编号:54329192 上传时间:2018-09-11 格式:DOC 页数:16 大小:80KB
返回 下载 相关 举报
论随机抽样文献综述论文范文_第1页
第1页 / 共16页
论随机抽样文献综述论文范文_第2页
第2页 / 共16页
论随机抽样文献综述论文范文_第3页
第3页 / 共16页
论随机抽样文献综述论文范文_第4页
第4页 / 共16页
论随机抽样文献综述论文范文_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《论随机抽样文献综述论文范文》由会员分享,可在线阅读,更多相关《论随机抽样文献综述论文范文(16页珍藏版)》请在金锄头文库上搜索。

1、 论随机抽样文献综述论文范文论随机抽样文献综述论文范文论随机抽样文献综述论文范文 导读:.11.随机 抽样样本容量确定的影响因素11.1 随机抽样概 念介绍11.2 随机抽样样本容量确定. .11.2.1 样本容量影响因素的定性分析. . 应用随机抽样期末论文的总结应用抽样技术论文 题 院 专 姓 学 目:随机抽样文献综述 系: 业: 名: 号: 指导老师: 2012 年 12 月 31 日 1摘要抽样技术已广泛应用于社会、经济、自然、科学等各个领域, 成为获取统计 数据的重要手段, 而随机抽样更是抽样技术中的主 要抽样方法。 本文通过对随机 抽样的样本容量的影响因素进行定量和定性的分析,并对

2、随机抽样的 Alias 算法 和随机交换抽取法进行了介绍和改进, 最后针对随机抽样在分为点随机配对抽 样、并行工程项目调度、等 距抽样和一致性平面拟合等方面应用的介绍,找出适 合组合随机抽 样算法的高效率优先规则,并优化组合随机抽样算法,发现随机抽 样在实际中的应用和发展前方向。关键词:随机抽样 样本容量 算法改进 i随机抽样文献综述 目录摘要 i 目录 I 前言 1 1.随机抽样样本容量确定的影响因素 1 1.1 随机抽样概念介绍 1 1.2 随机抽样样本容量确定 1 1.2.1 样本容量影响因素的定性分析 . 1 1.2.2 样本容量影响因素的定量分析 . 2 2.随机抽样的算法改进 3

3、2.1 随机抽样中的 Alias 算法及其改进 3 2.1.1 Alias 算法 . 3 2.1.2 对 Alias 算法的改进. 4 2.2 随机抽取交换法及其改进 5 2.2.1 随机抽样交换法 . 5 2.2.2 随机抽样交换法 3 4 5 6 7 8 9 10 论随机抽样文献综述论文范文 导读:抽样误差,以提高抽样精度。 1.2 随机抽样样本容量确定近年来,随机抽样样本容量的确定问题成 为抽样调查理论和实践中普遍关注的一个问题,这起源于样本容量 确定的两难困境:12345678910 的改进 . 5 3.随机抽样的应用 6 3.1 分位点随机配序抽样 6 3.2 随机抽样在并行工程项目

4、调度的应用 7 3.3 改进的随机抽样算法在等距抽样中的应用 8 3.3.1 改进的随机抽样算法 . 8 3.3.2 该算法在等距抽样中的应用. 8 3.4 随机抽样一致性平面拟合的应用 9 4.结论. 10 论随机抽样文献综述论文范文 导读: 样本容量过小,则估计 量 方差过大,统计推断的可信度降低,或者在进行假设检验时,犯 第二类错误的 概率变大;而样本量过大,会浪费人财物力,且调查 周期延长,从而丧失抽样 调查相对于全面调查的优点。 所以,如何寻找一个合适的样本量,既能使样本 充分地代表总体, 又能保证抽样调查耗时少、费用低的优点,这成为抽样理论 和实践 都必须要面对和回答的课题。1.2

5、.1 样本容量影响因素的定性分析 (1)精度 随机抽样调查中, 精度被用来衡量抽样调查结论和实际情况之间的差别, 差别越小, 精度越高,反之亦然。对精度的要求通常以允许的绝对误差 d 或允 1随机抽样文献综述 许的相对误差 r 来表示,d 和 r 是在一定的概率保证程度下的绝 对或相对误差。直观地,样本容量越大,样本就越接近总体,所获得的结论就越精 确,要想通 过抽样调查获得比较高的推断精度,样本容量就要尽可 能的大。(2)费用 费用是指进行抽样调查付出的成本。 我们可以把费用一分为固定费用和可 变费用,固定费用与样本量无 关,如管理人员开支,办公费,场租费等;可变 费用即每调查一个 样本单元

6、所需的费用,包括诸如调查费,差旅费,礼品费等。单位可变费用一定的条件下,样本容量越大,所需费用越大。 费用和精度是一 对矛盾:如果样本容量较大,那么统计推断的精度 较好,但费用较高;如果样本 量较小,那么统计推断的精度较差, 但费用较低。(3)其他因素 有效样本比率。 在抽样调查中,并不是所有样本单位都是有效的,有些样 本单位可 能是不合格的,即不可用的;问题的重要性,对那些有重要决策价 值 的调查,所需的信息要比较精确,因此样本量要多一点;所研究 问题的目标量 的个数,为满足多目标研究的需要,通常也要将样本 量适当放大;调查问卷的 回收率,在抽样调查中,不是所有的调查 对象都会积极配合,有些

7、会拒访或因 种种原因接触不到或实际上接 触不到,这时要放大样本量;调查的时效性,有 些调查有时效限制, 也就是说规定了一个最后期限,如果调查的时间超过了最 后期限, 那么调查的结果是没有意义的,一般的,为了保证调查的时效性, 要 适当地减少样本量。1.2.2 样本容量影响因素的定量分析 影响样本容量的因素除了精度 和费用之外,大都很难量化,本问题对精度 和费用与样本容量的关 系进行定量分析,此分析基于参数估计展开,包括参数 估计和假设 检验。 参数估计中最为重要的就是对总体均值的估计。 在不同的抽 样调查目的下,抽样统计方法不相同,其统计推断公式 也有差异,所以对样本 容量的定量研究方法也就会

8、不同。(1)精度 假设要估计的总体参数为 ,通过抽样调查所获得的估 计值是 ,概率保 证 程 度为 1 , 绝 对误 差为 d,相对误差 r,基于抽样调查理论,有p 1 或 p r 1 即估计值 和总体的实际参数 之间的 3 4 5 6 7 8 9 10 论随机抽样文献综述论文范文 导读: 绝对误差小于 d 的概率为 1 , 和 之间的相对误差小于 r 的 概率为 1 。 2随机抽样文献综述 根据中心极限定理,我们有结论:只要样本容量足够大, 就近似服 从正态分 布。 从而有 d t V ( ) ,其中 t 为标准正态分布的双侧 分位数。 对相对误差 限有: r t 代替。(2)费用 最简单的

9、费用函数可表示为线性的: C c0 c1n ,其中 C 为总费用, c 0 为 固定费用, c1 为单位可变费用。 一般而言, c 0 和 c1 可以通过一定的方法获得, 从而可以获得 n 和 C 之间的数量关系。(3)精度和费用对样本容量的综合影响 前面独立地讨论了精度和 费用对样本容量的影响,二者的数量关系结论矛 盾的,有必要将二 者综合起来,得出一个最优的样本容量。 基本的思路是构造 损失函数,对损失函数有如下要求:要同时包含 精度和费用两个因素;函数所反 映的损失对精度和费用的数量对应 关系要正确, 精度和损失为反比关系:精度越 好,损失越小;精度越 差,损失越大;形式要力求简单,便于

10、确定样本容量的最 优值,最 常用的损失函数有两种:加法型和乘法型。 V ( ) t S ( ), 在实际问题中 往往是未知的, 可以用其估计值 来 2.随机抽样的算法改进好的抽样随机算法可以有效地提高样本的抽 取效率。 因此,对随机抽样算 法, 特别是样本元素不重复的随机抽样算法 的研究和改进具有一定的实用价值。传统的随机抽取比较法,将抽得的元素与前面已经抽得的元素进行 比较,若相 同则丢弃,若不同则保留,直到完成抽取任务。 基于窗口的随机抽取算法和基 于元素交换的随机抽取算法属于随机 抽取交换法,给出了几种进的算法: 2.1 随机抽样中的 Alias 算法 及其改进 AJ, pi 1 构造一

11、个满足下面原则的 i 1 m 3随机抽样文献综述 表示 T Ai , Bi , P( Ai ), i 1,2, m, 并且有:pi 1 m f i (i) , m j 1 其中: P ( A j ), i A j ; f i (i ) P ( B j ), i B j ; 0, 其他.对 i 1,2, m 。基 于 这 个 表 示 以 1 m 的 等 概 率 确 定 表 中 的 一 个 单 元( Ai , B j , P( Ai ) ,再利用一个随机数用直接抽样确定 Ai 和 Bi 进而确定 X F 。第一步:建立 3 4 5 6 7 8 9 10 论随机抽样文献综述论文范文 导读:机整数,记

12、为 r,表示抽取到 ar,将 ar 与最后一个元素 an 交换,经交换后 a1,a2,an 的值被更新, 前 n1 个值为没有被抽取过的元素,为了避免被重复抽取,第 i 次抽 取时则从前 ni1 个数中抽取一个,在 1,ni1 中生成一个随机整数 r, 将 ar 与 ani1 交换。由此可见,随机抽取交换法通过动态调整产生随 机数的 Alias 表 选择一个概率不超过 1 m 的事件 x i ,将其归 为 A 类,记为:Ai j, P Ai pi 选择一个概率超过 1 m 的事件 x i ,将其归为 B 类,记为:Bj l 1 在概率中做相应的扣除: pi pi pi m 持续执行上述过程直至

13、所有的事件都完全归入表中,再将所有的 P( Ai ) 乘 上相同的倍数即可 第二步:抽样 使用第一个随机数确定 相应的表中单元 ( Ai , Bi , P( Ai ) ,满足 i m 1 , Ai , P ( Ai ) 使用第二个随机数确定 X F ,使 X F ,由此可以看出无论 多大容 Bi , P ( Ai ) 量的随机变量,使用 Alias 算法只需进行 1 次与随机数的比较,这 样将大大的 节省抽样所需时间,但 Alias 算法比直接抽样多使用了 一个随机数。2.1.2 对 Alias 算法的改进 Alias 算法是将随机变量进行适当的变 形向等概率方向靠近,然后对其再 次进行变形,

14、进一步减少判断比 较的次数或减少随机数的使用次数。 4随机抽样文献综述 构造新的 Alias 表,将上面的每个单元变为 2 个单元: Ai Ai , Am i Bi Bi Bi , Bm i Bi P ( Ai ) 2 P ( Ai ), P ( Am i ) 1 (如果 P ( Ai ) 0.5) (如果 P ( Ai ) 0.5) Ai Ai , Am i Ai Bi Bi , Bm i Ai P ( Ai ) 2 ( P ( Ai ) 0.5), P ( Am i ) 1 用上面模型,当确定的单元为“子事件”单元则必然发生,不需判 断;当 确定的单元为双“子事件”单元,与 Alias 算

15、法计算相同, 称为 Alias 算法的 变化为一次改进。 依此规则继续拆分来减少判断比较的次数或减少随机数的使 用次数。2.2 随机抽取交换法及其改进 2.2.1 随机抽样交换法 基于窗口的 随机数抽取算法和基于元素交换思想的随机抽取算法的算法原 理基 本相似,都是将每次抽得的元素交换到数组的尾部。 其基本思想是:第一 次抽取时, 从 a1 , a 2 , a n 中随机抽取一个,即在区间 1, n 中产生一个随机整数, 记为 r, 表示抽取到 ar, 将 ar 与最后一个元素 an 交换, 经交换后 a1 , a 2 , a n 的值 被 更新,前 n 1 个值为没有被抽取过的元素,为了避免

16、被重复抽取, 第 i 次抽 取时则从前 n i 1 个数中抽取一个, 在 1, n i 1 中 生成一个随机整数 r, 将 ar 与 a n i 1 交换。由此可见,随机抽取交换法通过动态调整产生随机数的窗口大小和 3 4 5 6 7 8 9 10 论随机抽样文献综述论文范文 导读:元素后都要进行元素交换, 所以,其缺点是当抽取工作完成时,改变了待抽取的数组中元素的 位置关系这通常是我们所不需要的情况。2.2.2 随机抽样交换法的改 进(1)定义数组 a1m 存放 n 个元素,用数组 b1m 存放被抽中元素 的下标;(2)在区间 1,ni1 中 i1,2,m 产生随机整数,并赋予值 bi 对 应表 1 中的第 3 列;5随 进行元 素交换,有效地克服了无效抽取的缺点。 但是,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号