3.由巳知分布的随机抽样

上传人:鲁** 文档编号:569854554 上传时间:2024-07-31 格式:PPT 页数:110 大小:700KB
返回 下载 相关 举报
3.由巳知分布的随机抽样_第1页
第1页 / 共110页
3.由巳知分布的随机抽样_第2页
第2页 / 共110页
3.由巳知分布的随机抽样_第3页
第3页 / 共110页
3.由巳知分布的随机抽样_第4页
第4页 / 共110页
3.由巳知分布的随机抽样_第5页
第5页 / 共110页
点击查看更多>>
资源描述

《3.由巳知分布的随机抽样》由会员分享,可在线阅读,更多相关《3.由巳知分布的随机抽样(110页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 由已知分布的随机抽样由已知分布的随机抽样1.随机抽样及其特点随机抽样及其特点2.直接抽样方法直接抽样方法3.挑选抽样方法挑选抽样方法4.复合抽样方法复合抽样方法5.复合复合挑选挑选抽样方法抽样方法6.替换抽样方法替换抽样方法7.随机抽样的一般方法随机抽样的一般方法8.随机抽样的其它方法随机抽样的其它方法作作 业业2021/6/161第三章第三章 由已知分布的随机抽样由已知分布的随机抽样 本章叙述由己知分布抽样的各主要方法,并给出在粒子输运问题中经常用到的具体实例。 2021/6/1621.随机抽样及其特点随机抽样及其特点 由巳知分布的随机抽样指的是由己知分布的总体中抽取简单子样。

2、随机数序列随机数序列是由单位均匀分布的总体中抽取的简单子样,属于一种特殊的由已知分布的随机抽样问题。本章所叙述的由任意已知分布中抽取简单子样,是在假设随机数为已知量的前提下,使用严格的数学方法产生的。 为方便起见,用XF表示由己知分布F(x)中产生的简单子样的个体。对于连续型分布,常用分布密度函数f(x)表示总体的己知分布,用Xf表示由己知分布密度函数f(x)产生的简单子样的个体。另外,在抽样过程中用到的伪随机数均称随机数。 2021/6/1632.直接抽样方法直接抽样方法 对于任意给定的分布函数F(x),直接抽样方法如下: 其中,1,2,N为随机数序列。为方便起见,将上式简化为: 若不加特殊

3、说明,今后将总用这种类似的简化形式表示,总表示随机数。2021/6/164证明 下面证明用前面介绍的方法所确定的随机变量序列X1,X2,XN具有相同分布F(x)。 对于任意的n成立,因此随机变量序列X1,X2,XN具有相同分布F(x)。另外,由于随机数序列1,2,N是相互独立的,而直接抽样公式所确定的函数是波雷尔(Borel)可测的,因此,由它所确定的X1,X2,XN也是相互独立的(P.R.Halmos, Measure theory, N.Y.Von Nosrtand,195045定理2)。2021/6/1651)离散型分布的直接抽样方法离散型分布的直接抽样方法 对于任意离散型分布: 其中x

4、1,x2,为离散型分布函数的跳跃点,P1,P2,为相应的概率,根据前述直接抽样法,有离散型分布的直接抽样方法如下: 该结果表明,为了实现由任意离散型分布的随机抽样,直接抽样方法是非常理想的。 2021/6/166例例1. 二项分布的抽样二项分布的抽样 二项分布为离散型分布,其概率函数为: 其中,P为概率。对该分布的直接抽样方法如下: 2021/6/167例例2. 泊松泊松(Possion)分布的抽样分布的抽样 泊松(Possion)分布为离散型分布,其概率函数为: 其中,0 。对该分布的直接抽样方法如下: 2021/6/168例例3. 掷骰子点数的抽样掷骰子点数的抽样 掷骰子点数X=n的概率为

5、: 选取随机数,如 则 在等概率的情况下,可使用如下更简单的方法: 其中表示取整数。2021/6/169例例4. 碰撞核种类的确定碰撞核种类的确定 中子或光子在介质中发生碰撞时,如介质是由多种元素组成,需要确定碰撞核的种类。假定介质中每种核的宏观总截面分别为1,2,n,则中子或光子与每种核碰撞的概率分别为: 其中t12n。碰撞核种类的确定方法为:产生一个随机数,如果 则中子或光子与第I种核发生碰撞。 2021/6/1610例例5. 中子与核的反应类型的确定中子与核的反应类型的确定 假设中子与核的反应类型有如下几种:弹性散射,非弹性散射,裂变,吸收,相应的反应截面分别为el,in,f,a。则发生

6、每一种反应类型的概率依次为 : 其中反应总截面telinfa。 2021/6/1611 反应类型的确定方法为:产生一个随机数 2021/6/16122)连续型分布的直接抽样方法连续型分布的直接抽样方法 对于连续型分布,如果分布函数F(x) 的反函数 F1(x)存在,则直接抽样方法是 :2021/6/1613例例6. 在在a,b上均匀分布的抽样上均匀分布的抽样 在a,b上均匀分布的分布函数为: 则 2021/6/1614例例7. 分布 分布为连续型分布,作为它的一个特例是: 其分布函数为: 则 2021/6/1615例例8. 指数分布 指数分布为连续型分布,其一般形式如下: 其分布函数为: 则

7、因为1也是随机数,可将上式简化为 2021/6/1616 连续性分布函数的直接抽样方法对于分布函数的反函数存在且容易实现的情况,使用起来是很方便的。但是对于以下几种情况,直接抽样法是不合适的。1)分布函数无法用解析形式给出,因而其反函数也无法给出。2)分布函数可以给出其解析形式,但是反函数给不出来。3)分布函数即使能够给出反函数,但运算量很大。 下面叙述的挑选抽样方法是克服这些困难的比较好的方法。 2021/6/16173.挑选抽样方法挑选抽样方法 为了实现从己知分布密度函数f(x)抽样,选取与f(x)取值范围相同的分布密度函数h(x),如果 则挑选抽样方法为:2021/6/1618 即从h(

8、x)中抽样xh,以 的概率接受它。 下面证明xf 服从分布密度函数f(x)。证明:对于任意x 2021/6/16192021/6/1620 使用挑选抽样方法时,要注意以下两点:选取h(x)时要使得h(x)容易抽样且M的值要尽量小。因为M小能提高抽样效率。抽样效率是指在挑选抽样方法中进行挑选时被选中的概率。按此定义,该方法的抽样效率E为: 所以,M越小,抽样效率越高。2021/6/1621 当 f(x) 在0,1上定义时,取 h(x)=1,Xh=, 此时挑选抽样方法为2021/6/1622例例9. 圆内均匀分布抽样 令圆半径为R0,点到圆心的距离为r,则r的分布密度函数为 分布函数为 容易知道,

9、该分布的直接抽样方法是2021/6/1623 由于开方运算在计算机上很费时间,该方法不是好方法。下面使用挑选抽样方法:取 则抽样框图为 2021/6/1624 显 然 , 没 有 必 要 舍 弃 1 2的 情 况 , 此 时 , 只 需 取 就可以了,亦即 另一方面,也可证明 与 具有相同的分布 。 2021/6/16254.复合抽样方法复合抽样方法 在实际问题中,经常有这样的随机变量,它服从的分布与一个参数有关,而该参数也是一个服从确定分布的随机变量,称这样的随机变量服从复合分布。例如,分布密度函数 是一个复合分布。其中Pn0,n=1,2,且 fn(x)为与参数n有关的分布密度函数,n=1,

10、2, 参数n服从如下分布2021/6/1626 复合分布的一般形式为: 其中f2(x/y)表示与参数y有关的条件分布密度函数, F1(y)表示分布函数。 复合分布的抽样方法为:首先由分布函数F1(y) 或分布密度函数f1(y)中抽样YF1或Yf1,然后再由分布密度函数f2(x/ YF1)中抽样确定Xf2 (x/YF) 证明: 所以,Xf所服从的分布为f (x)。2021/6/1627例例10. 指数函数分布的抽样 指数函数分布的一般形式为: 引入如下两个分布密度函数:2021/6/1628 则 使用复合抽样方法,首先从f1(y)中抽取y 再由f2(x/ YF1)中抽取x 2021/6/1629

11、5.复合挑选抽样方法复合挑选抽样方法 考虑另一种形式的复合分布如下: 其中0H(x,y)M,f2(x/y)表示与参数y有关的条件分布密度函数,F1(y)表示分布函数。抽样方法如下:2021/6/1630 证明: 抽样效率为:E=1/M2021/6/1631 为了实现某个复杂的随机变量 y 的抽样,将其表示成若干个简单的随机变量 x1,x2,xn 的函数得到 x1,x2,xn 的抽样后,即可确定 y 的抽样,这种方法叫作替换法抽样。即6.替换抽样方法2021/6/1632例例11. 散射方位角余弦分布的抽样 散射方位角在0,2上均匀分布,则其正弦和余弦sin和cos服从如下分布:直接抽样方法为:

12、2021/6/1633令=2,则在0,上均匀分布,作变换其中01,0,则(x,y) 表示上半个单位圆内的点。如果 (x,y) 在上半个单位圆内均匀分布,则在0,上均匀分布,由于2021/6/1634 因此抽样sin和cos的问题就变成在上半个单位圆内均匀抽样 (x,y) 的问题。 为获得上半个单位圆内的均匀点,采用挑选法,在上半个单位圆的外切矩形内均匀投点(如图)。舍弃圆外的点,余下的就是所要求的点。抽样方法为:抽样效率E=/40.7852021/6/1635 为实现散射方位角余弦分布抽样,最重要的是在上半个单位圆内产生均匀分布点。下面这种方法,首先在单位圆的半个外切正六边形内产生均匀分布点,

13、如图所示。2021/6/1636 于是便有了抽样效率更高的抽样方法:抽样效率2021/6/1637例例12. 正态分布的抽样 标准正态分布密度函数为:引入一个与标准正态随机变量X独立同分布的随机变量Y,则(X,Y)的联合分布密度为:作变换2021/6/1638则(,)的联合分布密度函数为:由此可知,与相互独立,其分布密度函数分别为分别抽取, :2021/6/1639从而得到一对服从标准正态分布的随机变量X和Y: 对于一般的正态分布密度函数 N(,2) 的抽样,其抽样结果为:2021/6/1640例例13. 分布的抽样 分布密度函数的一般形式为:其中n,k为整数。为了实现分布的抽样,将其看作一组

14、简单的相互独立随机变量的函数,通过这些简单随机变量的抽样,实现分布的抽样。设 x1,x2,xn 为一组相互独立、具有相同分布 F(x) 的随机变量,k为 x1,x2,xn 按大小顺序排列后的第k个,记为:2021/6/1641则k的分布函数为:当 F(x)=x 时,不难验证,k的分布密度函数为分布。因此, 分布的抽样可用如下方法实现:选取n个随机数,按大小顺序排列后取第k个,即2021/6/16427.随机抽样的一般方法随机抽样的一般方法 1)加抽样方法 2)减抽样方法3)乘抽样方法4)乘加抽样方法5)乘减抽样方法6)对称抽样方法7)积分抽样方法2021/6/16431)加抽样方法 加抽样方法

15、是对如下加分布给出的一种抽样方法: 其中Pn0, ,且 fn(x)为与参数n有关的分布密度函数,n=1,2,。 由复合分布抽样方法可知,加分布的抽样方法为:首先抽样确定n,然后由 fn(x)中抽样x,即:2021/6/1644例例14. 多项式分布抽样 多项式分布密度函数的一般形式为: 将 f(x) 改写成如下形式: 则该分布的抽样方法为:2021/6/1645例例15. 球壳内均匀分布抽样 设球壳内半径为R0,外半径为R1,点到球心的距离为r,则r的分布密度函数为 分布函数为该分布的直接抽样方法是2021/6/1646为避免开立方根运算,作变换:则 x0,1,其分布密度函数为:其中2021/

16、6/1647则x及r的抽样方法为:2021/6/16482)减抽样方法 减抽样方法是对如下形式的分布密度所给出的一种抽样方法: 其中A1、A2为非负实数,f1(x) 、f2(x)均为分布密度函数。 减抽样方法分为以下两种形式: 以上两种形式的抽样方法,究竟选择哪种好,要看f1(x) 、f2(x)哪一个容易抽样,如相差不多,选用第一种方法抽样效率高。2021/6/1649 (1)将f (x)表示为 令m表示f2(x)f1(x)的下界,使用挑选法,从f1(x)中抽取Xf1 抽样效率为:2021/6/1650 (2)将f (x)表示为 使用挑选法,从f2(x)中抽取Xf2 抽样效率为:2021/6/

17、1651例例16. 分布抽样分布的一个特例: 取A12,A21,f1(x)1,f2(x)2x,此时m0,则根据第一种形式的减抽样方法,有或 2021/6/1652由于11可用1代替,该抽样方法可简化为:对于21的情况,可取 Xf1 ,因此与分布的推论相同。2021/6/1653 如下形式的分布称为乘分布: 其中H(x)为非负函数, f1(x)为任意分布密度函数。 令M为H(x)的上界,乘抽样方法如下: 抽样效率为:3)乘抽样方法2021/6/1654例例17. 倒数分布抽样倒数分布密度函数为: 其直接抽样方法为:下面采用乘抽样方法,考虑如下分布族:其中 i = 1,2,该分布的直接抽样方法为:

18、2021/6/1655利用这一分布族,将倒数分布 f(x) 表示成:其中,乘法分布的抽样方法如下:该分布的抽样效率为:2021/6/1656例例18. 麦克斯韦(Maxwell)分布抽样麦克斯韦分布密度函数的一般形式为: 使用乘抽样方法,令该分布的直接抽样方法为:2021/6/1657此时则麦克斯韦分布的抽样方法为:该分布的抽样效率为:2021/6/1658 在实际问题中,经常会遇到如下形式的分布: 其中Hn(x)为非负函数,fn(x) 为任意分布密度函数,n=1,2,。不失一般性,只考虑n=2的情况: 将 f(x) 改写成如下的加分布形式:4)乘加抽样方法2021/6/1659 其中2021

19、/6/1660 乘加抽样方法为: 该方法的抽样效率为:2021/6/1661 这种方法需要知道P1的值(P2=1P1),这对有些分布是很困难的。下面的方法可以不用计算P1 : 对于任意小于1的正数P1 ,令P2=1P1 ; 则采用复合挑选抽样方法,有:2021/6/1662 当取 时,抽样效率最高 这时,乘加抽样方法为:2021/6/1663 由于 可知第一种方法比第二种方法的抽样效率高。2021/6/1664例例19. 光子散射后能量分布的抽样令光子散射前后的能量分别为 和 (以 m0c2 为单位,m0为电子静止质量,c 为光速), ,则 x 的分布密度函数为: 该分布即为光子散射能量分布,

20、它是由著名的KlinNishina 公式确定的。其中 K() 为归一因子:2021/6/1665把光子散射能量分布改写成如下形式:在1, 1+2上定义如下函数:2021/6/1666则有使用乘加抽样方法:2021/6/1667光子散射能量分布的抽样方法为:该方法的抽样效率为:2021/6/1668 乘减分布的形式为:其中H1(x) 、H2(x)为非负函数,f1(x)、f2(x) 为任意分布密度函数。 与减抽样方法类似,乘减分布的抽样方法也分为两种。5)乘减抽样方法2021/6/1669 (1)将 f (x) 表示为令H1(x)的上界为M1, 的下界为m,使用乘抽样方法得到如下乘减抽样方法:20

21、21/6/1670 (2)将 f (x) 表示为令H2(x)的上界为M2,使用乘抽样方法,得到另一种乘减抽样方法:2021/6/1671例例20. 裂变中子谱分布抽样裂变中子谱分布的一般形式为: 其中A,B,C,Emin,Emax 均为与元素有关的量。令其中为归一因子,为任意参数。2021/6/1672相应的 H1(E),H2(E) 为:于是裂变中子谱分布可以表示成乘减分布形式:容易确定 H1(E) 的上界为:为提高抽样效率,应取使得M1 达到最小,此时2021/6/1673取 m0,令则裂变中子谱分布的抽样方法为:抽样效率2021/6/1674 对称分布的一般形式为:其中 f1(x) 为任意

22、分布密度函数,满足偶函数对称条件,H(x) 为任意奇函数,即对任意x满足:对称分布的抽样方法如下:取=216)对称抽样方法2021/6/1675证明:因为=21,x 相当于 ,因此2021/6/1676例例21. 质心系各向同性散射角余弦分布抽样 在质心系各向同性散射的假设下,为得到实验室系散射角余弦,需首先抽样确定质心条散射角余弦:再利用下面转换公式:得到实验室系散射角余弦L。其中A为碰撞核质量,C、L 分别为质心系和实验室系散射角。2021/6/1677为避免开方运算,可以使用对称分布抽样。 根据转换公式可得: 依照质心系散射各向同性的假定,可得到实验室系散射角余弦L 的分布如下:该密度函

23、数中的第一项为偶函数,第二项为奇函数,因而是对称分布。其中2021/6/1678从 f1(L) 的抽样可使用挑选法然后再以的概率决定接受或取负值。 上述公式涉及开方运算,需要进一步简化。2021/6/1679注意以下事实:对于任意0a1令则上述挑选抽样中的挑选条件简化为:另一方面,在 即 的条件下,2/a 在1, 1上均匀分布,故可令2/a,则最终决定取正负值的条件简化为:2021/6/1680 于是,得到质心系各向同性散射角余弦分布的抽样方法为:2021/6/1681 如下形式的分布密度函数称为积分分布密度函数,其中 f0(x,y) 为任意二维分布密度函数,H(x)为任意函数。该分布密度函数

24、的抽样方法为:7)积分抽样方法2021/6/1682证明:对于任意x 2021/6/1683例例22. 各向同性散射方向的抽样 为了确定各向同性散射方向 ,根据公式: 对于各向同性散射,cos在1, 1上均匀分布,在0, 2上均匀分布。由于直接抽样需要计算三角函数和开方。2021/6/1684定义两个随机变量:可以证明,当 时,随机变量 x 和 y 服从如下分布:定义区域为:2021/6/1685则 wcos 的分布可以用上述分布表示成积分分布的形式:令 ,则属于上述积分限内的 y 一定满足条件 。2021/6/1686各向同性散射方向的抽样方法为:抽样效率为:2021/6/16878.随机抽

25、样的其它方法随机抽样的其它方法 1)偏倚抽样方法2)近似抽样方法3)近似-修正抽样方法4)多维分布抽样方法5)指数分布的抽样2021/6/1688 使用蒙特卡罗方法计算积分时,可考虑将积分I改写为其中 f *(x) 为一个与 f (x) 有相同定义域的新的分布密度函数。于是可以这样计算积分I:这里 Xi 是从 f *(x) 中抽取的第 i 个子样。1)偏移抽样方法2021/6/1689 由此可以看出,原来由 f (x) 抽样,现改为由另一个分布密度函数 f *(x) 抽样,并附带一个权重纠偏因子这种方法称为偏倚抽样方法。 从 f (x) 中抽取的 Xf ,满足而对于偏倚抽样,有 一般情况下,X

26、f 是具有分布 f (x) 总体的简单子样的个体,只代表一个。Xf* 是具有分布 f *(x) 总体的简单子样的个体,但不代表一个,而是代表 W(Xf*) 个,这时Xf*是带权W(Xf*)服从分布 f (x) 。2021/6/1690 在实际问题中,分布密度函数的形式有时是非常复杂的,有些甚至不能用解析形式给出,只能用数据或曲线形式给出。如中子散射角余弦分布多数是以曲线形式给出的。对于这样的分布,需要用近似分布密度函数代替原来的分布密度函数,用近似分布密度函数的抽样代替原分布密度函数的抽样,这种方法称为近似抽样方法。2)近似抽样方法2021/6/1691 设 fa(x) f (x),即 fa(

27、x) 是 f (x) 的一个近似分布密度函数。对于阶梯近似,有其中,x0,x1, ,xn为任意分点。在此情况下,近似抽样方法为:或a)阶梯近似2021/6/1692 对于梯形近似,有其中,c 为归一因子, fi f (xi) ,x0,x1, ,xn为任意分点。根据对称抽样方法,梯形近似抽样方法为:b)梯形近似2021/6/1693除了上述这种近似外,近似抽样方法还包括对直接抽样方法中分布函数反函数的近似处理,以及用具有近似分布的随机变量代替原分布的随机变量。2021/6/1694例例23. 正态分布的近似抽样我们知道,随机数的期望值为 1/2,方差为 1/12,则随机变量渐近正态分布,因此,当

28、 n 足够大时便可用 Xn 作为正态分布的近似抽样。特别是 n12 时,有2021/6/1695 对于任意分布密度函数 f (x) ,设 fa(x) 是 f (x) 的一个近似分布密度函数,它的特点是抽样简单,运算量小。令则分布密度函数 f(x) 可以表示为乘加分布形式:其中 H1(x) 为非负函数,f1(x) 为一分布密度函数。 对 f(x) 而言,fa(x) 是它的近似分布密度函数,而H1(x) f1(x)正好是这种近似的修正。3)近似-修正抽样方法2021/6/1696近似-修正抽样方法如下:抽样效率 由上述近似-修正抽样方法可以看出,如果近似分布密度函数 fa(x) 选得好,m 接近

29、1,这时有很大可能直接从 fa(x) 中抽取 Xfa ,而只有很少的情况需要计算与f (x) 有关的函数 H1(Xf1)。在乘抽样方法中,每一次都要计算 H(Xfa)f (Xfa)fa(Xfa)。因此,当 f (x) 比较复杂时,近似-修正抽样方法有很大好处。2021/6/1697例例24. 裂变中子谱分布的近似-修正抽样裂变中子谱分布的一般形式为: 其中A,B,C,Emin,Emax 均为与元素有关的量。对于铀-235,A=0.965,B=2.29,C=0.453,Emin=0,Emax=。若采用乘减抽样方法,其抽样效率约为0.5。2021/6/1698令相应的则从 fa(x) 的抽样为从

30、f1(x) 的抽样为2021/6/1699参数的确定,使1A0,且使 H1(E) 的上界M1 最小。裂变中子谱的近似修正抽样方法为对于铀-235,m0.8746,M0.2678,0.5543,抽样效率 E0.9333。而且近似修正抽样方法有0.8746的概率直接用近似分布抽样,只计算一次对数。因此,较之乘减抽样方法大大节省了计算时间,提高了抽样效率。2021/6/16100为方便起见,这里仅讨论二维分布的情况,对于更高维数的分布,可用类似的方法处理。对于任意二维分布密度函数,总可以用其边缘分布密度函数和条件分布密度函数的乘积表示:其中 fl(x),f2(y|x) 分别为分布 f (x,y) 的

31、边缘分布密度函数和条件分布密度函数,即4)多维分布抽样方法2021/6/16101二维分布密度函数的抽样方法是:首先由 fl(x) 中抽取 Xf1,再由 f2(y|Xf1) 中抽样确定 Yf2 。对于多维分布密度函数,也可直接采用类似于一维分布密度函数的抽样方法。例如,对如下形式的二维分布密度函数:其中 H(x,y) 为非负函数,f1(x,y) 为任意二维分布密度函数。设 M 为 H(x,y) 的上界,则有二维分布的乘抽样方法如下:2021/6/16102例例25. 下面二维分布密度函数的抽样将 f (x,y) 写为其中用直接抽样方法分别从 fl(x) 和 f2(y|Xf1) 中抽样,得到 2

32、021/6/16103前面已经介绍了,指数分布的直接抽样为:这不仅需要计算对数,而且由于要使用伪随机数,受精度的限制,该抽样值在小概率处即数值较大处呈现明显得离散性。下面介绍两种抽样方法可以避免这些问题。5)指数分布的抽样2021/6/16104所用随机数的平均个数 Ne2 / ( e1)4.3方法一NY2021/6/16105 方法二NY2021/6/16106作作 业业 1)光子散射后能量分布的抽样把光子散射能量分布改写成如下形式进行抽样:2021/6/16107在1, 1+2上定义如下函数:2021/6/161082021/6/16109 结束语结束语若有不当之处,请指正,谢谢!若有不当之处,请指正,谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号