粒子物理与核物理实验中的数据分析lecture-12-开拆法

上传人:go****e 文档编号:131382858 上传时间:2020-05-07 格式:PDF 页数:25 大小:450.17KB
返回 下载 相关 举报
粒子物理与核物理实验中的数据分析lecture-12-开拆法_第1页
第1页 / 共25页
粒子物理与核物理实验中的数据分析lecture-12-开拆法_第2页
第2页 / 共25页
粒子物理与核物理实验中的数据分析lecture-12-开拆法_第3页
第3页 / 共25页
粒子物理与核物理实验中的数据分析lecture-12-开拆法_第4页
第4页 / 共25页
粒子物理与核物理实验中的数据分析lecture-12-开拆法_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《粒子物理与核物理实验中的数据分析lecture-12-开拆法》由会员分享,可在线阅读,更多相关《粒子物理与核物理实验中的数据分析lecture-12-开拆法(25页珍藏版)》请在金锄头文库上搜索。

1、粒子物理与核物理实验中的粒子物理与核物理实验中的 数据分析数据分析 陈少敏 清华大学 第十二讲 开拆法 2 本讲要点本讲要点 数学公式 反应函数 矩阵 求反应矩阵的逆 修正因子 正规化的开拆法 估计量的方差与偏置 正规化参数的选择 举例 a Tikhonov 规则 b MaxEnt 规则 3 图像还原问题图像还原问题 一个常见的问题 由于实验仪器的原因而出现图像变形 例如 如果 已知 通过探测器模拟可以 给出其影响的形式 实验观测分布 能否还原出不受实能否还原出不受实 验仪器影响的分布 验仪器影响的分布 能否还原出不受实能否还原出不受实 验仪器影响的分布 验仪器影响的分布 Unfolding

2、开拆法 真实分布 4 开拆问题的表述开拆问题的表述 考虑有随机变量 我们的目标是要找到概率密度函数 如果函数可参数化为 那么确定概率密度函数 等效于 若无参数化形式 可通过构造直方图 y yf yf 最大似然法 bin 1 j j jtotj pf y dyjM p 真实的直方图 目标 为 或 构造估计量 j j p 问题 在测量时不可能没有误差y 参数的数目 区间的数目M f y 各区间之间填入的数目互 串 导致散开变宽 5 反应矩阵反应矩阵 测量误差的影响 数据 y真值 观测值 x dyyfyxRxf truemeas 写成离散形式 NiR M j jiji 1 1 观测直方图 期待值 反

3、应矩阵 真实直方图 ij RPij 观测值在第 区 真实值在第 区 1 ii N nE nnn 这里 注意 是常数 会受 到统计涨落的影响 n 6 效率 本底效率 本底 有时侯 事例可能会不被探测到 是在观测直方图上预 期的本底数目 并假设它是已知的 有时在无真实事例发生的 时候 也有事例被观测到 11 NN ij ii j RPij Pj 观测值在第区 真实值在第区 观测值在全范围 真实值在第 区 效率 M j ijiji R 1 i 取决于在第 j 区的真实直方图 7 各关键量总汇各关键量总汇 真实 直方图 观测直方图的期待值 反应矩阵 效率 M j jtotM 1 1 概率 观测直方图

4、totM ppp 1 1N 1N nnn ij RPij 观测值在第区 真实值在第区 N i ijj R 1 1N 预期的本底 RnE 为了找到的估计量 需要相关的概率理论 例如 i i e n nP i n i ii 泊松分布 或关联矩阵以便构造 cov jiij nnV 2 log L或 M个区间 N个区间 8 为什么要用开拆法为什么要用开拆法 一般而言 我们并不需要开拆法 例如当比较现有理论的预期值时 最好 是将探测器相应叠加到理论中去 即在预期值中包含探测器效应并与未修 正的原始数据相比较 但是 不将实验数据进行开拆处理 结果发表后 有关反应矩阵的知识将 不在保留 而且 开拆后的分布可

5、以直接与各种理论的预言相比较 也可 以与别的实验经过开拆以后的分布相比较 n 通常开拆的结果更为有用 因为当反应矩阵变得不可恢复时 即使对实验 结果可能又有了新的理论解释 也很难进行理论检验 在粒子物理研究中 开拆法常用的领域为 结构函数 的谱函数 也就是强子不变质量谱 强子事例形状分布 粒子多重数分布 9 反应矩阵的逆反应矩阵的逆 假设的逆存在 若数据是泊松分布 最大似然法的估计量为 R 1 R i i e n nP i n i ii N i iii nL 1 log log 1 nRn 则有 n 若 的非对角元太大 即区间 宽度比分辨率要小时 会导致 上式有很大的方差 以及在相 邻区间产生

6、很强的负关联 若 的非对角元太大 即区间 宽度比分辨率要小时 会导致 上式有很大的方差 以及在相 邻区间产生很强的负关联 10 错误的原因错误的原因 假设真的有精细结构 应用R给出观测期待值 时 虽然一些结构还能 留下 但大部分的精细 结构都被抹平了 应用R 1到恢复精细结构 采用观测值时 由于统计涨落的缘故 有不少非物理因素造成的突起 R 1 R 但我们没有只有 n n R 1 认为 这是与原来的精细结构有关 导致有振荡效应 1 R n 11 重新研究最大似然法的解重新研究最大似然法的解 是无偏的 计算估计量的方差 1 nERE 1111 11 cov cov NN ijijikjlklik

7、jkk k lk URRn nRR 利用RCF边界做无偏估计量 N i i ilik lk kl RRL EU 1 2 1 log 倒数后给出 N i kjkikij RRU 1 11 即使最大似然法在各无偏估计 中给出的方差最小 但得到的 方差可能仍然很大 为了减小方差 必须引入一些偏置量 策略 接受小的偏置量 系统误差 以换取大幅减小方差 统计误差 策略 接受小的偏置量 系统误差 以换取大幅减小方差 统计误差 i klklk n n n 是独立的泊松变量 时 cov 12 简单方法 修正因子法简单方法 修正因子法 对做相同的分区 并取 与是来自无本底情况下的蒙特卡罗模拟结果 通常 因此方差

8、不会被放大 但偏置为 iiii nC MC i i MC i C 修正因子 MC i MC i 2 cov cov ijijiij UCn n 1 OCi iii Eb MC sigsig ii iiiii MCsig ii b 这里 注意 该偏置量存在把拉向的倾向 造成模型检验的困难 MC 1 如果分区宽度 几倍的分辨率 结果不会太坏 2 实际应用中 该方法常用于事例形状变量的分布研究中 1 如果分区宽度 几倍的分辨率 结果不会太坏 2 实际应用中 该方法常用于事例形状变量的分布研究中 除非模拟采用的模型无误 否则上式不为零 需要考虑对应的系统误差 13 例子 脉冲形状的还原例子 脉冲形状的

9、还原 将理论 真实 的直方图除以受实验仪器影响的直方图得到修正因子 将观测直方图乘以修正因子直方图得到理论 真实 的直方图 14 正规化的开拆法正规化的开拆法 考虑 合理的 估计量 使得某些 满足Llog LLLloglog log max 估计量可通过将下式求最大值 选出最 光滑的 一个来构造 log SL S 正则化函数 光滑的量度 正则化参量 选择给出 欲求的 Llog 另外 要求开拆后对总事例数的估计为无偏的 N iji totijiji nR 1 N i itot nSL 1 log 拉格朗日乘子 在约束情况下将下式求最大值 R 因 所以是的函数 log Ln 描述了数据与期 待值之

10、间的 距离 15 正规化的开拆法正规化的开拆法 续续 tot N i i n 1 0 0给出最光滑的解 数据无关 给出最大似然解 方差可能太大 S 显然 需要正规化函数与如何取 值的方案 所得到的估计量的好坏由它们的偏置和方差来判断 a Tikhonov 规则 b MaxEnt 规则 16 Tikhonov 规则规则 取光滑度等于第k阶导数均值的平方 有 2 1 2 kdy dy yfd yfS k true k true 这里 通常取k 2 使得S约等于曲率平方的平均值 对直方图而言 也就是 2 1 2 21 2 M i iii S 注意 2 阶导数对直方图的第一和最后的区间没有很好的定义

11、如果在下 采用Tikhonov k 2 规则 2 2 1 log L 2 2 i S 是的二次项 令的导数为零 给出线性方程 在高能物理界现有好在高能物理界现有好 几个现成的程序 几个现成的程序 RUN Blobel SVD H cker 在高能物理界现有好在高能物理界现有好 几个现成的程序 几个现成的程序 RUN Blobel SVD H cker Sov Math 5 1963 1035 17 最大熵最大熵 MaxEnt 规则规则 另一种表征光滑度的方法基于熵 对于一组概率而言 它表示为 M i ii ppH 1 log 所有相等意味着熵最大 最光滑 i p 有一个 其它为零 则意味着熵最

12、小1 i p 用熵作为正规化函数 1 log log M M ii i tottot tot SH 填入个区间中各种可能的总数 有时侯 根据贝叶斯统计的先验概率密度函数 S 这里 我们坚持采用经典近似 估计量的好坏由偏置 方差来判断 注意 熵并不取决于区间的顺序 注意 熵并不取决于区间的顺序 Ann Rev Astron Astrophys 24 1986 127 18 的方差与偏置的方差与偏置 一般来说 决定的方程是非线性的 在附近展开 n obs n n 1 2 2 2 2 2 2 1 1 1 1 0 1 1 1 1 1 1 1 obsobs ij ij i ij ij j nA B nn

13、 i jM AiM j iMjM iM jN n B iMjN n M G Cowan Statistical Data Analysis Oxford University Press 1998 为非正规的似然函数 19 的方差与偏置的方差与偏置 续续 利用误差传递得到协方差 cov ijij U 1B ACCVCU T 这里 以及对偏置的估计量 iii Eb N j N j jj j i jjiji n n nCb 11 此处而且通常情况下 R n 20 正规化参数正规化参数 的选取的选取 决定了置于数据的权重大小以便能与光滑度相比较 0给出最大 的光滑估计值 并与数据无关 因此虽然方差为

14、零 但有明显的偏置 而取大的 则回到高度振荡无偏的最大似然解 为了在偏置与方差之间达到最大平衡 选择 使均值误差的平方最小 2 2 11 11 MM iii iii ii i Ub MSEUbWeighted MSE MM 或 或要求偏置不大于它自身的估计方差 它可以找到 的值使得 2 2 1 cov M i bijij i ii b MWb b W 这里 ii W G Cowan Statistical Data Analysis Oxford University Press 1998 M Schmelling NIM A340 1994 400 21 例子例子 Tikhonov规则规则

15、k 2 22 例子例子 最大熵最大熵 MaxEnt 规则规则 23 一个在图像处理中的最大熵例子一个在图像处理中的最大熵例子 最大熵值方法常用最大熵值方法常用 于天文观测图像的于天文观测图像的 重建重建 与点源的偏与点源的偏 置较小置较小 易于推广易于推广 到两维以上的情况 到两维以上的情况 最大熵值方法常用最大熵值方法常用 于天文观测图像的于天文观测图像的 重建重建 与点源的偏与点源的偏 置较小置较小 易于推广易于推广 到两维以上的情况 到两维以上的情况 24 例子 例子 的谱函数的谱函数 X ud X X us 为了测定奇异夸克质量 实验上可采用比较与中 的质量平方差 0022 MudMu

16、s s mEur Phys J C11 599 1999 Tikhonov 规则修正因子方法 由于探测器对两者影响各不相同 因此 需要用开拆法求出 真实 分布 25 小结小结 1 数学上的原理数学上的原理 2 求反应矩阵的逆求反应矩阵的逆 3 修正因子修正因子 4 正规的开拆过程正规的开拆过程 5 估计量的方差与偏置估计量的方差与偏置 6 正规化参数的选择正规化参数的选择 7 例子例子 nR 真实直方图 数据 以及其期待值 满足目标是构造的估计量 有很大的振荡行为 及大的方差 但在各种无偏解中具有零偏置与最小的方差 MCMC iii C 方法又快又简单 Tikhonov k MaxEnt log ii i Hpp 从第 阶导数的均方值中进行光滑处理 从熵中进行光滑处理 在求解过程中采用了线性近似 因而不是无偏的 2 M 无最好的方案 可以采用区间总数 的方案 只要探测器的响应可知 就一定可以得到真实的分布

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 其它小学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号