局部相似分析的统计研究及其在生物时间序列中的应用.doc

上传人:re****.1 文档编号:557439593 上传时间:2022-12-11 格式:DOC 页数:3 大小:13.04KB
返回 下载 相关 举报
局部相似分析的统计研究及其在生物时间序列中的应用.doc_第1页
第1页 / 共3页
局部相似分析的统计研究及其在生物时间序列中的应用.doc_第2页
第2页 / 共3页
局部相似分析的统计研究及其在生物时间序列中的应用.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《局部相似分析的统计研究及其在生物时间序列中的应用.doc》由会员分享,可在线阅读,更多相关《局部相似分析的统计研究及其在生物时间序列中的应用.doc(3页珍藏版)》请在金锄头文库上搜索。

1、局部相似分析的统计研究及其在生物时间序列中的应用宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。近十年来,受益于测序成本的大幅降低,分子生物学研究产生了大量的微生物群落时间序列数据。在时间序列相关的统计方法中,局部相似分析(local similarity

2、 analysis,LSA)已被广泛用于研究不同环境中微生物群落的时空演变,寻找微生物物种之间潜在的局部和时间延迟关系。这些关系无法通过传统的相关性分析方法获得。通常利用置换检验对局部相似分析的统计显著性进行评估。最近,研究人员提出了一个理论方法分析局部相似得分的统计显著性。然而,这个方法和置换检验都需要假设原始时间序列是独立同分布的,但在很多实际问题中这个假设可能是不成立的。本文提出了一些新方法研究平稳时间序列局部相似分析的统计显著性,并将其应用于生物时间序列数据中。论文主要包含以下几个方面:第二章提出了平稳时间序列局部相似分析的统计显著性评价方法数据驱动局部相似分析(Data Driven

3、 LSA,DDLSA)。在DDLSA中,基于独立同分布理论评估方法,利用长期方差对局部相似分析的渐近理论进行了修正,得到了平稳时间序列局部相似得分的极限分布,其中的长期方差通过非参数核估计方法获得。另外,提出了一个基于残差的评价方法LSAres(LSA for residuals),通过独立同分布理论评价方法评估给定统计模型残差序列的统计显著性,得到原始序列局部相似分析的统计显著性。模拟结果表明,在平稳时间序列模型中,DDLSA和LSAres可以有效控制第一类错误率,而其他方法却不能。另外,将不同方法应用于人类和海洋微生物数据集中,发现我们的方法可以识别大多数可能的显著关系,并且有效减少假阳性

4、关系的数量。第三章将滑动分块自助法应用于平稳时间序列局部相似分析的统计显著性评估中,提出了 MBBLSA(Moving Block Bootstrap LSA)方法。该方法首先将原始序列分为长度相同的可重叠的小块,然后对分块样本随机有放回抽样,最后拼接成与原始序列长度一样的重抽样样本。由于每个分块样本是平稳的,因此重抽样样本也会保留原始序列的部分平稳特征,从而克服了置换检验需要原始数据必须为独立同分布序列这一缺点。由于在滑动分块自助法中分块长度的选择对最终的结果起着至关重要的作用,因此需要找到一个合适的分块长度选择器。本文选择了一个基于AR(1)模型自回归系数的分块长度选择器。最后,将MBBL

5、SA应用于模拟研究和实证分析中,结果表明,相比于现存的方法,MBBLSA的表现更好。第四章首先介绍了局部相似分析的扩展方法一一局部趋势分析(local trend analysis.LTA)。局部趋势分析首先将原始序列转化为趋势序列,然后对趋势序列进行局部相似分析,进而得到局部趋势得分。为了评估局部趋势得分的统计显著性,提出一个新的方法STLTA(Stationary Theoretical Local Trend Analysis)。利用矩阵的谱分解理论,得到了不同状态空间趋势序列的调整方差,从而可得局部趋势得分的精确极限分布。模拟结果显示,在不同的时间序列模型下,STLTA的第一类错误率更接近给定的显著性水平。将STLTA应用于不同的宏基因组数据中,与置换检验和独立同分布序列评价方法相比,发现STLTA更加有效。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 网络安全

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号