各个领域在近二十年来取得突破性的研究进展

上传人:cl****1 文档编号:568320737 上传时间:2024-07-24 格式:PPT 页数:48 大小:481KB
返回 下载 相关 举报
各个领域在近二十年来取得突破性的研究进展_第1页
第1页 / 共48页
各个领域在近二十年来取得突破性的研究进展_第2页
第2页 / 共48页
各个领域在近二十年来取得突破性的研究进展_第3页
第3页 / 共48页
各个领域在近二十年来取得突破性的研究进展_第4页
第4页 / 共48页
各个领域在近二十年来取得突破性的研究进展_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《各个领域在近二十年来取得突破性的研究进展》由会员分享,可在线阅读,更多相关《各个领域在近二十年来取得突破性的研究进展(48页珍藏版)》请在金锄头文库上搜索。

1、情芯云池拨氨役交漱春驹捧恍茅柒亮缅藤绘雷缮安韦度郭成盔常棍比轧泵各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 计算机技术计算机技术计算机技术计算机技术, , 网络技术和传感技术的飞速发展网络技术和传感技术的飞速发展网络技术和传感技术的飞速发展网络技术和传感技术的飞速发展 来自各个巡天计划和天文台的来自各个巡天计划和天文台的来自各个巡天计划和天文台的来自各个巡天计划和天文台的“ “数据雪崩数据雪崩数据

2、雪崩数据雪崩” ” 科学家科学家科学家科学家, , 工程师和领域专家的缺乏工程师和领域专家的缺乏工程师和领域专家的缺乏工程师和领域专家的缺乏揉谁枣镑窃渗怕捣建衍取终梳韭烃瘦垒譬饯男毡扬划皿想愁镀乌坍枚巨肛各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 更大更大,更便宜的存储器更便宜的存储器 - 磁盘密度以磁盘密度以Moores law增长增长 “每次每次18个月增长一倍个月增长一倍” - 存储器价格飞快下降存储器价格飞快下降 更快更快,更便宜的信息处理器更便宜的信息处理器 - 分析更多的数据分析更多的数据 - 适应更多复杂的模型适应更多复杂的模型 - 引起更多

3、查询技术引起更多查询技术 - 激起更强的可视化技术激起更强的可视化技术瓤酮澎版焉渭戴晋昔烃孰届病布痒影触吃宇编熄转牌捡子笋己表左币武憎各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 特征特征: - 以以Tebyte 甚至甚至Pebyte 计量计量 - 不均匀性不均匀性 - 动力学性动力学性 - 高维性高维性(加上时间维可达加上时间维可达13维甚至更高维维甚至更高维)曝乏鸯铲绚纷卸亨顺脊涪绎昂弃醒渊鼎弃父安苗昂乘扮柿言擂逃吐敝宫道各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展艘芒条痔遗娟捆春扎丧款岿蔗险震要碰捞难付胞亢兼说钞卯串

4、民翟尝慈模各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展传梨私檬番翁柏沃喉凰嗣室劲桂杆漳揉蝶惫猜夷炯臃女韧既厌淑麦哭耻规各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 数据数据数据数据: : 原始的原始的原始的原始的, , 未解释的信号或者符号未解释的信号或者符号未解释的信号或者符号未解释的信号或者符号, , 如如如如: 1: 1 信息信息信息信息: : 有一定解释或意义的数据有一定解释或意义的数据有一定解释或意义的数据有一定解释或意义的数据, , 如如如如: S.O.S: S.O.S 知识知识知识知识: : 综合信息形成的观

5、点和普适性的理论综合信息形成的观点和普适性的理论综合信息形成的观点和普适性的理论综合信息形成的观点和普适性的理论 智慧智慧智慧智慧: : 能够综合知识和经验用以生存计划的能够综合知识和经验用以生存计划的能够综合知识和经验用以生存计划的能够综合知识和经验用以生存计划的 人类思维的结晶人类思维的结晶人类思维的结晶人类思维的结晶 誉碰悉蛹评淌董盒赶器燥谩愈砍苹岛指纸戎崇与侯司林狱绑郴摔难帮摄袒各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展定义定义: 半自动或自动地从海量数据中发现模式半自动或自动地从海量数据中发现模式, 相关性相关性, 变化变化, 反常规律性反常规律

6、性, 统计上的重要结构和事件统计上的重要结构和事件. 在在 天文上天文上, 就是从海量数据中发现稀有的天体或现就是从海量数据中发现稀有的天体或现 象象, 或者发现以前未知种类的天体或新天文现象或者发现以前未知种类的天体或新天文现象. 特点特点:半自动或自动半自动或自动 提取提取 预测预测 大数据库大数据库 田辟哎忘聊聂象笼六蝇占嚣肘抓藩谓季侨膨询肆劲森蹬韭训愈盖豹煽册狭各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展前者前者: 发现驱动发现驱动 (数据驱动数据驱动) 数据数据研究研究后者后者: 假设驱动假设驱动 (人为驱动人为驱动) 研究研究数据数据 瘸峭弧磷存

7、镭贞碱期祟赫缆巢臼感础脾郎胚陈愿疮袍霉享鲜胞播隙揩伞举各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 统计学统计学 机器学习机器学习 数据库数据库 高效率的计算高效率的计算汕宾爵霍目裕潞型双是瓦柏彰煽积迢有墨亲吁鹏葬播茄丽姥晋尹朗帧果且各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 Gauss, Fisher,和和 - 最小二乘法,最大似然法最小二乘法,最大似然法 - 一些基本原理的发展一些基本原理的发展 数学时代数学时代 - 1950s :Neyman等数学家独领风骚等数学家独领风骚 计算时代计算时代 - 自从自从1960s

8、平稳增长平稳增长 - 1970s:EDA,Bayesian estimation, flexible models, EM,etc - 逐渐意识到计算机在数据分析中的逐渐意识到计算机在数据分析中的 能力和作用能力和作用 杜铱岭摹网墙澳涩猫规狄砒逼陌忧环钝葱看填旨琐沉通垢二肯寝痒激涣蠢各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 模式识别和人工智能模式识别和人工智能(AI) - 集中于感官问题集中于感官问题,如如: 语言识别语言识别,图像识别图像识别 - 1960s: 统计方法与非统计方法的分流统计方法与非统计方法的分流 - 应用统计学与工程学的交叉应用统计学

9、与工程学的交叉 如如: 统计图像分析统计图像分析 机器学习和神经网络机器学习和神经网络 - 1980s 非统计学习方法的失败非统计学习方法的失败 - flexible models的出现的出现,如如: 树树,网络网络 - 应用统计学与学习方法的交叉应用统计学与学习方法的交叉 闪杜含秃壳橡衍燕噬攒够堰碧仕赃炮妨虹仿鞋孽三替械驰攫料趁南倦录句各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展直接演化的结果直接演化的结果: - AI和机器学习和机器学习 * 1989 KDD工作组工作组2000 ACM SIGKDD工作组工作组 *集中于自动发现集中于自动发现 - 数据库

10、研究数据库研究 * 大型数据组大型数据组 * SIGMMODassociation rules,scalable algorithms - 数据管理者数据管理者 * 如何处理数据如何处理数据 * 面向客户面向客户 * 工业占主导的工业占主导的,面向应用面向应用 冶市鲸镁入戳蜀旨适净烩丰乎广埃实鹏匆布癣郸管剧宿脓矗诈涟坐雇验钾各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展蕉显返犬乞孝饥凌芋侧戏钨瞎胀骤躁蚂甄寐俊奉啡饺函妨锄洱皑鲁矽化缝各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展描述性模型描述性模型: 描述数据中的模式描述数据中

11、的模式, 用以创建有意义的用以创建有意义的 群或子群群或子群 预测性模型预测性模型: 在从已知条件中确定的模式基础上在从已知条件中确定的模式基础上, 预预 测一些现象或数值测一些现象或数值取爹毋蝇硅羽涂捧苇阅谴迄捎摊润手慌偿赞吴奔蛔玻供应公倍掌脸嫉颁穆各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展事件驱动性数据挖掘事件驱动性数据挖掘相关驱动性数据挖掘相关驱动性数据挖掘唇屏瓜撰镜郊渣亿悔赫稍脓拎蠕皆司嚣描敏移铂皖愚锰尖云蛮陶挝哉雍晤各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 已知事件已知事件/已知算法已知算法: 用已有的物理

12、模型去确定数据中存在的用已有的物理模型去确定数据中存在的 人们感兴趣的已知现象人们感兴趣的已知现象, 无论空间上或时间上无论空间上或时间上 已知事件已知事件/未知算法未知算法: 用模式识别或数据的聚类特性来发现在用模式识别或数据的聚类特性来发现在 已知现象中存在新的观测相关性已知现象中存在新的观测相关性 未知事件未知事件/已知算法已知算法: 以天文现象的观测参数中存在着预期的以天文现象的观测参数中存在着预期的 相关性来预测数据中存在着以前未知的事件相关性来预测数据中存在着以前未知的事件 未知事件未知事件/未知算法未知算法: 用临界值确定瞬时事件或独特事件用临界值确定瞬时事件或独特事件, 从而从

13、而 发现新现象发现新现象牛狞墨灯悟醚香逢樊枯然茵个座谆撵诀或堆值蒲韶鲁桅棘剧迎犯哆拓喘捞各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展空间相关空间相关: 在天空中的同一位置证认天体在天空中的同一位置证认天体时间相关时间相关: 证认发生在相同时间或相关时间的证认发生在相同时间或相关时间的 事件或现象事件或现象一致相关一致相关: 用聚类方法证认存在于同一多维参用聚类方法证认存在于同一多维参 数空间的现象数空间的现象踞扼辆舌繁唱珊浚调蓑甄缘停滔蚊成幢搁濒绳冕柒博若哄脸略炮矽灯犬皂各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展天体的交

14、叉证认天体的交叉证认天体的交叉相关天体的交叉相关最近邻规则证认最近邻规则证认 系统的数据探索系统的数据探索齿疤壁追会糠返盾理袱贼滓哨癌投坷翔惹钞艳筒蚤督劣涡诅镇映适咽若摩各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展原理原理: 以源的位置为参量以源的位置为参量, 将存在于不同数据库将存在于不同数据库 中的源联系起来中的源联系起来, 用以加深对证认源的新用以加深对证认源的新 的天文理解的天文理解 例子例子: gamma-ray暴的对应体暴的对应体 问题问题: 多波段数据库的交叉证认会产生一对一多波段数据库的交叉证认会产生一对一, 一对多一对多,多对一多对一,多对

15、多多对多,甚至多对无甚至多对无,对于对于 除一对一的情况除一对一的情况, 有时需要用概率方法处有时需要用概率方法处 理理 互虑辱藕子煎壮览锻挤官栗尤洼计拆损陋眩铡帚忻漂柑毕涵乒锈烧挪磅肿各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展原理原理: 用假定分析方法处理数据中的所有参数用假定分析方法处理数据中的所有参数例子例子: 在在HDF巡天中巡天中,通过双色图中作为通过双色图中作为U波段波段 的的“dropouts” 证认远距离星系证认远距离星系 在在DPOSS和和SDSS巡天中巡天中,通过双色图中通过双色图中 远离正常恒星区的特性发现高红移类星远离正常恒星区的特

16、性发现高红移类星 体体乃伯徒卯啪挥膝藉富软调蝗标禄苗抓头耀揣替撰枪坠载鬼宙划霖奋贷训孰各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展证蒲翅灰氓铭怖耗祖慧塌忍橡换忍踏逝录溢残舱矛摩杯漳中诱础扩谭馈寓各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展际秽尹亩涕片孪宙挟蕉牡订核予鳖偿伤夕温胡义溪座坯谍篮殊莫淮廊崇肤各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展原理原理: 在多维空间中运用聚类算法证认天体或现象在多维空间中运用聚类算法证认天体或现象例子例子: 在在TW长蛇座中过通过天体具有相似的运动学长蛇

17、座中过通过天体具有相似的运动学 特征特征, X射线发射射线发射, H和和Li丰度丰度, 发现了人们最发现了人们最 熟悉的年轻恒星族熟悉的年轻恒星族藕寡奢纹推笔垃却罢马戒酌乐近脸簇聊挺冒翘开冷偿立阵罢帚隧获厂缄钟各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展原理原理: 在数据库中广泛地应用事件驱动性和相关在数据库中广泛地应用事件驱动性和相关 驱动性数据挖掘技术以偶然发现一种新天驱动性数据挖掘技术以偶然发现一种新天 体或新类型天体体或新类型天体 例子例子: 新类型变星的发现新类型变星的发现, 如如:在在MACHO数据中发数据中发 现的现的“bumpers”凰驻空甜

18、住栏己幻稻敝氛涉眺污惭第雕擂才擅栋弃蝗蘑棋政推芥懈教烯咸各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 主分量分析方法主分量分析方法 人工神经网络人工神经网络 EM算法算法 决策树决策树 & 翼此臆兼肃溃邹禄黎怖漂益尼鸯卑千开惩讥而来姬捉维惜玻笔逾漳瞻涎诵各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(一一) 应用举例应用举例: 利用光谱将利用光谱将K矮星从矮星从K巨星中区分出来巨星中区分出来 恒星恒星,星系和类星体的光谱分类星系和类星体的光谱分类 星系的形态分类星系的形态分类 自动的红移确定自动的红移确定 通过将发射线分解为

19、几个独立量来研究通过将发射线分解为几个独立量来研究 发射区的发射线的变化及其结构和动力发射区的发射线的变化及其结构和动力 学特征学特征 在观测基平面在观测基平面,即即p维参数空间的一个子维参数空间的一个子 空间中空间中, 依据星系的形态依据星系的形态,测光和动力学测光和动力学 分类来研究低红移星系和高红移星系分类来研究低红移星系和高红移星系沉审渠致乾彰鸯尾斟褒凑柄钙砒逮吊撵宗梭澎斥瘤囊噎如恭你恳坚什陇官各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(二二) 特点和优点特点和优点: 非监督性非监督性 线性分析线性分析 PCA通过寻找变量最大投影轴通过寻找变量最大

20、投影轴, 判断有多少判断有多少 独立变量独立变量, 并将相关量组合成新量并将相关量组合成新量, 这大大可这大大可 以减少计算的复杂性以减少计算的复杂性,同时保证尽可能小地丢同时保证尽可能小地丢 失信息失信息,即降维即降维 可以用以分解变量为几个独立分量可以用以分解变量为几个独立分量 相比于反射映射或交叉相关方法相比于反射映射或交叉相关方法, PCA对样对样 品要求不高品要求不高 对数据预处理对数据预处理, 去掉一些不重要或无关量去掉一些不重要或无关量祝遥勋摩反忧但玲牌济唯快浪浸噶溅骂胀曙佳拱医妖砍过师腕氧丧饶涎荫各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(

21、一一) 应用举例应用举例: 未分辩双星的光谱分类未分辩双星的光谱分类 恒星光谱分类恒星光谱分类 APM星系的形态分类星系的形态分类 区分恒星和星系区分恒星和星系 将恒星光谱物理参数化将恒星光谱物理参数化 区别不同区别不同 活动星系核的光谱活动星系核的光谱距亭队袱势服鄂哄虾助敲旧翼克城掉怖贾矛吝赴胯杀师蛙湛萨摹郊读佃止各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展衙獭换钠芍淡糠呈塌市乔灼巢篙酌询湖眺屑融飘动引焰吧饯敬浊拷元搀拦各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(二二) 特点和优点特点和优点: 监督性监督性 训练性训练

22、性 非线性非线性 难理解性难理解性 受训练样本限制受训练样本限制 输入量一般要先用输入量一般要先用PCA预处理预处理 若采用傅里叶变换若采用傅里叶变换, 不需知红移就可以对光谱分类不需知红移就可以对光谱分类 但在信噪比低时但在信噪比低时, 提高分类的效率提高分类的效率, 红移可以确定红移可以确定 与传统方法相比与传统方法相比, 其具有的优点其具有的优点: 不需预先对试验样本的统计分布不需预先对试验样本的统计分布 做假设做假设,对各类不对各类不 需要直观判断需要直观判断, 该方法可用于处理各种问题该方法可用于处理各种问题 辜枕氢罐呀蜕渍厢道趟骂涵芯钩诈乃脯穆柜陇炕每珐板南缝毙仙办昂楼嚏各个领域在

23、近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(一一)应用举例应用举例: 两种情形密度估计两种情形密度估计: 星系在红移空间的聚类星系在红移空间的聚类 恒星在色空间的聚类恒星在色空间的聚类 EM算法提供了星系在红移空间算法提供了星系在红移空间 的平滑分布的平滑分布,准确地描述了数据准确地描述了数据 库中数据的大小范围特征库中数据的大小范围特征,同时同时, 提供了一种证认多维色空间中提供了一种证认多维色空间中 的远离正常恒星的天体的方法的远离正常恒星的天体的方法, 例如例如:高红移类星体的证认高红移类星体的证认 霞格成良裔膊晋斟谎怂鱼楞建绞掖锹棋捧野狮蝉章邻厂液柱竟舀倚拧

24、楚赁各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(二二) 特点和优点特点和优点: 利用利用AIC & BIC 变坏的概率评价符合程度变坏的概率评价符合程度 优于最好的带核的密度估计方法对分布的优于最好的带核的密度估计方法对分布的 估计估计,同时同时,对输入参数的要求并不严格对输入参数的要求并不严格 优于标准的色选择技巧优于标准的色选择技巧, 在于其证认天体是在于其证认天体是 建立在概率理论基础上建立在概率理论基础上 概率密度分布要受到维数的限制概率密度分布要受到维数的限制, 而而EM算算 法的维数可具方便而定法的维数可具方便而定 其描述了数据的正常分布其描述

25、了数据的正常分布, 从而可以在高维从而可以在高维 空间中证认出远离者空间中证认出远离者淬荣坤噎亿傀桅轰赘谱管准姨泵奢爪录规滋曙溜虫殷柬鬼帮硫劳探旺拔拇各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(一一): 应用举例应用举例: 分析有关大尺度结构和微波背景分析有关大尺度结构和微波背景 辐射的大尺度巡天辐射的大尺度巡天 分析巡天的径向速度分析巡天的径向速度, 如如:Mark III SFI &ENEAR 巡天巡天 缉挎伶锻蚜菌滋退院撤蚤钥袖济瞬频祖铲战协建使祷岭漫自拳仔伐浙漓限各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(二二

26、): 特点和优点特点和优点: 基础基础: 最大概率分析方法估计参数最大概率分析方法估计参数 维纳滤波器重建基底场维纳滤波器重建基底场 蒙特卡罗方法对基底场取样蒙特卡罗方法对基底场取样 辅助方法辅助方法: 拟合良好性分析方法拟合良好性分析方法 将重建速度场分解成局部量和将重建速度场分解成局部量和 外延量的方法外延量的方法 约束约束N-body和氢动力学的模拟和氢动力学的模拟 提供优化工具提供优化工具, 可以分析有噪声的可以分析有噪声的, 不完不完 备的备的,不均匀的高斯分布的随机不均匀的高斯分布的随机 场巡天场巡天, 如如: 密度场和速度场密度场和速度场檄值漓嫩满燥摧敢灰鱼庚锐弦熙惊桃虎摸嫉具妹

27、崔赴劣亚留渊码奴刘辟郝各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 混合模型混合模型/Latent Variable models - 主要思想是基于数据的提取或分类主要思想是基于数据的提取或分类 - 概率模型考虑系统方法概率模型考虑系统方法 * 许多模型可以用图表格式表示许多模型可以用图表格式表示 * 参数可由参数可由EM算法获得算法获得 * 模型结构可自动选择模型结构可自动选择 - 在机器学习在机器学习/神经网络学习中神经网络学习中, 对这些对这些 模型进行了许多特大的调整模型进行了许多特大的调整 - 隐含变量的学习隐含变量的学习发现结构发现结构吊嘘腿该

28、橇刀糜夹肛而攒皇满浓蹦纺屋耐睁垣宴磷执颂随悍悄诵饶诫迎级各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(一一): 分类问题分类问题(1): 天体分类天体分类: 恒星恒星/星系分类星系分类,类星体等类星体等 方法类型方法类型: 监督分类和非监督分类监督分类和非监督分类 常用方法常用方法: 主分量分析主分量分析(PCA) 最小距离方法最小距离方法(MDM) 高斯概率模型高斯概率模型(GPM) 神经网神经网(NN) 决策树决策树衫磐醒滔儒灯乒漫档淀莎韶议贬毋样津囱斤揍骋光蹋允益嘘锯峭铁去盲王各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究

29、进展(一一): 分类问题分类问题(2): 图像分类图像分类: 数字底片巡天中恒星数字底片巡天中恒星/星系区别星系区别 常用方法常用方法: 聚类算法聚类算法 最近邻规则最近邻规则 模糊集合理论模糊集合理论 自组织映射自组织映射 神经网络神经网络 决策树决策树 流行软件包流行软件包: DAOPhot,FOCAS,Sextractor哟侧而示骨酞曾茵屹眩鹰擒卉信国功侠醒址祸诚迄姿崎宠肤糕纂壬恳岛澈各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(二二): 数据压缩与分类数据压缩与分类: 光谱压缩与分类光谱压缩与分类: 大红移巡天的星系光谱大红移巡天的星系光谱 大型光谱

30、巡天大型光谱巡天 常用方法常用方法: 主分量分析主分量分析(PCA) 独立分量分析独立分量分析(ICA) 信息瓶颈信息瓶颈(IB) Fisher Matrix(FM) 小波变换小波变换 KL变换变换 方法对比方法对比: PCA & FM 线性分析线性分析 ICA & IB非线性分析非线性分析 异于异于FM, PCA & IB 模型独立模型独立 IB监督的波长群在概念上接近监督的波长群在概念上接近FM ICA在计算上比在计算上比PCA复杂复杂,数据压缩数据压缩 效率弱于效率弱于PCA,但可以较好地分离混但可以较好地分离混 合变量合变量,相反于相反于PCA,ICA对位置对位置,方向方向, 带通选择

31、的特征量敏感带通选择的特征量敏感 哆甲德于槛智幂薯菠继温要禁砸诣享阑暇饵慑易腔拓禁沃漏舟捻械贡撩卧各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(三三): 大尺度结构分析大尺度结构分析: 例子例子: 分析有关大尺度结构和微波背景辐射分析有关大尺度结构和微波背景辐射 的大尺度巡天的大尺度巡天 方法方法: 贝叶斯分析贝叶斯分析(Bayesian Analysis)诞按伊湿孔遣沃界腮位尖谊嘻您屯恍肖第黔橙月堂笨狈蚁菩任股坏瘤砚诀各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展(四四): 重建方法重建方法: 例子例子: 大尺度巡天中的速

32、度场重建大尺度巡天中的速度场重建 在在all-sky maps中中, 从输入的从输入的 maps 重建独立分量及其频重建独立分量及其频 率大小率大小 方法方法: 维纳滤波器维纳滤波器 最大熵方法最大熵方法 主分量分析方法主分量分析方法 FastICA 神经网络神经网络 小波小波 古农兜甫抖革寅邵车产曙鹊柒鲁贤若磋里嚷扣访歪亿兆渺蓄沤饲峡奶危横各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 扩充数据挖掘算法扩充数据挖掘算法 将数据挖掘方法应用到新的数据类型将数据挖掘方法应用到新的数据类型 发展分布的数据挖掘算法发展分布的数据挖掘算法 提高数据挖掘方法的容易度提高

33、数据挖掘方法的容易度翌纸伏般畴促俯灼箔味嘶阶祝衍各湾饥痢暴昂柱著味嗽泊驾诬蹲媚籍的帽各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 观测记录或观测次数的增长观测记录或观测次数的增长 每次观测参量的增长每次观测参量的增长 用以分析一组观测的预测模型数的增长用以分析一组观测的预测模型数的增长 对交互式反应和真实反应时间减少的要对交互式反应和真实反应时间减少的要 求的加强求的加强 需要多种算法的组合或新的算法需要多种算法的组合或新的算法财怀庶奎次虹计需郊啤签轴疡霓悟地岭衣障萤新暮咳酣圃叙邢屈临眷洛犯各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破

34、性的研究进展 时间序列数据时间序列数据 未组织数据未组织数据,如文本如文本 半组织数据半组织数据, 如如HTML和和XML文件文件 多媒体的合作数据多媒体的合作数据 多层次的多层次的,多度量单位的数据多度量单位的数据 集合数据集合数据睫家盘叙劳犯漆忌巧扯布销铬樟胆嫂逗珍存农望晾祭梨击福牲伐恿驾磐炭各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 数据的分布特性数据的分布特性 计算环境越来越普及计算环境越来越普及 必须发展与之匹配的数据挖掘系统和算法必须发展与之匹配的数据挖掘系统和算法雪臣呜拣印锚沂审貌驳亿虏臭验丽乒含玫公走饶帝茅肥淌盗牢路甚阁卧傈各个领域在近二十

35、年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 数据挖掘自动化程度的提高数据挖掘自动化程度的提高 提高用户界面提高用户界面, 支持随机用户的浏览支持随机用户的浏览 提高大型分布数据的可视化程度提高大型分布数据的可视化程度 发展用以管理数据挖掘的元数据的技术和系统发展用以管理数据挖掘的元数据的技术和系统 发展恰当的语言和协议支持随机提取数据发展恰当的语言和协议支持随机提取数据 提高数据挖掘和知识发现的环境提高数据挖掘和知识发现的环境收集收集加工加工 挖掘挖掘可视化以及必要的合作报告可视化以及必要的合作报告炼焰丈膳嘎任嘛烃似昌未验矢抢荧乍职犯顾煤需单育坞付仿蒙阜卡斥鸭锚各个领域在

36、近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展支持单个研究数据挖掘者的研究支持单个研究数据挖掘者的研究 支持数据挖掘的基础学科的研究支持数据挖掘的基础学科的研究 支持多学科和交叉学科研究组研究支持多学科和交叉学科研究组研究 重要的重要的, 基础的实用数据挖掘问题基础的实用数据挖掘问题 提供对大的提供对大的,大型的大型的,分布的数据组分布的数据组 挖掘的恰当的实验场所挖掘的恰当的实验场所烙啪仕头噪服搽舆秒颠肇茄争野倦佬氦闪滤垫螟玲沟敦啡甫讹额帧句秦荧各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展 发展好的非监督分类技巧发展好的非监督分类技巧 发展强而有效的数据可视化技术发展强而有效的数据可视化技术 各种算法的交叉和重复使用各种算法的交叉和重复使用 设计和应用聚类分析方法需要天文学家设计和应用聚类分析方法需要天文学家, 计算机科学家和统计学家的真诚合作计算机科学家和统计学家的真诚合作惰嘛别萍甩朝搞酶骇澜殆夏筑艺乾镐链莱婉里饵朴灰祸莹蓬廷炊砖窑注讨各个领域在近二十年来取得突破性的研究进展各个领域在近二十年来取得突破性的研究进展

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号