美国政府大数据计划中文译稿

上传人:第*** 文档编号:56762883 上传时间:2018-10-15 格式:DOC 页数:18 大小:39.50KB
返回 下载 相关 举报
美国政府大数据计划中文译稿_第1页
第1页 / 共18页
美国政府大数据计划中文译稿_第2页
第2页 / 共18页
美国政府大数据计划中文译稿_第3页
第3页 / 共18页
美国政府大数据计划中文译稿_第4页
第4页 / 共18页
美国政府大数据计划中文译稿_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《美国政府大数据计划中文译稿》由会员分享,可在线阅读,更多相关《美国政府大数据计划中文译稿(18页珍藏版)》请在金锄头文库上搜索。

1、美国政府大数据计划的中文译稿美国政府大数据计划的中文译稿存储在线 12 年 04 月 16 日 17:00 【转载】 作者:博客 赵国栋 责任编辑:王振 导读:今天,奥巴马政府宣布 “大数据的研究和发展计划 Big Data Research and Development Initiative”通过提 高我们从大型复杂的数字数据集中提取知识和观点的能力, 承诺帮助加快在科学与工程中的步伐,加强国家安全,并 改变教学研究。 关键词: 美国政府 数据管理 大数据今天,奥巴马政府宣布 “大数据的研究和发展计划。”通 过提高我们从大型复杂的数字数据集中提取知识和观点的 能力,承诺帮助加快在科学与工程

2、中的步伐,加强国家安 全,并改变教学研究。这个计划里,六个联邦政府的部门和机构宣布新的 2 亿 美元的投资,提高从大量数字数据中访问、组织、收集发 现信息的工具和技术水平。了解更多正在进行的联邦政府 的计划,解决所大数据所带来的机遇和挑战,可通过大数 据表来了解大数据革命。我们还计划与工业界、大学研究界、非营利性机构与管 理者一起利用大数据所创造的机会。显然,不能单单依靠 政府,需要我们总统所呼吁的“众人拾柴火焰高”这样的努力。一些相关的公司已经赞助大数据相关的比赛,并给大学 提供这方面的研究资助。大学里也开始开设一门全新的研 究型课程,培养下一代的“数据科学家”。一些无国界的组织 帮助非营利

3、性机构对公益服务的数据进行采取、分析和 可视化处理。白宫科技政策办公室将会非常有兴趣支持建 立一个跟大数据相关论坛,包括最新的公私组织之间的合 作。美国政府的大数据计划美国政府的大数据计划亮点:为应对大数据革命带来的机遇,联邦政府制定计 划,推进相关研究机构进一步进行科学发现和创新研究。国防部国防部 (DOD) 国防部高级研究计划局国防部高级研究计划局(DARPA)多尺度异常检测(ADAMS)项目解决大规模数据集的异 常检测和特征化。项目中对异常数据的检测指对现实世界 环境中各种可操作的信息数据及线索的收集。最初的 ADAMS 应用程序进行内部威胁检测,在日常网络活动环境 中,检测单独的异常行

4、动。网络内部威胁(CINDER)计划,旨在开发新的方法来检 测军事计算机网络与网络间谍活动。作为一种揭露隐藏操 作的手段,CINDER 将适用于将对不同类型对手的活动统 一成“规范”的内部网络活动,并旨在提高对网络威胁检测的 准确性、和速度。Insight 计划主要解决目前情报,监视和侦察系统的不 足,进行自动化和人机集成推理,使得能够提前对时间敏 感的更大潜在威胁进行分析。该计划旨在开发出资源管理 系统,通过分析图像和非图像的传感器信息和其他来源的 信息,进行网络威胁的自动识别和非常规的战争行为。Machine Reading 项目,旨在实现人工智能的应用和 发展学习系统的过程中对自然文本进

5、行知识插入,而不是 依靠昂贵和费时的知识表示目前的进程,并需要专家和相 关知识工程师所给出的语义表示信息。Minds Eye 项目,旨在为机器建立视觉的智能。传统 的机器视觉研究的对象选取广泛的物体来描述一个场景的 属性名词,而 Minds Eye 旨在增加在这些场景的动作认识 和推理需要的知觉认知基础。总之,这些技术可以建立一 个更完整的视觉智能效果。Mission-oriented Resilient Clouds 项目通过技术进 行检测,诊断并对攻击作出响应,有效地建立了“社区卫生 服务系统”的云,以解决云计算固有的安全挑战。该方案还 旨在开发新技术,使云应用和基础设施受到攻击时能够继

6、续运行。只要整体能够有效的运行和保存,可以允许个别 主机和任务损失。对加密数据的编程计算(PROCEED)的研究工作旨在开 发实用的方法,相关现代化计算编程语言,使数据加密时 仍然能使用云计算环境,以克服信息安全的重大挑战。使 用户能够不需首次解密的情况下能够操纵加密的数据,它 将使得对手拦截信息更加困难。在视频和图像的检索和分析工具(VIRAT)计划旨在开发 一个系统能够利用军事图像分析员收集的数据进行大规模 的军事图像分析。VIRAT 如果成功,将使分析师能够在相 关活动发生时建立警报。VIRAT 还计划开发工具,能够以 更加准确率和召回率的去从大量视频库里进行视频内容的 检索。XDATA

7、 项目计划旨在开发用于分析大量的半结构化和 非结构化数据的计算技术和软件工具。最核心的挑战是, 可伸缩的算法在分布式数据存储应用、如何使人机交互工 具能够有效的迅速定制不同的任务,以方便对不同数据进 行视觉化处理。对开源软件工具包的灵活使用,使得能够 处理大量国防应用中的数据。国土安全部国土安全部(DHS)卓越研究中心和可视化数据分析(CVADA),罗格斯大学 和普渡大学(以及另外三个伙伴大学)的研究人员之间进行协 作,通过对大量的异构数据进行研究,使得急救员可以发 现人为或自然灾害、恐怖事件,需要执法的边境安全问题, 网络威胁的爆炸物。能源部能源部 (DOE)科学办公室高级科学计算研究办公室

8、(ASCR)提供数据管理,可视 化和数据分析的社区,包括数字化保存和社区访问。套件 程序里包括广泛使用数据管理的技术,如 开普勒科学的工 作流程系统;存储资源管理标准;各种数据存储管理技术,如 BeSTman,大容量数据移动器和适应式的 IO 系统 (ADIOS); FastBit 数据索引技术(雅虎使用)和两个主要的 科学可视化工具,ParaView 和 VisIt。高性能存储系统(HPSS)是对磁盘和磁带系统上 PB 级数 据进行管理的数据管理软件。 由美国能源部和 IBM 开发的 HPSS 在世界各地的大学和实验室的使用,用在数字图书 馆,国防应用和包括纳米技术,基因组学,化学,磁共振

9、成像,核物理,计算流体力学,气候在内的一系列学科, 以及诺斯罗普格鲁门公司,美国国家航空航天局(NASA) 和美国国会图书馆。对千万亿次的数据分析处理从庞大的科学数据集提取信 息,发现其主要特征,并理解其间的关系。研究领域包括 机器学习,数据流的实时分析,非线性随机的数据缩减技 术和可扩展的统计分析技术,广泛适应于从能源部到电网, 包括宇宙学和天气数据,传感器数据等。下一代网络方案支持工具,使得合作研究在能够进行重 大发现,包括 2001 年的 Globus 中间件项目大量数据的 移动和使用, 2003 年的 GridFTP 的数据传输协议, 2007 年的地球系统网格(ESG)的工具。今天的

10、 GridFTP 的服务器开放科学网格,ESG,和生物社区的科学数据每 月超过 1 PB 的移动。 Globus 中间件也被得克萨斯大学, 软件公司,石油公司利用并一起合作,培养学生能够使用 先进的石油工程方法和集成的工作流程。基础能源科学办公室基础能源科学办公室(BES)BES 的科学用户设施支持旨在协助用户数据管理和分析 大数据,可每天从一个单一的实验数据大容量化(1012 字 节)努力。例如,加速数据采集,处理和分析(ADARA)项目 解决了数据的散裂中子源(SNS)的数据系统提供实时分析, 实验控制的工作流程需要,以及已经建立 X 射线影像资料 库,以最大限度地提高数据的可用性和更有效

11、地利用同步 加速器光源。在 2011 年 10 月,由生物工程学会和 ASCR 的基础能 源科学的数据和通信研讨会将确定实验数据的需求,这可 能会影响的科学发现。生物和环境研究计划(BER)大气辐射测量(ARM)气候研 究设施是一个多平台的科学用户设施,提供重要的大气现 象的精确观测研究,大气过程的认识的进步需要国际社会 的基础设施和气候模型。 ARM 的数据是可以进行应用的, 并以其作为文章发表在一个超过 100 年历史的杂志。正在 处理收集和展示的高时间分辨率和光谱信息,从数百文书 相关的挑战,以满足用户的需求。系统生物学知识库(Kbase)是一个社区驱动的软件框架, 对微生物,植物和环境

12、条件下的生物群落功能的数据驱动 的预测。 kbase 是一个开放式的设计与开发,以提高算法 的开发和部署效率,并增加从异构数据源的实验数据的获 取和集成。 kbase 是不是一个典型的数据库,而是一种手 段,以解释缺少的信息成为实验设计预测工具。聚变能源科学办公室聚变能源科学办公室(FES)通过 FES 和高级科学计算研究(ASCR)办公室高级计算 合作的(SciDAC)科学发现在在聚变能的科学计算和实验研 究大数据存在的挑战。 ASCR-FES 开发的数据管理技术, 包括高性能的输入/输出系统,先进的科学的工作流程和出处框架,可视化技术解决独特的融合需求,已经吸引了欧 洲一体化建模的努力和国

13、际热核实验堆,一个国际核核聚 变研究和工程项目的关注。高能物理办公室高能物理办公室(HEP)高能物理计算计划经过了全球数百名科学家的努力,支 持大量的分析研究,复杂的实验数据集,以及大量的模拟 数据。协作企业进行大数据管理,包括生产和分布式分析 PanDA(产品分布式分析)工作量管理系统和 XRootD,一 种高性能,快速,可扩展访问多种数据存储库的容错软件。核物理办公室核物理办公室(NP)美国核数据计划(USNDP)是一个多方面努力,涉及 7 个国家实验室和两所大学的项目,提供跨越多个领域,核 物理,编译和交叉检查,对所有原子核的重要性质的相关 实验结果,维护和广泛使用的专用数据库。科学和技

14、术信息办公室科学和技术信息办公室(OSTI)OSTI,唯一的 DataCite 美国联邦机构成员(全球领先 的财团科学和技术信息的组织)中发挥了关键作用,在塑造 实践的政策和技术实现数据的引用,这使得可以跟踪数据 的影响,使有效的重用和数据核查和学术结构的表彰和奖 励数据生产商可设立。退伍军人管理部退伍军人管理部(VA)医疗保健信息研究所(CHIR)开发自然语言处理(NPL)工 具,能够对在 VA 以文本形式存储的大量数据进行信息解锁。VA 正在努力通过保护作战人员使用文字处理算法捕获 公共卫生事件(ProWatch),正在开发一个的生产透明,重复性好,可重复使用的各种安全相关的事件监控软件探

15、测, 以研究为基础的监控程序,能够跟踪,测量与军事部署相 关的健康条件。AViVA 是 VA 的下一代就业人力资源系统,将业务应用 程序和基于浏览器的用户界面分开的数据库。分析工具已 经被建立在此基础上研究,最终决定在对病人进行支持。医学成果观察项目设计用来比较各种安全监测分析方法 的有效性,可行性和性能。企业数据仓库(CDW)是 VA 的项目,组织和管理从各种 渠道传递的个人和群体的疾病和?治疗的完整视图的数据。健康资料库是卫生保健提供者的数据格式规范的数据, 尤其是 VA 和国防部之间,让 CDW 集成的数据。基因组信息系统综合科学(GenISIS)计划,通过个性化 医疗,提高退伍军人的医

16、疗保健。 GenISIS 通过接触获 得电子健康记录和遗传数据,可以跨 VA 进行的临床试验, 基因试验和成果研究的临床研究。万美元老将计划招募退伍军人自愿的血液样本的基因分 型和基因测序。这些基因样本支持 GenISIS,将归于“型” 在个别老将的了解遗传疾病状态的健康记录。VA 的信息和计算基础设施提供的分析大型数据集,现 在在 VA,促进合作研究,在 VA 的网络上的任何地方,分 析工作区和工具。卫生和人类服务部卫生和人类服务部(HHS) 疾病控制和预防中心疾病控制和预防中心(CDC)生物传感 2.0 是第一个考虑到区域和国家协调的情况下, 通过互操作的网络系统对公众健康意识的可行性分析的系统,其建立在现有的国家和地方的能力之上。生物传感 2.0 移除许多单片物理结构相关的成本,同时还对最终用户透 明的分布式系统方面,以及作出适当的分析和报告的数据 访问。疾病预防控制中心的特别细菌学参考实验室(SBRL)的 使用细菌和疫情 ID 网络生物学技术从有效,迅速爆发中检 测未知的细菌病原体。谱系基因组学,比较整个基因组 DNA 序列的系统发育分析,将带来基于序列识别的概念

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 调研报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号