2021年数据价值释放与隐私保护计算应用研究报告.docx

上传人:新** 文档编号:547759085 上传时间:2023-09-06 格式:DOCX 页数:60 大小:339.75KB
返回 下载 相关 举报
2021年数据价值释放与隐私保护计算应用研究报告.docx_第1页
第1页 / 共60页
2021年数据价值释放与隐私保护计算应用研究报告.docx_第2页
第2页 / 共60页
2021年数据价值释放与隐私保护计算应用研究报告.docx_第3页
第3页 / 共60页
2021年数据价值释放与隐私保护计算应用研究报告.docx_第4页
第4页 / 共60页
2021年数据价值释放与隐私保护计算应用研究报告.docx_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《2021年数据价值释放与隐私保护计算应用研究报告.docx》由会员分享,可在线阅读,更多相关《2021年数据价值释放与隐私保护计算应用研究报告.docx(60页珍藏版)》请在金锄头文库上搜索。

1、2021年数据价值释放与隐私保护计算应用研究报告护计算技术助力加快驱动生产、生活、治理方式的变革,以及营造良 好数字生态。1 .打造数字经济竞争优势,驱动生产方式变革在数字经济建设方面,数据凭借其可复制、可共享、可无限供给 的特点,助力产业实现精细管理、精益生产、精准营销、精确规划等 提升,以此降低经济运行成本、提高经济运行效率、赋能传统产业转 型升级,催生大量新产业、新模式、新业态。依托数字经济中的海量 数据规模和丰富应用场景优势,隐私保护计算技术助力打破“数据壁 垒”,推动数据赋能全产业链协同转型,助力形成高质量供给创造新 需求、需求牵引供给的动态平衡,促进国民经济良性循环。2 .加快数字

2、社会建设步伐,驱动生活方式变革在数字社会建设方面,隐私保护计算在助力推进学校、医院、养 老院等公共服务机构实现资源数字化的基础之上,有助于进一步加大 开放共享和应用力度,推动线上线下公共服务协同发展、深度融合, 提高公共服务能力的便捷性,以及数字服务应用的普惠性。此外,对 于基层、边远和欠发达地区,通过隐私保护计算技术,可在保护数据 安全和隐私的情况下,助力扩大公共服务资源辐射覆盖范围,有效缓 解“数字鸿沟”,提高“数字弱势群体”及人民群众对公共服务的获 得感和满足感,促进社会运行方式变革,构建全民畅享数字红利的数 字生活。3. 提高数字政府建设水平,驱动治理方式变革在数字政府建设方面,隐私保

3、护计算在助力确保公共安全的前提 下,有助于提高数字化政府工作效能,实现数据跨部门、跨层级、跨 地区汇聚融合、深度利用和高质量协作。具体体现在三方面,一是有 效推动公共数据资源开放,以增强公共数据资源开放的透明度、增加 政府公信力;二是有序推进政务数据资源共享,以提升协同治理能力; 三是全面深化公共数据资源利用,以提高政府决策制定的科学性、专 业性和时效性,助力政府精准施策。4. 激发安全技术创新活力,营造良好数字生态隐私保护计算在提供数据安全和个人信息保护能力的基础上,一 是从技术角度实现“数据”向“数据价值”流通的升维,破除既有数 据壁垒;二是凭借其坚实的理论基础和安全性证明,加强数据应用透

4、 明度,增进数据价值利用下的安全保护信任,有效缓解数字经济发展 中的数据安全和个人信息保护的信任危机,弥合信任鸿沟;三是助力 实现数据合规应用中的数据最小化、数据分类分级和数据匿名化,促 进数据应用的合规化发展。如隐私保护计算技术通过联邦学习的控制 用法用量、安全多方计算实现目的受限,机密计算的授权代码运行等 实现数据最小化。综上,“十四五”规划纲要强调以数字化转型驱动生产方式、生 活方式和治理方式的变革,而隐私保护计算技术的出现,为充分发挥 海量数据和丰富应用场景优势,有力促进数字技术与经济社会发展各 领域融合发展,加快实现数字化发展、建设数字中国的远景目标提供 了重要的基础(如图3所示)。

5、释放变实现DIKW模型指导驱动优化科学决策生产方式 变革生活方式 变革治理方式 变革数字生态J价值实现数字经济数字社会数字生态数一帝国”远景晨实际变革远景目标来源:4*国信息通信研究院图3数据价值释放路径模型二、隐私保护计算技术概述(-)隐私保护计算及其矣键技术隐私保护计算(Privacy-Preserving Computation)是一套包含人工 智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系3。 它能够在不泄露原始数据的前提下,对数据进行加工、分析处理、分 析验证,其重点提供了数据计算过程和数据计算结果的隐私安全保护 能力。随着数字技术的发展,隐私保护计算的内涵及主流技术不断演

6、 进。主流的技术研究焦点从早期的数据扰动和数据匿名化等演进至今, 己经能够实现数据计算过程和数据计算结果的保护,形成一套包含众 多领域的跨学科安全技术体系。隐私保护计算具体涵盖了安全多方计 算、联邦学习、同态加密、差分隐私和机密计算等技术。安全多方计算(Secure MultiParty Computation, SMPC),由中 国科学院院士姚期智于1982年通过“百万富翁问题”提出,旨在解3中国信通院隐私保护计算技术研究报告 决“一组相互独立且互不信任的参与方各自持有秘密数据,协同计算 一个既定函数”的问题。安全多方计算保证了各参与方在获得正确计 算结果的同时,无法获得计算结果之外的任何信

7、息。联邦学习(Federated Learning, FL),可被理解为是由两个或两 个以上数据方共同参与,在保证数据方各自原始数据不出其定义的安 全控制范围的前提下,协作构建并使用机器学习模型的技术架构。通 常情况下,联邦学习需与其它隐私保护计算技术联合使用,才可在计 算过程中实现数据保护。同态加密(Homomorphic Encryption, HE),是一种允许在加密 之后的密文上直接进行计算,且计算结果解密后与基于明文的计算结 果一致的加密算法,可在不解密以实现数据机密性保护的同时完成计 算。根据支持密文运算的程度,同态加密方案可以分为部分同态加密 方案和全同态加密方案两类。部分同态加

8、密方案能够支持有限的密文 计算深度,常作为其他方案的组成部分之一进行使用。而全同态加密 理论虽支持无限次任意给定函数的运算,但由于计算开销较大,目前 尚未形成规模化的商用。差分隐私(Differential Privacy, DP),是 Dwork 在 2006 年针对 数据库的隐私问题提出的一种严格的、可量化的隐私定义和技术。差 分隐私在保留统计学特征的前提下,去除个体特征以保护用户隐私。 差分隐私具有两个重要的优点:一是提出与背景知识无关的隐私保护 模型,实现攻击者背景知识最大化的假设;二是为隐私保护水平提供 严格的定义和量化评估方法。机密计算(Confidential Computing

9、, CO ,机密计算是指通过在 基于硬件的可信执行环境中执行计算来保护数据应用中的隐私安全 的技术之一。其中可信执行环境定义为可在数据机密性、数据完整性 和代码完整性三方面提供一定保护水平的环境4。其基本原理是将需 要保护的数据和代码存储在可信执行环境中,对这些数据和代码的任 何访问都必须经过基于硬件的访问控制,防止他们在使用中未经授权 被访问或修改,从而提高机构管理敏感数据的安全水平除上述技术外,隐私保护计算技术还包含了秘密共享、不经意传 输、混淆电路、零知识证明等诸多技术方向,在此暂不一一赘述。(二)基于隐私保护计算技术的数据流通模式在实际应用中,根据数据流通方式、数据集中程度、模型复杂度

10、 等差异化的业务场景,从技术角度来说,基于隐私保护计算技术的数 据流通方式可分为可信环境模式、可证模式和可度量模式三类(如图 2所示):机构间无互信基础可度可证核心技术:核心技术:联邦学习、拆分学习、差分隐私安全多方计鼻、同态加密辅助技术:辅助技术:可信执行环境、安全多方计算、同态加密可信执行环境、差分隐私服务器计算模块核心技术: 可信执行环境辅助技术: 差分隐私集中式模式服务器脉2机构3联合计算模式机构1机构3去中心化模式机构间有互信基础可信来源:中国信息通信研究院图2基于隐私保护计算技术的数据流通模式1.可信环境模式可信环境模式,是以机密计算技术为核心,在基于硬件的可信执 行环境中执行计算

11、,保护数据应用中的隐私安全的集中式计算模式。 该模式本质上是一种集中式的数据计算模式,需以各参与方的强信任 关系为前提,将各参与方的数据进行集中式汇总,并利用集中汇总的 数据进行模型训练。因该模式将数据进行了集中汇总,故可进行非常复杂的计算,具 有效率高、网络延迟低等优势,但难点在于如何构建各参与方的强信 任关系。该模式通过基于硬件的可信执行环境构建参与方的信任关系, 其信任的基础是对可信执行环境的信任。目前市场上技术成熟的厂商 主要有Intel SGX, ARM TrustZone等,较容易产生供应商锁定等供 应链安全问题。该模式的核心技术包括机密计算的可信执行环境等, 辅助技术包括差分隐私

12、等。2 .可证模式可证模式,是以安全多方计算和同态加密等密码技术为核心,支 持在无可信第三方的情况下,各参与方协同计算一个既定函数的分布 式计算模式。在该计算模式下,中间数据均以密态呈现。所谓“可证” 是指数据的运算态或结果态的安全性可由其使用的密码算法的理论 安全性来证明提供。该模式的优势是其采用基于密码学的安全多方计算和同态加密 等技术,凭借其坚实的理论基础和可证明的安全性,获得了较强的安 全性保障。但是由于该模式包含复杂的密码学操作,实现相关技术需 要付出较大的性能代价,对性能提出了严峻的挑战。对于一些计算复 杂度较低的场景,该模式己取得良好的应用效果。该模式的核心技术 包括安全多方计算

13、、同态加密等,辅助技术包括可信执行环境、差分 隐私等。3.可度量模式可度量模式,是以差分隐私技术为核心,可对数据计算过程中的 隐私泄露风险进行量化评估的数据流通模式,该技术通常与联邦学习 等其他技术结合使用。例如,在联邦学习中,中心节点需对各方模型 更新的中间结果进行聚合,但此过程中存在数据重构时的攻击风险。 差分隐私可在各方数据出域前,通过施加随机噪声的方式保护中间结 果,并度量这些噪声带来的隐私保护效果。该技术的优势是能够实现隐私风险的量化评估,但是会对数据的 精度形成不可忽略的影响,因此对精度要求较高的场景需酌情使用。该模式的核心技术包括差分隐私、联邦学习等,辅助技术包括可信执 行环境、

14、安全多方计算、同态加密等。(三)基于隐私保护计算技术的数据流通场景基于当前隐私保护计算技术的应用场景,其数据的流通场景主要 包含单数据方的主动开放、无数据方的申请使用以及多数据方间的联 合计算(如表2所示)。表2基于数据流通的场景分类序号特点介绍参与方式需要保护 的数据隐私保护相 矣技术典型应用场 景1单数据方 主动开放数据拥有方主 动发起(单方)。发布数据 的个人信 息和敏感 内容。差分隐私等公共管理和 服务机构开 放符合开放 条件的公共 数据等。2无数据方申 请使用无数据方提供 查询条件、并申 请查询;数据方 根据查询条件 进行查询并反 馈查询结果。无数据方 查询条件 中的隐私 信息;数

15、据拥有方 的数据PSL PIR 等征信查询、订 单查询、敏感 疾病查询等。3多数据方联合计算双方或多方各数据方 的数据安全多方计 算、联邦学 习、可信执 行环境联合风控、联 合营销等。来源:中国信息通信研究院一是单数据拥有方主动开放数据。通常为公共管理和服务机构对 符合开放条件的公共数据进行开放。为保障数据安全及个人隐私,在 对数据进行脱敏处理或使用差分隐私等技术时往往会给数据加入噪 声。如美国人口普查局会在发布人口数据时使用差分隐私技术进行保 护处理,在保证数据的统计信息的基础上,避免泄露详细的个人信息, 保障了数据和个人隐私的安全。二是无数据方申请使用数据拥有方的数据。在此场景下,无数据 方需向数据拥有方提供查询条件,数据拥有方根据查询条件进行查询 并反馈相关结果。借助隐私保护计算技术能够实现数据库数据及查询 条件的“双盲”,以此保护数据和个人隐私的安全。相关的支撑技术 包括隐私集合求交PSI和隐私信息检索PIR等。三是多数据拥有方联合计算。两个或多个机构之间基于某种业务 需求,将各方数据进行联合计算和分析。该类跨机构进行数据联合计 算的场景是当前业界研究和应用最多的场景。三、隐私保护计算技术落地应用案例(-)金融行业应用

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号