《隐私计算行业报告:联邦学习、安全多方计算、可信计算》由会员分享,可在线阅读,更多相关《隐私计算行业报告:联邦学习、安全多方计算、可信计算(13页珍藏版)》请在金锄头文库上搜索。
1、行业深度报告目 录1、 隐私计算技术将成数据价值安全释放的关键突破口.32、 隐私计算三大技术路径:联邦学习、安全多方计算、可信计算.63、 隐私计算在金融、政务、医疗等行业有望获得快速应用发展.84、 蚂蚁、腾讯纷纷入局,初创企业不断涌现 .105、 隐私计算未来有望形成多样化的商业模式 .126、 投资建议.147、 风险提示.14图表目录图 1: 数据交易商业模式的框架主要由“3+4+1”要素构成 .4图 2: 隐私计算解决数据开放安全问题的重要突破口 .4图 3: Gartner 发布了企业机构在 2021 年需要深挖的重要战略科技趋势.5图 4: Gartner 预计 2024 年隐
2、私驱动的数据保护和合规技术支出将达近千亿人民币.6图 5: 联邦学习是一种加密的分布式机器学习技术 .7图 6: 安全多方计算提供更加安全的联合数据分析能力.7图 7: 隐私计算可在金融反欺诈场景实现良好应用 .9图 8: 隐私计算有效助力医学影像识别、疾病筛查 .9图 9: 蚂蚁链摩斯多方安全计算平台是基于安全多方计算、密码学、隐私保护技术以及区块链技术所打造的一个用于安全共享数据的基础设施 .10图 10: 腾讯云安全隐私计算应用场景多样 . 11图 11: AiLand 数据安全岛平台致力于解决数据共享过程中的安全、信任和隐私保护问题.12图 12: XDP 翼数坊基于核心隐私安全计算技
3、术为医疗等行业赋能.12图 13: 隐私计算产业 3 大角色:数据方、业务方与技术服务商.13表 1: 深圳、北京、广东等地相继发文,规划设立交易场所进行大数据交易.3表 2: 由于技术路径的不同,各类隐私计算技术均有其更加适用的场景.8请务必参阅正文后面的信息披露和法律声明2 / 16行业深度报告1、 隐私计算技术将成数据价值安全释放的关键突破口数据要素市场改革正在加速。2015 年开始,大数据上升为国家发展战略,全国各地相继成立大数据交易所,各个大数据交易平台网站也陆续上线,但由于缺乏相关的行业规范和安全保障,这些数据交易平台并没有发挥最大效用。2020 年出台的关于构建更加完善的要素市场
4、化配置体制机制的意见,为推进数据要素市场化改革指明了方向。此后,深圳、北京、广东等地相继发文,规划设立交易场所进行大数据交易。表1:深圳、北京、广东等地相继发文,规划设立交易场所进行大数据交易时间文件内容北部湾大数据交易中心在南宁揭牌成立,北部湾大数据交易中心将积极探索政务数据交易模式和跨境数据流通机制,构建安全、开放、共赢的数据生态,建成数据产品交易额、交易量、交易品类中国-东盟区域领先、724 小时永不休市的数据产品交易服务机构2020 年 8 月-北数所具备五大功能定位:一是权威的数据信息登北京国际大数据交 记平台;二是受到市场广泛认可的数据交易平台;易所设立工作实施方 三是覆盖全链条的
5、数据运营管理服务平台;四是以2020 年 9 月案数据为核心的金融创新服务平台;五是新技术驱动的数据金融科技平台深圳建设中国特色 率先完善数据产权制度,探索数据产权保护和利用社会主义先行示范区 新机制,建立数据隐私保护制度。试点推进政府数综合改革试点实施方 据开放共享。支持建设粤港澳大湾区数据平台,研2020 年 10 月2021 年 7 月案(20202025究论证设立数据交易市场或依托现有交易场所开展数据交易,开展数据生产要素统计核算试点年 ) 广东省数据要素市 广东将加快数据交易场所及配套机构建设,推动建场化配置改革行动方 设省数据交易场所,搭建数据交易平台,提供数据案资料来源:各政府网
6、站、开源证券研究所交易、结算、交付、安全保障等综合配套服务数据要素市场改革推动了数据产业的商业模式创新。据数据交易的商业模式研究报告,数据交易商业模式的框架主要由“3+4+1”要素构成。其中,3 表示“数据交易的环境”、“数据交易的基础设施”、“法律环境和市场机制”,4 表示“主体”、“客体”、“流程”和“标准”,1 表示“数据交易的商业实践”。经过多年探索和实践,当前市场存在直接交易模式、授权转移模式、数据市场模式、一般数据平台模式、具备授权和问责制数据平台模式、数据银行模式和数据信托模式 7 种数据交易商业模式。请务必参阅正文后面的信息披露和法律声明3 / 16行业深度报告图1:数据交易商
7、业模式的框架主要由“3+4+1”要素构成资料来源:数据交易的商业模式数据产业商业模式创新对数据安全提出新需求。要进行数据交易要着力破解制约要素市场化的主要矛盾,如数据开放共享和安全保护、数据确权、隐私安全等瓶颈制约,隐私计算技术是解决数据开放安全问题的重要突破口。隐私计算能够在处理和分析计算数据的过程中能保持数据不透明、不泄露、无法被计算方以及其他非授权方获取。在隐私计算框架下,参与方的数据不出本地,在保护数据安全的同时实现多源数据跨域合作,可以破解数据保护与融合应用难题。图2:隐私计算解决数据开放安全问题的重要突破口资料来源:KPMG2020 年 11 月,Gartner 发布了企业机构在
8、2021 年需要深挖的重要战略科技趋势,其中就包括隐私增强计算。并提出:随着全球数据保护法规的成熟,各地区首席信息官所面临的隐私和违规风险超过了以往任何时候。不同于常见的静态数据安全控制,隐私增强计算可在确保保密性或隐私的同时,保护正在使用的数据。请务必参阅正文后面的信息披露和法律声明4 / 16行业深度报告图3:Gartner 发布了企业机构在 2021 年需要深挖的重要战略科技趋势资料来源:Gartner2021 年 7 月,Gartner 发布隐私计算的技术成熟度曲线-2021 版本。Gartner 指出 :在 2023 年底之前,全球 80%以上的公司将面临至少一项以隐私为重点的数据保
9、护法规。到 2024 年,隐私驱动的数据保护和合规技术支出将在全球突破 150 亿美元以上,即达到千亿人民币以上。到 2025 年,60%的大型组织将在分析、商业智能或云计算中使用一种或多种隐私增强的计算技术。请务必参阅正文后面的信息披露和法律声明5 / 16行业深度报告图4:Gartner 预计 2024 年隐私驱动的数据保护和合规技术支出将达近千亿人民币资料来源:Gartner2、 隐私计算三大技术路径:联邦学习、安全多方计算、可信计算常见的实现隐私计算的技术路径包括联邦学习、安全多方计算、可信计算等,此外区块链也是隐私计算的重要补充。联邦学习联邦学习是一种分布式机器学习技术和系统,包括两
10、个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。在联邦学习框架下,各参与方只交换密文形式的中间计算结果或转化结果,不交换数据,保证各方数据不露出。联邦学习可以通过同态加密、差分隐私、秘密分享等提高数据协作过程中的安全性。联邦学习首先由谷歌公司于 2016 年提出,2018 年由微众银行引入国内,恰好遇到隐私保护、信息安全监管趋严,该技术很快就得到各大互联网公司、科技巨头、人工智能公司重视。请务必参阅正文后面的信息披露和法律声明6 / 16行业深度报告图5:联邦学习是一种加密的分布式机器学习技术资料来源:深鉴
11、科技安全多方计算安全多方计算是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。安全多方计算的基本安全算子包括同态加密、秘密分享、混淆电路、不经意传输、零知识证明、同态承诺等。解决特定应用问题的安全多方计算协议包括隐私集合求交、隐私信息检索及隐私统计分析等。由于安全多方计算需要消耗大量的计算和通信资源,目前应用更加适用于小规模数据量,并且应用主要是聚焦相对简单的统计、查询等类型的计算,而基于安全多方计算的联合建模框架只能
12、支持相对简单的机器学习模型,如逻辑回归模型等。图6:安全多方计算提供更加安全的联合数据分析能力资料来源:腾讯可信计算可信计算指借助硬件 CPU 芯片实现可信执行环境(TEE),从而构建一个受保请务必参阅正文后面的信息披露和法律声明 7 / 16行业深度报告护的“飞地”(Enclave),对于应用程序来说,它的 Enclave 是一个安全的内容容器,用于存放应用程序的敏感数据与代码,并保证它们的机密性与完整性。可信计算(TEE)是基于硬件和密码学原理的隐私计算方案,相比于纯软件解决方案,具有较高的通用性、易用性和较优的性能。其缺点是需要引入可信方,即信任芯片厂商。此外由于 CPU 相关实现属于
13、TCB,侧信道攻击也成为不可忽视的攻击向量,需要关注相关漏洞和研究进展。由于技术路径的不同,各类隐私计算技术均有其更加适用的场景:多方安全计算技术不依赖硬件且具备较高的安全性,但是仅支持一些相对简单的运算逻辑;可信执行环境技术具备更好的性能和算法适用性,但是对硬件有一定依赖;联邦学习技术则可以解决复杂的算法建模问题,但是性能存在一定瓶颈。表2:由于技术路径的不同,各类隐私计算技术均有其更加适用的场景技术多方安全计算可信执行环境联邦学习基于密码学原理对数安全机制引入可信硬件数据不动、模型动据加密低-中高性能高中高低通用性高效性准确性可控性保密性可信方中中低高高中-高高高中高中-高需要中不需要不需
14、要易开发、性能佳、但 综合运用各类密码学开发难度大、性能提升迅速整体描述需信任芯片厂商方法、主要针对机器学习(IntelARM)资料来源:中国信息通信研究院、开源证券研究所3、 隐私计算在金融、政务、医疗等行业有望获得快速应用发展自 2018 年开始,隐私计算的技术和产品成熟度迅速提升,在我国加快培育发展数据要素市场、数据安全流通需求快速迸发的推动下,隐私计算技术的应用场景越来越多。在金融领域,隐私保护计算为金融机构间甚至跨行业的数据合作、共享提供可能。PSI 技术可以解决数据对齐时造成客户名单泄露的问题,联邦学习可以保证各方数据不出本地的情况下实现联合建模、预测等。国内隐私计算在金融场景应用
15、方面,以营销、风控端(反欺诈、反洗钱等)等为主要落地场景。请务必参阅正文后面的信息披露和法律声明8 / 16行业深度报告图7:隐私计算可在金融反欺诈场景实现良好应用资料来源:腾讯在政务领域,通过隐私保护计算和其他技术的结合,可以有效保护各政府部门的数据,在一定程度上解决政务数据孤岛问题,提高政府治理能力。在医疗领域,医疗机构想要使用人工智能对某一疾病进行早期发现或临床诊断,一方面需要收集不同维度的数据包括临床数据、基因数据、化验数据等,另一方面也需要收集来自不同群体、不同地区的样本数据,单个医疗机构无法积累足够的数据来进行模型训练。通过隐私保护计算,可以对不同的数据源进行横向和纵向的联合建模,
16、保证各方医疗数据安全。另外,对于 DNA 测试,用户可以通过 PSI 等技术将某段 DNA 序列和数据库进行匹配,实现遗传疾病诊断。图8:隐私计算有效助力医学影像识别、疾病筛查资料来源:腾讯请务必参阅正文后面的信息披露和法律声明9 / 16行业深度报告4、 蚂蚁、腾讯纷纷入局,初创企业不断涌现目前,蚂蚁金服、腾讯云、百度、京东等互联网企业推出了各自的产品,同时以微众银行、安恒信息等行业性公司也开始布局,此外,华控清交、富数科技、矩阵元、数牍科技、锘崴科技、光之树科技、零知识科技等一批专注于隐私计算产品化的初创企业也不断涌现。(1)蚂蚁金服蚂蚁链摩斯多方安全计算平台:大规模多方安全计算商用平台,
17、基于多方安全计算、隐私保护、区块链等技术,实现数据可用不可见,解决企业数据协同计算过程中的数据安全和隐私保护问题,助力机构安全高效地完成联合风控、联合营销、联合科研等跨机构数据合作任务,驱动业务增长。蚂蚁链摩斯多方安全计算平台获得 70 多项相关专利(全国第一),性能超业内算法 3100 倍,iDASH2019 隐私计算比赛全球冠军,率先在金融、电信、汽车等 10多个行业中完成商用,支持上百家企业线上系统运行,能够支撑实际生产环境下的复杂数据安全计算任务。蚂蚁链摩斯多方安全计算平台是全球首个可信联合计算商业联盟创始成员,致力于技术、产品、生态等资源和能力共享。图9:蚂蚁链摩斯多方安全计算平台是
18、基于安全多方计算、密码学、隐私保护技术以及区块链技术所打造的一个用于安全共享数据的基础设施资料来源:蚂蚁集团(2)腾讯云腾讯云安全隐私计算(CSPC)是腾讯云推出的以联邦学习(FL)、安全多方计算(MPC)、可信执行环境(TEE)等隐私数据保护技术为基础的隐私计算平台,产品针对机器学习算法进行定制化的隐私保护改造,保证原始数据不出本地即可完成联合建模,同时支持安全多方 PSI(隐私保护集合求交技术)、安全隐私查询、安全统计分析,提供基于硬件的 TEE 可信执行环境。通过腾讯云安全隐私计算,各合作机构既能保障数据安全,又能发挥数据最大价值,很好地解决了业界数据孤岛的难请务必参阅正文后面的信息披露
19、和法律声明10 / 16行业深度报告题。图10:腾讯云安全隐私计算应用场景多样资料来源:蚂蚁集团(3)微众银行联邦学习方面,早在 2019 年 2 月,微众银行便将自主研发的全球首个工业级联邦学习框架 FATE 予以正式发布,提供基于数据隐私保护的分布式安全计算框架,为机器学习、深度学习、迁移学习算法提供高性能的安全计算支持。目前,FATE 已在信贷风控、客户权益定价、智慧零售、智慧医疗、监管科技等领域推动应用落地。安全多方计算方面,微众银行给出了场景式隐私保护解决方案 WeDPR。该方案组合多种隐私保护策略,融合安全多方计算、同态加密、零知识证明、选择性披露等算法,满足多变业务流程,并围绕开
20、放数据平台、敏感黑名单互通、联合风控、匿名投票、安全支付、隐秘竞拍等典型场景,陆续开源其中的核心算法实现。区块链方面,微众银行在多年技术沉淀的基础上,发布的区块链核心项目已超过 10 个,构建了涵括底层、中间件和应用组件在内的全栈技术体系。其中,由微众银行牵头研发的国产安全可控区块链底层平台 FISCO BCOS,成为国家信息中心顶层设计的区块链服务网络 BSN 中首个国产联盟链底层框架。且自 2017 年向全球开源以来,已汇聚了 2 千多家企业机构、逾 4 万名社区成员,建成最大最活跃国产开源联盟链生态圈。开源社区内数百个应用基于 FISCO BCOS 研发,其中已有超过 120个应用投入使
21、用,覆盖政务、跨境数据流通、金融、公益、医疗、教育等多个领域。(4)安恒信息AiLand 数据安全岛平台是一个专注于保障数据安全流通,致力于解决数据共享过程中的安全、信任和隐私保护问题的隐私计算平台。综合应用安全计算沙箱,联邦学习,MPC 等多种前沿技术,配合关键行为数字验签和区块链审计技术,实现共享数据的所有权和使用权分离,确保原始数据的“可用不可见”、“可用不可取”,保障多方数据联合计算过程的可靠、可控和可溯。请务必参阅正文后面的信息披露和法律声明11 / 16行业深度报告图11:AiLand 数据安全岛平台致力于解决数据共享过程中的安全、信任和隐私保护问题资料来源:安恒信息(5)翼方健数
22、翼方健数成立于 2016 年,被业界称为国内“隐私计算四小龙”,其核心团队成员来自软银愿景基金合伙人、阿里巴巴美国数据科学研究院、阿里巴巴软件平台架构部门、百度人工智能板块以及医疗、医药、保险等多行业的管理者和资深技术人才。2021 年 7 月底,公司宣布完成 3 亿元 B+轮融资。公司自主研发的隐私计算平台XDP 翼数坊基于核心隐私安全计算技术为政务、医疗、医药、生信、金融、保险和营销等行业赋能,业务板块覆盖中国超 30 个城市。公司相关解决方案应用在了高校、机构和企业中,如中国科学院、健康医疗大数据国家研究院、香港科技园、国内著名三甲医院、金融机构、世界 500 强快消品企业等。图12:X
23、DP 翼数坊基于核心隐私安全计算技术为医疗等行业赋能资料来源:翼方健数5、 隐私计算未来有望形成多样化的商业模式隐私计算往往涉及到 3 类角色:首先是使用数据的业务方,包括金融机构、政请务必参阅正文后面的信息披露和法律声明12 / 16行业深度报告府机构,这类机构是隐私计算服务的客户;其次是作为数据源的数据方,包括大数据局、征信公司、拥有用户数据的互联网公司等;隐私计算技术服务商,则为客户搭建整个计算系统。通常情况下,三种角色是分离,而在有些场景下,一个机构可能兼两种角色。据 KPMG隐私计算行业研究报告,基于目前的主流部署和合作模式,技术服务商对业务方有 4 种基本营收方式:(1)销售模式,
24、即收取一次性技术系统搭建费,这是最经典的软件系统销售模式,费用按照系统所消耗的计算存储资源、布置节点数目测量,每单从数十万到数百万不等,差异较大。(2)服务模式,即收取年度系统维护和服务费用,这不仅是因为一般软件系统都有日常维护需求,还因为隐私计算的算法本身和应用场景中的模型更新较快,可能需要重新调整算法和模型。(3)调用模式,即收取数据使用费,这部分费用主要归属于数据方,技术服务商只是作为收费通道代数据方向客户收取,也有时候会赚取数据使用的差价或撮合费用。收费标准根据数据种类和价值而定,按照数据调用次数收取,单次调用费从几分到几角不等。有时候,数据价值无法在使用前确定,需要经过一段时间试用,
25、客户才能根据实际效果确定付费标准。(4)分润模式,即根据业务运行效果,获取收益分成。在这种模式下,客户早期往往并不需要承担大笔技术系统搭建费,相当于技术服务商与客户联合运营业务。基于系统接入数据源,原有业务改善或新业务开展之后,双方根据业务实际效果分润。目前来看,隐私计算的商业模式尚处于探索过程中,我们预计在发展早期主要以系统销售模式和服务模式为主,未来调用模式和分润模式将打开更大的市场空间。KPMG 预测,隐私计算国内市场规模将快速发展,三年后技术服务营收有望触达 100-200 亿人民币的空间,甚至撬动千亿级的数据平台运营收入空间。图13:隐私计算产业 3 大角色:数据方、业务方与技术服务
26、商资料来源:KPMG请务必参阅正文后面的信息披露和法律声明13 / 16行业深度报告6、 投资建议伴随着数据要素市场改革加速,隐私计算技术成为数据价值安全释放的关键突破口,有望在金融、政务、医疗等行业实现快速应用,其千亿蓝海市场有望开启。重点推荐在隐私计算/数据安全领域有前瞻布局的公司安恒信息、奇安信、深信服、绿盟科技、美亚柏科、启明星辰,其他受益标的包括卫士通等。表3:重点推荐在隐私计算/数据安全领域有前瞻布局的公司(截止 2021.8.6 收盘)证券代码公司简称当前市值归母净利润(亿元)PEPS(亿元) 2021E2022E2.362023E2021E 2022E 2023E 2021E
27、2022E 2023E 评级688023.SH 安恒信息688561.SH 奇安信300454.SZ 深信服300369.SZ 绿盟科技002439.SZ 启明星辰300188.SZ 美亚柏科002268.SZ 卫士通2226351.691.663.2131.4382.5100.343.494.194.575.032.621.624.981.969.473.754.724.417.619.466.411.411.013.16.88.08.19.85.35.04.26.15.86.07.64.24.13.55.0买入买入买入买入买入买入-6.728.6218.497.4716.857.933.651012 10.0913.495.581822961542424.1910.514.872.2813.726.1828.26.331.65.22.96106.37.8数据来源:Wind、开源证券研究所(注:卫士通盈利预测来源于 Wind 一致预期)7、 风险提示市场竞争加剧风险;技术变革风险;人员流失风险请务必参阅正文后面的信息披露和法律声明14 / 16