大数据环境下个人数据隐私泄露溯源机制设计

上传人:小** 文档编号:34146651 上传时间:2018-02-21 格式:DOC 页数:9 大小:94KB
返回 下载 相关 举报
大数据环境下个人数据隐私泄露溯源机制设计_第1页
第1页 / 共9页
大数据环境下个人数据隐私泄露溯源机制设计_第2页
第2页 / 共9页
大数据环境下个人数据隐私泄露溯源机制设计_第3页
第3页 / 共9页
大数据环境下个人数据隐私泄露溯源机制设计_第4页
第4页 / 共9页
大数据环境下个人数据隐私泄露溯源机制设计_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《大数据环境下个人数据隐私泄露溯源机制设计》由会员分享,可在线阅读,更多相关《大数据环境下个人数据隐私泄露溯源机制设计(9页珍藏版)》请在金锄头文库上搜索。

1、大数据环境下个人数据隐私泄露溯源机制设计 王忠 殷建立 北京市社会科学院 清华大学 天津大学 摘 要: 大数据环境下, 个人数据作为一项重要资源, 其蕴藏的巨大价值日益凸显。当前, 个人数据收集、处理、交易活动空前活跃, 各种创新层出不穷, 由此导致个人数据隐私泄露风险增大。近年来时常爆发的个人数据隐私泄露事件, 在对个人造成不同类型、不同程度损害的同时, 也动摇着网络乃至整个社会的信用体系。为充分发挥大数据的创新功能, 维护社会信用体系在大数据时代的正常运行, 必须前瞻性地研究个人数据隐私保护问题, 分析个人数据的可溯源性及溯源路径, 构建以溯源技术标准体系、产品信息登记制度、溯源监管制度、

2、溯源信息奖惩制度等为主要内容的个人数据隐私泄露溯源机制, 吸引相关利益主体共同参与, 为合理挖掘与利用个人数据资源提供一种解决方案。关键词: 大数据; 个人数据; 隐私; 溯源机制; 作者简介:王忠 (1983-) , 男, 湖南省湘阴县人, 博士, 北京市社会科学院经济所研究人员, 清华大学社会科学学院博士后, 主要研究方向为技术经济;作者简介:殷建立 (1988-) , 男, 湖南省武冈市人, 天津大学管理与经济学部博士生, 主要研究方向为技术经济及管理。基金:国家自然科学基金资助项目“大数据商业模式、产业链治理及公共政策研究” (项目编号:71302020) Traceability M

3、echanism Design against Personal Data Privacy Disclosure under the Context of Big DataWANG Zhong YIN Jian-li Beijing Academy of Social Sciences; Tianjin University; Abstract: Under the environment of Big Data, the great value in personal data, one of the important resources, is becoming increasingly

4、 obvious. At present, the collection, processing and trading of personal date is unprecedentedly active and there exists so many innovations;and the risk of personal data privacy disclosure is becoming more serious than before. In recent years, there were so many events concerning personal data disc

5、losure, which were threatening our social credit system. To give full play to the role of innovative function of big data and maintain the normal operation of social credit system, we should carry out research on the protection of personal data disclosure, analyze the traceability and traceability p

6、ath of personal data, formulate the traceability mechanism taking technology standard system, product information registration system, supervision system, rewards and penalty system as the main contents and attract more stake holders to participate to provide a solution for the rational exploration

7、and usage of personaldata.Keyword: Big Data; personal data; privacy; traceability mechanism; 一、引言大数据正在开启一次重大的时代变革, 正在改变人们的生活、工作与思维。1此变革伊始, 个人数据便成为一项重要的资源, 为企业产品设计、营销等活动提供战略指导, 为政府政策、制度制定提供价值参考, 为科研活动提供证据支撑。正是因为个人数据蕴藏的巨大价值日益凸显, 致使个人数据收集、处理、交易活动空前活跃, 各种创新层出不穷, 然而这些活动却将个人数据隐私置于随时泄露的危险境地。近年来, 个人数据隐私泄露事件

8、时常爆发, 在对个人造成不同类型、程度损害的同时, 也动摇着网络乃至整个社会的信用体系。为充分发挥大数据的创新功能, 需要前瞻性地研究个人数据隐私保护问题, 但目前尽管有关网络个人数据隐私保护的研究较多, 却主要基于法律视角, 2缺乏对大数据环境下的前瞻性研究, 且关于溯源机制应用与理论的研究, 主要集中于食品安全、3水污染、4重金属污染5等领域。本文从个人数据溯源性及其应用过程出发, 提出在个人数据隐私保护领域引入溯源机制, 并对其进行具体的机制设计。二、溯源机制概述1. 基本概念数据被定义为能够通过设备 (如计算机) 自动处理、记录的信息, 既可以是数字、文字、图像, 也可以是计算机代码。

9、对于个人数据, 各国法律层面的定义存在较大分歧, 但在内涵上被普遍认为能够辨识特定的行为个体的数据。6-7受篇幅所限, 本文对此不再细究, 主要关注大数据时代具有应用价值的在各类私人活动中产生的电子化数据, 包括结构化与非结构化数据, 不包括脱离信息物理设施的数据。隐私是一个发展的概念, 不同的国家、民族, 不同的历史发展阶段, 甚至不同的个体, 对其都有不同的认识, 8并非所有的个人数据都是隐私。在大数据背景下, 可被关联起来用以锁定某一特定个人, 或将之确定在一个极小人群范围之内的与之相关的文字、图片、视频等数据, 都被视为隐私。2. 个人数据隐私泄露可溯源性大数据时代, 个人数据具有产品

10、与数据的双重属性。产品属性是指个人数据能被企业、政府等主体使用并满足其特定的需求, 既包括未被加工的原始个人数据, 也包括被挖掘加工后形成的数据产品;数据属性是个人数据的本来属性, 指个人数据作为价值信息的载体, 以数据的形式被收集、加工和销售。因此, 个人数据的可追溯性具有产品可追溯性及数据可追溯性两层含义。产品层面的可追溯性表现为对某一产品的运动或路径的追溯能力。1994 年, 国际标准化组织 (ISO) 将可追溯性 (Traceability) 定义为:“通过被记录的标志追溯一个实体的过去、用途与位置等信息的能力”。9通过记录个人数据在市场交易活动中的每一次运动及其运动路径信息, 追踪个

11、人数据所处的状态及用途, 并在个人数据隐私泄露事件发生后, 溯源个人数据运动路径, 完全具备找出隐私泄露源头的能力。数据层面的可追溯性有数据起源、数据世系、数据溯源等中文表示, 它们意思基本相同, 其英文均为“Data Provenance”, 本文统一称之为数据溯源。数据由于具有易复制、易扩散等特性, 其溯源存在一定的难度, 但目前已有不少根据追踪路径重现数据历史状态与演变过程, 实现数据历史档案追溯的技术。10-11综上所述, 大数据时代个人数据应用发生隐私泄露时具有可追溯性, 可以根据个人数据运动产生的数据流信息, 在产生个人数据隐私泄露溯源等需要时, 重现个人数据的历史演变路径。3.

12、个人数据隐私泄露溯源机制作用个人数据隐私泄露事件频发, 其主要原因如下:一是数据控制方滥用个人数据, 或将隐私信息非法出售以谋利;二是隐私保护投入少, 信息安全防护等级低, 以致黑客入侵、盗用个人数据;三是企业内部管制松怠, 导致员工易于盗取数据。在行为不易被发现、处罚力度小的情况下, 或出于非法交易目的, 或因为保护措施缺失, 数据控制方将个人数据隐私置于极高的泄露风险之下。针对隐私泄露风险, 溯源机制主要作用如下:一是规范行业发展。溯源机制可快速找到隐私泄露源, 并对泄露责任方进行严厉惩罚, 从制度上迫使各数据控制方提高对个人数据隐私保护的责任意识, 有利于从源头上防止隐私泄露事件的发生。

13、二是树立市场信用。溯源机制使个人能够了解其数据的来龙去脉, 从而赢得个人对个人数据产业部门的信任, 避免大数据可能诱发的信任危机, 维护社会信用体系。三是推动技术创新。溯源机制迫使个人数据控制方采取更为妥善的隐私保护措施, 对现有技术手段形成倒逼, 促进技术革新, 有利于充分挖掘个人数据蕴藏的巨大价值。三、个人数据溯源路径分析1. 个人数据利用的主要环节个人数据利用的流程如图 1 所示。由图 1 可知, 个人数据利用主要包括以下几个环节:(1) 收集。收集方可通过网络、移动智能终端、各种监控设备等多种途径收集个人数据。大数据由于可以处理多元非结构化数据, 其能够处理的个人数据类型远比网络个人数

14、据的外延广泛。(2) 处理。收集的数据需进行专业处理方可挖掘其潜在价值。这种处理可以分为两种情况:收集者自己进行数据处理, 或者将之外包给专业的数据处理机构。(3) 交易。被收集和处理过的数据, 如果不作为自用, 需要通过交易才能实现其价值。目前, 美国、日本已有个人数据交易公司, 如美国的 Factual 公司推出了数据超市, 日本的富士通公司建立了数据交易市场“Data plaza”。目前在 Data plaza 市场上买卖的数据包括购物网站上的购物记录、出租车上安装的传感器获得的交通堵塞记录、智能手机的位置信息、社交网站 (SNS) 的帖子等, 这些个人数据均经过了匿名处理。我国由于法律

15、尚未明确, 特别是刑法有“出售、非法提供公民个人信息罪”, 个人数据目前主要以黑市交易的形式存在, 并且日益猖獗。图 1 大数据环境下个人数据利用流程图 下载原图(4) 应用。个人数据应用领域广泛, 包括生活服务、商业应用、科学研究、公共服务等。个人数据应用环节有两种情况, 一种是数据处理方直接应用, 另一种是购买数据处理方产品后应用。2. 个人数据利用的利益相关者利益相关者主要指“任何可以影响组织目标实现或受该目标影响的群体或个人”。12个人数据隐私泄露溯源的利益相关者如下:(1) 个人。指生成个人数据的自然人, 是个人数据产生的源头, 在法律层面上是个人数据的主体与所有者。但大数据时代背景

16、下, 由于个人数据蕴含的商业价值突然爆发, 个人数据生成后其使用权大多掌握在个人数据利用者手中, 个人对其隐私缺乏直接有效的控制与保护, 时刻面临隐私泄露的风险。(2) 个人数据收集者。指为特定目的收集个人数据的组织或个体, 包括数据收集企业、政府、非政府组织及个体等。数据收集企业主要依托自身的经营业务, 通过被动、主动、自动三种方式收集个人数据, 13如电信运营商、银行、医院、酒店等;政府作为重要的个人数据收集者, 除可通过上述三种方式收集个人数据外, 还可通过登记、许可、调查、听取意见、座谈、检查等多种方式收集个人数据信息;14非政府组织及个体收集个人数据一般不以营利为目的, 主要是开展有意义的工作或研究, 如为研究而向个人发放调查问卷等。(3) 个人数据处理者。指通过对个人数据进行集成、挖掘与分析而形成的数据库产品、信息系统或服务, 既包括直接整理个人数据而形成的初级个人数据产品, 也包括经过二次挖掘与开发生成的高级个人数据产品。(4) 个人数据应用者。指应用个人数据产品以实现特定利

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号