《microsoft powerpoint - 复件 开题报告ppt》由会员分享,可在线阅读,更多相关《microsoft powerpoint - 复件 开题报告ppt(28页珍藏版)》请在金锄头文库上搜索。
1、Peer-to-Peer 文件共享系统中信誉 机制的研究 文件共享系统中信誉 机制的研究 博士研究生:杨懋 指导老师:代亚非 教授 博士研究生:杨懋 指导老师:代亚非 教授 2005-10-30 2 主要内容主要内容 ?问题是否有意义 ?问题的背景和价值 ?问题的现状:问题有难度,还没有得到很好的解决 ?研究的价值:研究以及对实际系统的价值 ?为什么可以让我来解决这个问题 ?理解了这个问题 ?已有的先期的结论和猜想 ?有了合理的研究路线和可以预见的成果 ?其他条件 ?总结 3 问题的提出和必要性问题的提出和必要性 ?大量的用户为什么不愿意共享 ?Rational 用户,人总是会尽量提高自己的效
2、用 奉献会影响自己 系统的可用性 (Free-rider是否真的是出于本性,测量工作) ?激励用户去共享资源 -激励机制 ?为什么会有大量的虚假,恶意信息 ?RIAA等类型的公司为了自己的利益、恶作剧、病毒等 ?系统信誉机制设计的不合理:获得非法的所得 ?没有信任机制让这些文件传播恶性化 ?防止虚假、恶意信息在系统中的传输 -信任机制 ?*实际系统表明,两个问题都没有得到解决的系统都在失去用户 ?*Free-rider会影响到系统的可用性Feldman 200 berkeley ?*通过测量表明这两个问题都难以通过简单的技术手段来解决 ?*通过研究现有的最新的模型,发现在应用到实际系统中去都存
3、在缺陷 4 三个名词三个名词 ?Incentive 激励机制 激励用户合作:合作- 信任度-回馈-合作 ?Trust 信任机制 保证用户间可以更安全完成 交易的机制:信任度,认证-安全的交易 ?Reputation 信誉 用户在系统中的信誉,包括 客观的和主观的别人对自己的信任度 ?Reputation-based Incentive ?Reputation-based Trust 5 研究的方法研究的方法 ?部署实际系统和算法 ?测量实际系统,发现存在的新问题 ?通过分析已有模型是否可以解决问题?提出我 们新的模型和方法 ?基于实际数据的模拟检验模型有效性 ?设计实现算法,并重新部署检验 ?
4、重新测量 ? 6 选择的研究内容选择的研究内容 ?通过对实际系统的测量,来分析Free-rider和Fake File在 系统的特点,发现新的问题 (测量的方法学) ?分析我们自己部署的一个基于积分的激励机制的有效性 ?发现基于共享历史的系统的问题,存在Colludor ?分析最近经典的解决方案是否真正适合P2P文件共享系统 ?Tit-for-Tat, Max-Flow, EigenTrust,EigTrust的一个可能的改进 ?发现了新的问题和研究点,提出Mult-Trust ?如何衡量信誉模型的有效性和可靠性 ?分析现有的可以防止Fake-File传播的机制,提出一个基于 投票的信任模型
5、?分析我们已经采用的技术手段,发现了新的问题 ?分析现在的Trust机制, PeerTrust, Vote-Based ?新的信任,信誉与激励相结合的一个整体解决方案 ?是否健壮: Free-rider, Fake-file,以及Colluder ?是否公平:Local Distributor等 可部署性分析 7 研究需要时刻面对的难点研究需要时刻面对的难点 ?大型P2P文件共享系统的特点 ?用户身份难以确定 ?用户对资源兴趣的差异性和非对称性 ?用户能力的差异性,需要保证公平,不是完全的商品社会 ?系统中大部分信息无法获知,合理作弊的可能 ?大用户量,可扩展性 ?实际的一些问题 ?是否可以部
6、署到实际系统中去(有/无中心服务器) ?需要考虑到和其他P2P系统的竞争关系 ?系统的友好性:不能过于增加用户使用的负担和机器的负担 8 第一个问题:激励机制第一个问题:激励机制 主观,公共 历史纪录 主观,私有历史纪 录 客观,公共历史纪录 Eigen Trust 基于市场机制 虚 拟货币,积分 基于信誉的激励机 制 Reputation 直接互惠的模型 (Tit-for-Tat) 基于志愿 Maze Point Micro-Payment Mojo Nation MultTrust Max-Flow Ad-hoc BitTorrent History eMule Napster KaZaA
7、 Gnutella ?从经济学角度来看促使合作的发展 ?基于信誉机制是研究的重点 9 对基于积分激励机制的分析对基于积分激励机制的分析 ?Maze积分制度 ?在论坛上广泛讨论下,修改过3个版本 ?类积分系统的特色Micro-Payment ?用户可以通过奉献来提高自己的积分,系统通过积 分来提供差异服务 ?两两交易必须产生额外的利润(用户能力的差异 性) ?存在着合作作弊的可能(难以确认交易是否是真的 对系统可用性有贡献) 10 工作:工作:Free-Rider的测量的测量 ?第一次通过对用户的多个指标,包括共享文件、网络带宽以及网络位置(是 否NAT),在线时间等来判断用户是否会因为某些客观
8、因素成为Free-rider ?Maze中存在Sybil-Attack的问题 (积分少限制太少) ?Free-rider的比例比KaAzA等系统要小一些,但是仍然很多(28%上传过) (积 分高好处太少) ?说明激励制度不是很有效?发现问题:差异化服务 不明显 ?解决:一个完善并且健壮的信任值系统,是提供更多的有价值的差异服务的 基础。 以及以后来为系统提供信任服务。 ?需要确认该类系统是否健壮 ?安全 XRep ?合理作弊 11 工作:研究在工作:研究在Maze中寻找作弊者中寻找作弊者 ?如何在海量的数据中挖掘作弊者? ?作弊者的作弊模式都有什么?这方面作了 大量工作 ?启发式的提出了P2P
9、系统中检测Colludor的 模型 ?Repetition detector ?Pair-wise detector ?Spam account detector ?Traffic concentration detector 12 发现的问题发现的问题 ?通过检测发现了大量的各种针对Maze Point的作弊行为 ?主要体现为两个或者多个帐号相互交易来产生利润 ?White-Washer,一个人注册非常多的用户来交易,提高积分 ?很小的利益都可以让这么多用户来作弊 ?这也是此类虚拟货币系统在P2P这个实际应用中固有的问题。 ?交易必须产生利润 ?在P2P系统中伪造交易的代价小 -使用其他类型
10、的机制? ?类似EigenTrust的信任是否可以解决这些问题呢 13 EigenTrust stanford 03 ?类似于PageRank的计算方法 ?可以采用中心服务器或者分布式的计算 ?首先每个节点i根据自己在节点j上下载东西的 质量给j一个分值 ?然后归一化 ?这样就有了一个信任矩阵C ?叠加的计算其他的节点的分值 ij s = j ij ij ij s s c )0 ,max( )0 ,max( = j jkijik cct 14 重新审视各种信誉机制重新审视各种信誉机制 ?Share History 很难处理Colludor ?Subjective的存在着如何安全的存储信誉值得问
11、题 ?采用Private History的方式呢 15 Tit-for-Tat是否可行是否可行 发现问题发现问题:通过基于实际数据的覆盖的试验,难以 处理用户兴趣的差异性。 ?BitTorrent采用Ad-hoc只能适用于不到1%的下载情 况 ?采用eMule的具有历史纪录的机制,在大部分情况下 也只有3%的用户的上载会给自己以前认识的人,而 其他的上载是无法提供差异服务的。这样,free- rider等非善意行为将很容易生存于系统 。 16 从一步到步从一步到步 ?没有能够适用的方法了? ?我们启发式的提出了新的Mult- Trust机制(一个主观的信誉模 型) ?在信任矩阵C上进行基于2步
12、和多 步的机制 ?介于私有历史和公开历史之间 ?利用P2P网络的特性来平衡覆盖 面和防止Colluder的问题 ?覆盖的模拟结果:一个月的历史 纪录,一个假设索引服务器无任 何问题情况下的理想结果 17 工作:一个判断信誉机制有效的方 法 工作:一个判断信誉机制有效的方 法 ?客观的可以通过其贡献和其信誉是否成正比来判断 ?对于主观的信誉模型,如何判断其是否有效呢 ?需要提出判断有效新的模型:实际数据模拟能否在自己请 求的服务提供者那里得到好的服务 ?有效性: ?健壮性 ?Leg-Hugger ?Colludor: Pair-wise; Spam account etc. ?公平性 ?Loca
13、l Distributor 18 另一个健壮性很好的理想模型另一个健壮性很好的理想模型Max- Flow berkeley 04 ?基于经典的图论中的最大流量算法 ?通过用户间的传输流量形成有向图 ?信任值定义为用户i到用户j的最大可能流量 ?优点,已知的最好的能够对付Colluder的方法 ?缺点,基本 不可实现 ?复杂性大O(V3) ?几乎需要整个传输图的信息,每个节点计算的时 候,通信量太,而且存在安全隐患 19 小结小结 ?存在的问题 ?Free-rider ?ColludorMazePoint EigenTrust ?Local DistrubutorEigenTrust, Tit-
14、for-Tat ?覆盖面的问题Tit-for-Tat ?可计算性问题Max-Flow ?主观的信任机制:Mult-Trust ?客观的信任机制:改进的EigenTrust 20 第二个问题:基于信誉的信任机制第二个问题:基于信誉的信任机制 ?问题的价值 ?现阶段防止恶意或者虚假文件的传播 ?提供对文件的评级 ?远期提供一个可以信任的P2P计算环境 ?信任模型可以通过信誉机制来建立 ?Peer Based Trust PeerTrust 03 ?File Object Based Trust Credence Cornell 05 ?对文件的评论 ?投票,数值 (LameWire) ?评论 ,自
15、然语言(eMule) 21 研究的前提研究的前提-对虚假文件的测量对虚假文件的测量 ?严重性 ?几乎所有的热门资源都有虚假文件,比想象的多得多 ?一些虚假文件的传播量甚至大于真实文件(3倍),浪费网络 带宽 ?只有15%不到的下载了虚假文件用户还来Maze下载了真实 文件(改用其他工具?)系统失去吸引力 ?传播特性 ?成功的造假者会获得大量积分,而且虚假文件传播速度很快 ?用户只会通过副本数来判断:如果虚假文件的副本数大于真 实文件,则快速传播,需要对文件对象的信任机制 ?大部分用户还是倾向于删除虚假文件,大部分是善良用户 ?传输拓扑图关键性节点很多 ? 22 现有方法现有方法 ?是否可以自动
16、的检测虚假文件呢 ?长达一年的文件传输模型的分析 ?Hot File U/D检测器难以完全区分 ?Warm File 不能区分 ?Cold File 无法检测 ?我们采用的其他一些方法 ?Video Preview 效果不错,针对性强 ?Black List in Central Server,效果一般 ?尝试让用户Vote,每天不到200张票 ?一个基于信誉机制的信任模型是必要的 ?防止虚假文件 ?资源评分机制 23 已有的信任模型已有的信任模型 ?针对Peer的投票 ?身份难以确定,如果Trust低 - WhiteWasher ?用户无意的下载了某个文件忘删了,情况很多 ?针对文件的投票 ?缺乏动力,投票人非常少? (Maze, Credence) ?人少就容易作弊 ?无法解决?激励投票! ?通过投票建立用户间的信任度 ?通过新的信任度补充基于Mult-Trust的信誉模型 ?通过信誉模型建立激励机制(差异服务),来鼓励用户投 票 ?需要统一考虑激励、信誉与信任这三者 24 研究如何建立基于投票信誉机制研究如何建立