厦门大学数据库实验室论文阅读报告(2)

上传人:cn****1 文档编号:569483863 上传时间:2024-07-29 格式:PPT 页数:22 大小:1.36MB
返回 下载 相关 举报
厦门大学数据库实验室论文阅读报告(2)_第1页
第1页 / 共22页
厦门大学数据库实验室论文阅读报告(2)_第2页
第2页 / 共22页
厦门大学数据库实验室论文阅读报告(2)_第3页
第3页 / 共22页
厦门大学数据库实验室论文阅读报告(2)_第4页
第4页 / 共22页
厦门大学数据库实验室论文阅读报告(2)_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《厦门大学数据库实验室论文阅读报告(2)》由会员分享,可在线阅读,更多相关《厦门大学数据库实验室论文阅读报告(2)(22页珍藏版)》请在金锄头文库上搜索。

1、厦门大学数据库实验室厦门大学数据库实验室论文阅读报告(论文阅读报告(2 2)报告人:谢荣东指导老师:林子雨2015年7月27日论文方向介绍1Diversity-Aware Top-k Publish/Subscribe for Text Stream2Efficient Diversity-Aware Search3目录CO N T E N T S论文方向介绍11.11.1关键词检索关键词检索从web2.0时代开始,用户上网一般都是通过搜索引擎。随着网络的发展,人们对于搜索的需要遍布网络世界的方方面面,例如商品信息检索、社交网络信息检索以及推荐系统等。传统的搜索服务一般关注点在与搜索的精确性,

2、要求结果与关键词尽量匹配。然而,现在的用户对搜索结果的要求更趋于多元化,不仅要求结果的相关性,也要求结果的多样性。1.21.2用户的多样性需求用户的多样性需求由于网络信息的特性,在搜索引擎返回的具有相当长度的结果列表中,和查询最相关的一些结果非常相似。另外,由于关键词查询具有语义不确定性,同样的关键词查询背后可能用户的搜索意图并不完全一样。比如对于关键词“苹果”,用户的潜在意图可能有:l“苹果”公司及其产品l由于食用的苹果及其生长树木l一部名为“苹果”的电影用户对于第一类的关注度比较高,如果搜索引擎只根据第一种搜索意图评价结果的相关性,则持有后两种意图的用户很难在搜索结果中找到想要的结果。1.

3、3 1.3 应用场景应用场景多样性检索已经应用到网络的方方面面,尤其在一下几个领域有很广阔的运用:Diversity-Aware Top-k Publish/Subscribe for Text Stream22.1 2.1 摘要摘要问题描述:网络上信息浩如烟海,而用户往往只关心最新的感兴趣的信息,故信息检索服务应该能够提供给用户“对他们的查询主题不同方面覆盖面广的查询结果”。领域现状:现在最先进的是tweet使用的Top-k发布订阅查询系统,但是还是未充分的考虑结果的多样性。若充分考虑多样性,可以提高用户对搜索结果的满意度。面临的困难面临的困难困难一:定义多样性感知Top-k订阅查询问题,一

4、方面要考虑将会影响搜索结果的三个方面,即:相关性、时效性、多样性,并能定量的表示它们;另一方面设计高效的算法计算三个特性,并能实现快速的比较以及结果的更新困难二:所提出的多样性感知Top-k发布/订阅系统应该能有效地应对巨量的查询;对于新加的数据,能够实现快速的结果更新本文的解决方法本文的解决方法本文采用组筛选条件和个别筛选条件来对新加入的数据进行分类鉴别。主要解决组筛选策略问题。本文提出了一个minimal covering set(MCS)概念,即最小覆盖集,定义为:结果集中能覆盖所有查询的最小结果集。解决一个MCS maximization problem,即MCS最大话问题,寻找尽可能

5、多的MCS,尽量覆盖所有的结果集。2.2 2.2 问题的定量描述问题的定量描述对于检索结果q.R,需要计算其相关性以及多样性。相关性与文本距离成反比相关性与时间衰减因子成反比用余弦相似度来度量多样性组筛选条件个别筛选条件2.3 MCS2.3 MCSMCS maximization problemMCS maximization problem本质上用贪心算法Chen L, Cong G. Diversity-Aware Top-k Publish/Subscribe for TextStreamC/Proceedings of the 2015 ACM SIGMOD International

6、ConferenceonManagementofData.ACM,2015:347-362.Efficient Diversity-Aware Search33.1 3.1 数据模型数据模型用一个加权向量来表示数据,可以表示多元的数据,比如文本数据,空间数据等待。D=(d1,d2,d3)数据的得分=关键词相关性*不冗余性fq是一个可调参数,对于答案多元性需求不高的问题,设置低的fq对于多元性要求高的问题,设置高的fqThe DIVGEN AlgorithmThe DIVGEN AlgorithmAngel A, Koudas N. Efficient diversity-aware searchC/Proceedings ofthe 2011 ACM SIGMOD International Conference on Management ofdata.ACM,2011:781-792.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号