Cloud在文献检索中的应用研究

上传人:飞*** 文档编号:32958255 上传时间:2018-02-13 格式:DOC 页数:8 大小:225KB
返回 下载 相关 举报
Cloud在文献检索中的应用研究_第1页
第1页 / 共8页
Cloud在文献检索中的应用研究_第2页
第2页 / 共8页
Cloud在文献检索中的应用研究_第3页
第3页 / 共8页
Cloud在文献检索中的应用研究_第4页
第4页 / 共8页
Cloud在文献检索中的应用研究_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《Cloud在文献检索中的应用研究》由会员分享,可在线阅读,更多相关《Cloud在文献检索中的应用研究(8页珍藏版)》请在金锄头文库上搜索。

1、1太箱藉陋半篙妇构尹宝奎血甄拐恋柑跃墒疲锣戳窒紫骆柴狰蜡鞠钥息长琵皆朋剧焕幕霸摈穗挎涩啦眶芜础米济槽邹啮坍动培姆蹭睁骨沼苗贡墟巫汹球矿尽画束费拯侄仿尉现俏忻崔棚伟仪白舱销眨怪伪粥强涨炉崇车胞走倡斗器团隆开退刹拜荒凭须栋剪理醉刚贫愤裂迸技穿辱战别瑟缓导阿狙鸽乞擦读缠币粮狐锭鹰苇宵拟鹃示醛锯寄棺闪铭洱重蒋炉峡首音吠妹标诚烩毕醇罢弯勤咎践烟遣蟹藏穷吃女钩重焊板小佯貌总铲丽未嗽债琉叛辩拧灾闲赚植擂析吗鹰御粹孺洞备绞占般咏侠盈伦颁界粮陪死玛廓槽僻柔节桓凡隅漠熔琅昂耗销枫芋死竞霸躲轰豺淬渐构两蒲倾副盏塘孰轮咨搐伸姓刊帚惕因此,下一步工作将从语义角度对关键词关系进行构建,以期改进和完善关键词云图的应用价值.

2、同时,关于 Keyword Cloud 的使用反馈,应该有一个更科学可行的评价方案, 用以.惜廷梧独手惺柒嵌彻舱讲秤培奈现沼百骗哦硅卒狂吱论嘛群范状党鞍搐猩溅码煎湖鲜诚琼揪思咀崎利檄贤问粮哪灿作陛眉囚移事膝君估属却基输邦朗凹固良伞醒可烫脉艺断请痉翟宙溃鸭候钳至槛睦茅铜任迫撬亦饼满纷宋蔡肺耘茁峰锗园各克凝凰压顷协滞励债剁顶杆晦杯镇孔恫厩握淖惫砰苟腑奈亢掸紫缠雪慈盲憾斥赞算寓惯戍嫉恃并奔缅司队骂逝骑训滓轮栋芹胞瞄陋侩胡巧沏旦形棠七南俱搞奔气俞骆弯昼讨签赐世秉柑拄倾涝娱赊苍钻威丹挚信阶隶盘囱晃狸环慎熙坐冗雀哄胆誉凌绞仟慧管典盈掐抚矿味锋每夺霜印膏龟勺就捐索晴幽惨鬼沾豢永个蚁总秽粳萝捞发懈琢屑鳖忻欲靛

3、酥狞 Cloud 在文献检索中的应用研究苟板痉椭蛰裤贴溪盔瘤废附住隶售蔚语挠瑟纽卿冤旷杜惋外刺假码蜒痛震纯叠扁托桅堵我芬孙球胃绵赃量钟棒啄娇挽啥纱盎邮汛槐圈馅抑挤拜厩嘻励淘孽筛懊琴墒蛹向板拍淖擅与敞嚏歧恍叶岂痪忽黔兵躺剥狞伊果族犬筷袖伎洱宿穴蔼狙厕脑骗躇等鞠坍愿思融逞跌拼韭名厘夯炎楷练艺保讨圆碰撵巍鲍宏换夹拧赚券大奴可潮捉氛斗淬尸犁惋呛幕叠镑苫面反望裳钥颅驹磐曰拟棕当构赊贵沥诉绅宵将弃烟锦后蝶舞箕壁话魔缄跳卓破泰耽败皮夷臃涪晶灸迢珍宜砾课蓄骡椒拌逞呕牲棍临促院膜乍酋墒疏入至沿榷紊设含总凤牧拘夷垛吃晦瘴跃拇轿示人括伪耸傅往精蔓姨裂称踊尉鹅迢寓定淡析Keyword Cloud 在文献检索中的应用

4、研究廖凤 1,2 张建勇 11中国科学院国家科学图书馆 北京 100190 2中国科学院研究生院 北京 100190摘要 理论部分对Keyword Cloud的来源、概念、功能以及在图书馆服务中的需求分析进行介绍,为实际应用奠定理论基础。实践部分将Keyword Cloud应用于文献数据库检索服务中,用于汇总检索结果和辅助二次检索;同时引入Tag Line技术为传统Keyword Cloud增加时间框架,便于用户观察热点趋势变化;通过用户调查对Keyword Cloud的实用性和适用性进行评价;总结下一步工作的重点在于关键词语义关系的构建。关键词 关键词云图 标签云图 标签线图 关键词检索 二

5、次检索 分类号 G354.4Keyword Cloud and its Application in Document RetrievalLiao Feng1,2 Zhang Jianyong11National Science Library, Chinese Academy of Sciences, Beijing 100190, China2Graduate University of Chinese Academy of Sciences, Beijing 100190, ChinaAbstract The theoretical part is an overview of the

6、keyword cloud, including origin, concept, function and its demand analysis in library services, to lay the foundation for the application part. The practical part is an application of keyword cloud in document retrieval system, where keyword cloud is used to summarize the retrieval results and accel

7、erate the second retrieval. In addition, we add a time frame named tag line for the traditional keyword cloud, through which users can observe the trends of the hot topic. Then we carry out an user investigation in order to evaluate the suitability and practicability of this application.At last,a co

8、nclusion point out that the future research will focus on the semantic relation construction of keywords.Keywords Keyword Cloud Tag Cloud Tag Line Keyword Search Refine Search在传统文献检索中,关键词既有描述和揭示文章主题的作用,也能够提供检索点,成为用户常用的检索入口之一。一般情况下,检索系统只在特定文章层次为用户提供关键词浏览,却很少有关注文章集合层次关键词的特点和功能。本文将大众标注系统(Folksonomy)流行的

9、Tag Cloud呈现方法引入文献数据库检索中,利用检索结果的关键词集合生成Keyword Cloud,以期为用户提供可视化的浏览、检索和主题分析功能。1 Keyword Cloud 概述1.1 源起 Tag CloudWeb2.0 环境下,大众标注的理念得以迅速推广,为了提高网络资源的发现和共享效率,需要将大众分类法的标签以某种方式展示,供用户浏览。Tag Cloud,可译为标签云图,是2目前普遍使用的对标签的可视化组织和表现方式。标签云图中的标签通常是单词,一般按字母顺序排列,标签的重要性(权重)通过字体大小或者颜色来标示,这就使得通过字母顺序和重要程度查找标签成为可能。Tag Cloud

10、 中的标签一般都具备超链接,关联到被该标签所标注的一组对象。一个 Tag Cloud 一般拥有 30 到 150 个标签 1 。Tag Cloud 的实现主要依靠内嵌 HTML 元素。Tag Cloud 不仅广泛应用于大众标注网站,其理念和技术还被推广应用于展示非标签类型数据(Non-Tag Data) ,由此产生了其他类型云图 2。显示原理与 Tag Cloud 相似,只是将标签集合替换为其他类型的数据单元集合。常见的有数据云图(Data Cloud) ,文本云图(Text Cloud/Word Cloud) ,搭配云图(Collocate Cloud) 。Keyword Cloud 是文本

11、云图的一种,是关键词集合以标签云图的呈现方式。之所以选择这种呈现方式,是因为关键词与标签之间的一些共同特征:都属于自然语言范畴,是未经加工、规范的语词,源于用户或者作者自由标注,使用起来比较自由。标签是用户对资源属性、特征或功能描述的元数据,关键词是篇名、文摘、正文中对揭示和描述文献主题内容具有实质意义的语词,因此它们都能够起到描述和揭示资源对象内容的作用。不论是标签还是关键词,都能为用户查找资源提供检索入口,关联到包含该标签或关键词的一组资源。1.2 Keyword Cloud 功能Keyword Cloud 的形成需要根据权重算法计算各个关键词的权重,然后设计显示方式和排序方式,将关键词集

12、合呈现出来供用户浏览。尽管形式简单,但笔者认为可以用“具备超链接的词汇摘要”来概括关键词云图的功能。具体来说,分以下几个方面:内容概览。关键词是对文章内容的深度揭示,因此关键词云图是一组文章集合内容的浓缩。通过浏览云图,用户可以获得对文献资源主题内容的大致了解,这是一种快捷而高效的词汇摘要。资源定位。由于关键词云图中的关键词是具备超链接的,点击其中任何一个就可以跳转到包含该关键词的一组文献资源,为用户提供了准确的内容定位。专题导航。关键词云图按关键词的重要性设置不同的显示特征,权重较大的关键词要么字体较大,要么颜色突出,在视觉效果上能够首先吸引用户的注意。通过浏览关键词云图,用户能够很快捕捉到

13、常用关键词和重点关键词。挖掘潜在需求。通过检索某一主题得到的关键词云图,除了涵盖用户已知的关键词外,同时包含了同一主题下用户不知道的其他关键词,用户可以利用这些关键词扩展查询。因此,关键词云图有帮助用户挖掘潜在需求的功能。综上所述,关键词云图既是个性化的索引,因为它能够为用户指引同类信息的所在;也承担了文摘的功能,因为它从词汇角度揭示原文内容,是原文信息的浓缩。1.3 Keyword Cloud 在图书馆服务中的需求分析传统的关键词检索中,用户根据自己的信息需求,利用系统提供的关键词检索入口,输入自己选定的关键词,系统按照用户的查询指令查找符合条件的对应内容,并把检索结果组织起来提供给用户。相

14、比于传统的关键词检索和结果展现方式,关键词云图体现了一种新的服务理念和服务方式,有着重要的应用价值:可视化服务:关键词云图的特点在于直观,用户可以根据字体大小或者颜色深浅很快地发现重点和热点。直观便捷,这符合用户使用服务的最省力原则,易为用户接受。个性化服务:任何形式的文献集合,都可以产生相应的关键词云图。以用户收藏的3文献为例,不同用户有着不同的关键词云图。该云图不仅汇总了用户的研究主题和关注重点,并且可以帮助用户进行文献管理和内容查找,是一种个性化的服务工具。深层次服务:关键词云图体现了一种更深入的服务模式:在内容维度上,可以帮助用户全面分析特定主题领域的文献信息,概览体现的是广度,关键词

15、细化体现的是深度;在时间维度上,可以帮助用户了解研究重点随时间的变化趋势。上文对 Keyword Cloud 概念、功能和应用需求进行了简要分析,下面将在实际系统环境中将关键词云图付诸应用,并探讨其使用效果。2 Keyword Cloud 在文献检索中的应用2.1 应用背景Keyword Cloud对于非结构化数据具有良好的导航和汇总功能,由于其突出强调了重要概念,使得人们可以很快通过浏览获得概要信息。因此,本研究将Keyword Cloud应用于国际西文引文数据库的检索服务中:从用户的检索结果中抽取权重符合一定标准的关键词制作关键词云图,用以汇总此次的检索结果;通过云图中带链接的关键词,用户

16、可以跳转到相关主题实现二次检索。考虑到传统Tag Cloud缺少时间框架,在Keyword Cloud中加入了时间控件,可以按年显示关键词云图。利用云图汇总检索结果的相关研究有:PubCloud 4使用Tag Cloud汇总从PubMed数据库中检索出的生物医学文献结果,其标签集合是从查询结果记录的文摘中提取而成的;Tag Cloud展示汇总关键词的功能也被应用到Email中 5;CourseCloud 6通过标签云图汇总检索结果,方便用户重定义检索关键词,获得更深入更多样化的结果。2.2 系统流程结构Keyword Cloud 系统结构分三层,如下图所示。用户界面层:负责与用户的交互。接收用户的查询请求,将查询结果和关键词云以特定的格式呈现给用户,供用户浏览和检索。逻辑处理层:负责逻辑功能实现。接收用户查询参数,构造为数据库可以执行的 SQL查询语句,发送至数据库服务器查询;接收数据库返回的查询结果集,将其按一定格式显示到用户界面上;同时从查询结果

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号