专利在线分析平台系统设计与分析指标体系研究

上传人:xmg****18 文档编号:112914075 上传时间:2019-11-07 格式:PPT 页数:56 大小:3.54MB
返回 下载 相关 举报
专利在线分析平台系统设计与分析指标体系研究_第1页
第1页 / 共56页
专利在线分析平台系统设计与分析指标体系研究_第2页
第2页 / 共56页
专利在线分析平台系统设计与分析指标体系研究_第3页
第3页 / 共56页
专利在线分析平台系统设计与分析指标体系研究_第4页
第4页 / 共56页
专利在线分析平台系统设计与分析指标体系研究_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《专利在线分析平台系统设计与分析指标体系研究》由会员分享,可在线阅读,更多相关《专利在线分析平台系统设计与分析指标体系研究(56页珍藏版)》请在金锄头文库上搜索。

1、中国科学院专利在线分析平台系统设计,国家科学图书馆: 刘丹军、赵雅娟、王晓梅、胡正银等 创想通科技: 阎武鹏 等 2010年 洛阳,专利的价值,现代社会是信息社会,有学者提出:在某种意义上,信息资源已经取代化石类资源,成为现代文明社会中最重要的战略资源之一。而在各种信息资源中,专利信息资源是由各国政府和组织认可的,“专利统计为技术变革过程分析提供了唯一的源泉,就数据质量、可获性及详细的产业、组织和技术细节而言,任何其它数据均无法与专利相媲美。”,专利利用的现状,我国自1985年实施专利制度以来,截至2009年3月,已累计授权专利2597904件。面对专利信息的飞速增长,我国专利信息利用的状况并

2、不乐观。我国企业的专利文献利用率只有35.4%,而日本企业为92%。,专利分析技术,(l)数据整理和概念分组。 (2)列表或直方图。 (3)共现比较矩阵(CooeeurreneyMatriees)。 (4)有结构数据聚类。 (5)无结构数据聚类。 (6)文档聚类地图。 (7)引文分析。 (8)“主语/行为/宾语” Subjeetlaetion/objeetSAO)。,国外专利分析软件,Derwent Analytics: Delphion: Aureka: SciFinder: STN Express with Discover: STN AnaVist:INAS: M-CAMDOORS Vi

3、visimo: OmniViz: Knowledgist:,国内专利分析软件,目前国内的很多机构和公司也开始介入专利分析工具的研发,比较成熟的有: 北京东方灵盾科技有限公司与MCAM合作的专利检索及战略分析平台East Linden Doors工具 ,保定大为公司的PatentEX专利信息创新平台、北京彼速信息技术公司的经纬线专利分析系统、国知局下属知识产权出版社开发的专利信息分析系统、恒和顿的HIT-恒库以及我国台湾连颖公司开发的PatentGuide等。,专利分析技术的发展趋势,一、语义与智能: 越来越多的软件开发商将自然语言处理、人工智能和语义技术等领域的创新应用于专利分析工具中。如欧盟

4、资助的PATExpert项目,以及BioPatentMiner平台。 二、细分与融合:软件开发商不再自己开发所有的模块而是各有侧重。分别在文本挖掘、数据处理和分析结果的可视化上下工夫。 三、泛在化: 不再是单机光盘版和席位制度,专利分析工具已经日益向泛在化和网络化发展。 四、个性化: 很多专利分析系统在分析指标体系、数据清洗规则等方面也提供自定义字段、自定义格式和自定义指标等多种个性化的功能等。 五、交互与可视化:现在有越来越多的分析工具在分析结果的可视化输出上取得突破,不少工具还可以将专利和其他类型的文献进行关联分析。,二、论文主要内容,相关技术介绍 整体构架与开发环境设计 基于Mysql的

5、数据库设计 工作流程与业务模块设计 关键技术分析 指标体系建设,相关技术介绍,建设本专利在线分析系统中涉及到的相关技术主要有:基于开源软件的数据库技术、系统平台技术、开发环境的J2EE技术、AJAX技术、基于Lucene的全文检索技术、基于JFreeChart的可视化技术。,相关技术介绍,MySQL:是一个开源的关系型数据库管理系统,目前被广泛地应用在Internet上的中小型网站中,是一个真正的多用户、多线程SQL数据库服务器。MySQL由一个服务器守护程序mysqld和很多不同的客户程序和库组成;mysql遵循SQL:2003标准,支持子查询、Unicode、视图、存储过程和触发器等。 U

6、buntu 是一个更新迅速且稳定可靠的 Linux 子项目,囊括了大量精选自 Debian版的软件包,同时保留了Debian 强大的软件包管理系统,提供了一个健壮、功能丰富的计算环境,支持各种架构,相关的任务均需使用Sudo指令 ,内置支持Java的开发,包括Tomcat 6.0和OpenJDK ;支持虚拟化KVM技术。,相关技术介绍,随着互连网络和企业信息化的飞速发展,HTTP、XML和Java平台逐渐演变成为针对主流应用开发的平台,由SUN为首的众多知名厂商共同制定的J2EE(Java2 Platform EnterpriseEdition)平台规范则为企业开发新应用提供了事实上统一的标准

7、。 J2EE体系结构提供中间层集成框架和统一的开发平台保证了产品的易用性、高可靠性以及扩展性的需求。同时完全支持Enterprise JavaBeans和XML,支持Servlets和JSP。有良好的可移植性,只需开发一次就可部署到各种操作系统、中间件、硬件平台上。,J2EE框架示意图,相关技术介绍,基于Lucene的全文检索技术 Lucene是一个开源的全文检索引擎工具包,2001年成为apache软件基金会jakarta的一个子项目,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene为软件开发人员提供一个简单易用的工具包,以便在系统中实现全文检索的功能

8、。 可视化技术JFreeChart JFreeChart是一个开源的java图形解决方案,其主要显示图型有:饼图、柱状图、线图、区域图、分布图、混合图、甘特图以及一些仪表盘等。JFreeChart可用于Servlet、JSP、Applet、Java Appication 等环境中,通过 JDBC 可动态显示任何数据库数据,并可导出成PNG和JPEG格式。,整体构架与开发环境,系统设计的总体思路: 是以满足用户个性化使用为目标,实现从专利数据特征项到分析指标,再到分析结果的可视化输出,最终实现海量数据检索与分析统计、用户个性化分析主题建设以及分析结果可视化的有机集成。,系统开发示意图,系统整体体

9、系结构设计,是基于MVC原理实现,共分DAO层、SERVICE层、ACTION层和WEB层。DAO层是靠hibernate来实现,SERVICE层是靠Springs来实现,ACTION层是靠Struts2来实现。专利系统是以Struts2的插件形式与Spring2进行整合,统计图采用jfreechart来实现。检索引擎使用的是Lucene实现的,定义了索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件,控制器(action),业务逻辑 组件工厂,业务逻辑 组件,DAO组件工厂,DAO组件,Hibernate 持久层,JDBC,后台工作流程,后台工作流程与配置,在struts.x

10、ml中配置的action指定class属性时,直接指向spring的bean id,这样完成了action-bean之间的关联,由spring中对应的bean实例创建action,在action中只是调用业务逻辑组件的方法就可以。 在业务逻辑方面由实现类具体实现,在业务逻辑组件中可以调用DAO组件,DAO 层的设计思路与业务逻辑层基本相同,DAO层是由多个DAO组件和一个DAO工厂组成,DAO组件的实现类似于业务逻辑组件,都是面向接口编程。 DAO工厂类提供一个缓冲池来缓存每个DAO实例,当然需要一个xml文件作为配置文件来配置所有DAO组件,工厂类里面要解析xml,通过反射创建DAO 组件实

11、例。在hibernate.cfg.xml中配置数据库信息,连接池采用的是Proxool。,系统整体构造,Web服务器采用的操作系统式ubuntu,java采用的是jdk1.6,tomcat采用6.0版本; 数据库服务器采用的操作系统式ubuntu,数据库采用的是mysql5.0; 源数据服务器采用的操作系统式是windows,数据库采用的是sqlserver。,数据库整体结构,采用三层数据库结构 数据源数据库:通过采集国家知识产权局提供的测试样本数据,除供专利检索系统使用之外,同时可以预留扩充余地提供给包括数据挖掘等其他应用。 专利检索系统镜像数据库:从上述数据源数据库同步收割数据,经过数据清

12、洗,数据库结构的变换,同时产生lucence索引后,作为专利检索系统的数据源,以期提供最高限度的检索性能。 用户个人数据表空间:根据本系统建立的专利分析指标体系,提供了30余种数据统计分析图表,为保证统计图表的表现性能,系统为每一个用户开辟了单独的表空间,作为该用户的个人数据区。该数据区上的数据,用户可以根据需要进行自定义的设定、修改或者调整。,系统示意图,开发环境构成与配置,平台数据库设计,中国专利数据的DTD定义 DTD(文档类型定义Document Type Definition) 是一套关于标记符的语法规则。它是XML1.0版规的一部分,是XML文件的验证机制,属于XML文件组成的一部

13、分。DTD 是一种保证XML文档格式正确的有效方法,包含:元素的定义规则,元素间关系的定义规则,元素可使用的属性,可使用的实体或符号规则,内容之二-数据库设计,本系统的数据源数据库系统完全按照国家知识产权局的数据格式存储。而专利分析镜像数据库与个人专利数据库都采用MySQL数据库作为数据库管理系统,其中个人专利数据库是在专利分析镜像数据库基础上添加了个人信息、项目信息、分类信息、专利分析策略等表格。可以说个人专利数据库结构设计涵盖了专利分析镜像数据库。数据库中的表格基本上分为三类,分别是:专利基本信息相关表、分析主题相关表、智能分类相关表,关系视图,关系视图,业务模块设计,提供对中国专利的专利

14、检索、装载、分类、标引、分析、导出等功能,可以按照用户需求建立主题数据库;本系统可以方便科研人员、专利分析人员实现基于专利的数据检索和分析,高效利用专利信息,提高技术创新能力。管理的资源对象主要为中国国家知识产权局提供的专利数据以及相关数字资源集合,包括索引、检索策略等。 系统的用户的类型与角色功能:系统用户类型总共分为3类:用户、系统管理员、数据维护人员.,功能描述与业务流程,系统采用机构、用户和主题三级管理方式。机构是指使用该系统的单位, 用户是机构下具体使用在线分析系统的用户,主题则是用户定制的研究课题的专利信息集合,是在专利数据库系统中检索并建立起来的结果集。用户可以根据自己的分析需求

15、建立多个主题。其业务全流程包括: 用户登陆, 建立专利主题,进行专利检索以抽取所需要的数据建立个人主题专利数据库, 对专主题专利数据库进行数据管理(数据规范化,数据清洗等), 进行专利分析。,总流程图,内容之三-业务模块,认证管理,内容之三-业务模块,数据检索: 经过用户认证后,系统默认进入数据专利检索页面,在该页面可以通过按钮选择:简单检索或高级检索,检索对象为专利数据库中的所有数据。简单检索对专利名称、申请号和摘要三个字段进行检索,结果有两种表现方式:摘要式和列表式,高级检索的表现方式为:列表式。,检索功能流程示意图,内容之三-业务模块,主题管理 新建一个用户后,程序自动建立一个主题组,名

16、称为:我的主题组,在我的主题组中有一个主题,名称为:我的专利。主题管理分为两部分,左边为主题组树,右边为主题列表。主题可以进行编辑、删除、合并、移动等操作; 可以在主题管理页面方便的查看各个主题的主题名称、主题中的专利件数、管理员,创建时间等相关信息;也可以对单个主题中的数据进行统计分析。,业务模块,统计分析: 对选定的专利数据检索结果集按照指定的分析指标进行分析, 如年度申请量、申请类型件数、申请人排行榜、发明人排行榜、国省代码排行榜等。根据分析结果和页面设定的显示设定,按照分析主题生成相应的点折线图、三维饼图、雷达图等多种图表,并可生成相应的分析数据表。,业务模块,数据清理: 数据清理功能分为服务器端和用户端,服务器端指的是在将相关专利数据库的授权数据导入检索服务器时所作的工作,而用户端指用户根据自己的需要针对检索结果集中的数据所作的清洗工作。,内容之三-业务模块,数据导出: 选中想要导出到其它主题中的数据,点击导出到主题按钮,此时将打开导出到主题窗体,在窗体中选择主题组和主题组中的主题,点击导出按钮,导出完

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号