《竞争情报系统的发展趋势》由会员分享,可在线阅读,更多相关《竞争情报系统的发展趋势(64页珍藏版)》请在金锄头文库上搜索。
1、竞争情报系统的发展趋势、关竞争情报系统的发展趋势、关键技术和应用键技术和应用施水才 2006年内容提要1.国内国内CI软件的发展状况及面临的问题软件的发展状况及面临的问题2.国内外国内外CI软件的发展趋势分析软件的发展趋势分析3.CI软件中的关键技术和应用软件中的关键技术和应用 信息搜索技术信息搜索技术 内容管理技术内容管理技术 文本挖掘技术文本挖掘技术4. 总结总结1.国内国内CI软件发展状况软件发展状况 市场稳步发展市场稳步发展 技术长足进步技术长足进步 市场竞争激烈市场竞争激烈 探索跨界合作探索跨界合作2.国内国内CI软件面临的问题软件面临的问题 国内国内CI软件面临的问题软件面临的问题
2、 我们应该如何面对这些问题和挑战我们应该如何面对这些问题和挑战 回顾国内CI软件的发展状况及面临的问题市场稳步发展CI工具提供商已为近百家企业导入CI系统中国网通中国电信普天集团中石化广州石化烟台万华燕山石化上海宝钢武汉钢铁电信石化钢铁索尼中国佳能中国海尔集团电子制造北京烟草常德卷烟昆明卷烟烟草中国银行香港华润海南航空其他上海大众汇众汽车汽车这些企业大部分集中在电信、石化、汽车、钢铁、电子这些企业大部分集中在电信、石化、汽车、钢铁、电子制造、烟草以及部分大型集团性企业。制造、烟草以及部分大型集团性企业。技术长足进步国内CI系统技术水平逐步接近国外水平v国外知名国外知名CI工具提供商工具提供商C
3、ipher Systems(Knowledge Works)Comintell AB(Knowledge Xchange)Novintel(Viva Intelligence Portal)Traction Software (TeamPage)v国内知名国内知名CI工具提供商工具提供商TRS (TRS CIS)Baidu(ECIS)市场竞争激烈大浪淘沙,部分CI工具提供商淡出市场v2005年年CI工具市场上的主要提供商工具市场上的主要提供商TRS Baidu天下互联易地平方赛迪数据v2006年年CI工具市场上的主要提供商工具市场上的主要提供商TRS Baidu探索跨界合作 CI工具提供商谋求
4、提供综合性服务与咨询提供商合作与咨询提供商合作提供提供CIS系统导入服务系统导入服务与内容提供商合作与内容提供商合作提供更加有价值的商业数据库资源提供更加有价值的商业数据库资源与培训提供商合作与培训提供商合作提供竞争情报培训服务提供竞争情报培训服务1.1.对对CISCIS系统的定位错误,认为系统的定位错误,认为CISCIS系统是万金油,可以完全代替人的工系统是万金油,可以完全代替人的工作。作。2.2.企业竞争情报体系框架的缺失,导致企业竞争情报体系框架的缺失,导致CISCIS不能够真正发挥其作用。不能够真正发挥其作用。3.3.由于技术的原因,由于技术的原因,CISCIS在情报分析方面的作用有待
5、加强。在情报分析方面的作用有待加强。4.4.企业企业 CISCIS的建设过程也是一个企业情报资源规划的过程、是一个导入的建设过程也是一个企业情报资源规划的过程、是一个导入咨询的过程,目前咨询的过程,目前CICI软件提供商缺乏这方面的能力。软件提供商缺乏这方面的能力。5. 5. 竞争情报服务产业链处于初级阶段,工具提供商和内容提供商缺乏有竞争情报服务产业链处于初级阶段,工具提供商和内容提供商缺乏有效的合作,目前效的合作,目前CISCIS系统大部分只实现了对互联网信息和企业内部信系统大部分只实现了对互联网信息和企业内部信息的整合和搜索,缺乏对收费商业数据库的集成。息的整合和搜索,缺乏对收费商业数据
6、库的集成。 国内CI软件面临的问题1. CIS1. CIS的正确定位的正确定位2.2.完善企业竞争情报体系框架完善企业竞争情报体系框架3.3.推动情报分析技术的发展和应用推动情报分析技术的发展和应用4.4.加强竞争情报的导入咨询力度加强竞争情报的导入咨询力度5.5.借鉴国外经验,推动厂商的合作借鉴国外经验,推动厂商的合作我们如何面对这些问题和挑战?CIS系统的正确定位应用架构CIS系统的正确定位应用价值1.1.情报规划:建立统一的情报资源分类体系和信息资源库,消除情报信情报规划:建立统一的情报资源分类体系和信息资源库,消除情报信息孤岛息孤岛2.2.情报采集:提高情报工作的系统性和连续性,情报信
7、息的及时性和有情报采集:提高情报工作的系统性和连续性,情报信息的及时性和有效性。效性。3.3.情报加工:改变情报人员的情报加工:改变情报人员的2/82/8漏斗工作状态,提高情报研究效率。漏斗工作状态,提高情报研究效率。4.4.情报服务:拓展情报服务范围,提高情报服务水平。情报服务:拓展情报服务范围,提高情报服务水平。5. 5. 评估反馈:建立起情报需求和反馈机制,准确把握领导需求。评估反馈:建立起情报需求和反馈机制,准确把握领导需求。完善企业竞争情报框架体系企业情报体系框架 竞争情报部门竞争情报文化建立KIT管理流程竞争对手分析框架使命远景使命远景盈利模式盈利模式战略规划战略规划确认竞争对手建
8、立竞争情报系统竞争情报分析商业秘密保护完善企业竞争情报框架体系情报工作组织保障 情报分析责任部门情报分析责任部门战略决策部门信息管理部门营销管理部门企业经营单位企业财务部门.情报分析管理部门情报分析管理部门竞争情报系统管理部门竞争情报内容管理部门情报管理专员完善企业竞争情报框架体系KIT管理组织保障 企业高层决策团队企业中层管理人员KIT工作管理部门情报总管理员职能部门情报工作员职能部门情报工作员职能部门情报工作员业务单位情报工作员业务单位情报工作员业务单位情报工作员跨跨部门小组部门小组完善企业竞争情报框架体系KIT管理制度 竞争情报主管部门高层决策团队竞争情报参与部门情报课题确认及KIT立项
9、2情报子课题信息收集及研究4高层、中层提出情报需求1情报课题分解成多个KIQ并分发3情报需求表单情报子课题研究报告撰写提交5根据子课题报告形成项目结题报告6KIQ研究报告项目结题报告审阅7KIT项目结题报告推动情报分析技术的发展和应用v第一个方面:在企业的运营和市场竞争中可能要用第一个方面:在企业的运营和市场竞争中可能要用到各种各样的结构化数据分析方法。但是把这些分到各种各样的结构化数据分析方法。但是把这些分析技术集成在一个竞争情报系统中几乎是不可能的。析技术集成在一个竞争情报系统中几乎是不可能的。所以系统应具有良好的开放性,提供和专业统计分所以系统应具有良好的开放性,提供和专业统计分析软件结
10、合的接口。析软件结合的接口。v第二个方面:针对于非结构化数据,提供基于文本第二个方面:针对于非结构化数据,提供基于文本挖掘的可视化分析技术,提升挖掘的可视化分析技术,提升 CIS对海量非结构化对海量非结构化数据的文献分析能力。数据的文献分析能力。推动情报分析技术的发展和应用加强竞争情报系统的导入咨询力度v企业竞争情报供需调研企业竞争情报供需调研 对企业各职能部门工作时需要的情报信息种类、内容、需求时间、信息来源等作详细的了解。通过权衡企业各职能部门的情报供需关系,确定企业竞争情报系统中应包含的情报信息,以及信息的内容、种类、格式和来源。v企业情报信息统一规划企业情报信息统一规划 在确定好企业竞
11、争情报系统中应包含的情报信息的基础上,建立情报分类体系,对每个分类进行明确的定义,避免分类之间的重叠性;在情报分类体系的基础上规划情报产品,然后进一步确定情报的服务形式。v企业竞争情报系统安装和内容加载企业竞争情报系统安装和内容加载 安装企业竞争情报软件系统,导入情报分类体系和情报采集体系,建立分类体系和采集体系之间的关系,定制情报产品的格式和情报服务门户,并将当前企业已经具有的有效信息导入到系统中,进行内容加载。v企业竞争情报系统的推行企业竞争情报系统的推行 主要包括两个方面的内容:对竞争情报系统的使用管理进行培训;建立竞争情报系统管理制度,明确各个部门的责任、义务和权限,包括:KIT制度、
12、用户管理制度和信息提供制度等等。v企业竞争情报系统的运行、评价、调整。企业竞争情报系统的运行、评价、调整。 竞争情报系统的运行,并根据各个部门的反馈,结合企业的竞争情报的工作目标对系统进行客观评价,对情报分类体系、情报采集渠道、情报产品、情报服务方式、情报反馈机制等进行调整,以便更加适合企业的实际需要。加强竞争情报系统的导入咨询力度借鉴国外经验,推动厂商间的合作 国外内容提供商的商业数据库通过插件和国外内容提供商的商业数据库通过插件和CIS系统进行绑定系统进行绑定,提供多提供多个商业数据库、互联网信息和企业内部信息的个商业数据库、互联网信息和企业内部信息的联合检索联合检索,大大提高了,大大提高
13、了CIS的价值,并实现了内容提供商和工具提供商的利益共享。的价值,并实现了内容提供商和工具提供商的利益共享。国内外国内外CI系统的发展趋势分析系统的发展趋势分析国内外CI软件的发展趋势分析v 产品架构:产品架构:更注重产品的开放性和标准化更注重产品的开放性和标准化v 服务模式:服务模式:ASP模式和平台模式的结合模式和平台模式的结合v 情报规划:情报规划:集成完善的行业分类体系集成完善的行业分类体系v 情报服务:情报服务:体现个性化的情报服务理念体现个性化的情报服务理念v 情报安全:情报安全:更加注重情报安全和权限控制更加注重情报安全和权限控制v 情报加工:情报加工:情报的智能处理功能进一步增
14、强情报的智能处理功能进一步增强v 情报分析:情报分析:可视化文献分析技术将得到应用可视化文献分析技术将得到应用产品架构:更注重产品的开放性和标准化 CIS软件不但需要获取企业内外部的数据,同时还软件不但需要获取企业内外部的数据,同时还需要和企业购买的商业数据库、企业信息门户、企业需要和企业购买的商业数据库、企业信息门户、企业OA、企业、企业KM系统系统 、企业资源计划(、企业资源计划(ERP)、客户)、客户关系管理(关系管理( CRM)、企业供应链管理()、企业供应链管理(SCM) 等等等等进行紧密地结合。这就要求进行紧密地结合。这就要求CI提供商更加注重产品的提供商更加注重产品的开放性、标准
15、化和扩展性。开放性、标准化和扩展性。国内外CIS对标准协议的支持Knowledge XchangeHTTP、FTP、LDAP、POP3等等Knowledge WorksHTTP、FTP、LDAP、POP3以及通过以及通过PlugIN的方式和商业数的方式和商业数据库相连,实现多个商业数据库据库相连,实现多个商业数据库的跨库检索的跨库检索TeamPage HTTP 、 LDAP、POP3等等Viva Intelligence PortalHTTP 、XML等等TRS CISHTTP、POP3、OCR以及通过以及通过SOAP协议轻松的将情报发送到协议轻松的将情报发送到企业门户上企业门户上Baidu
16、ECIS HTTP等等服务模式:ASP模式和平台模式的结合Knowledge Xchange平台模式平台模式Knowledge WorksASP模式和平台模式模式和平台模式TeamPage ASP模式和平台模式模式和平台模式Viva Intelligence PortalASP模式和平台模式模式和平台模式TRS CIS平台模式平台模式Baidu ECIS 平台模式平台模式情报规划:集成完善的行业分类体系 从目前的竞争情报系统实施经验来看,绝大多数从目前的竞争情报系统实施经验来看,绝大多数企业对情报信息都采用分类的形式进行组织和管理,企业对情报信息都采用分类的形式进行组织和管理,分类体系的准确性
17、和完善程度会影响到软件的使用效分类体系的准确性和完善程度会影响到软件的使用效果。果。 相同行业的分类体系具有相似性和通用性,相同行业的分类体系具有相似性和通用性,CI软软件通过集成完善的行业分类体系,可以提高系统的应件通过集成完善的行业分类体系,可以提高系统的应用效果和应用价值。用效果和应用价值。情报规划:集成完善的行业分类体系情报服务:体现个性化的情报服务理念 企业情报企业情报信息库信息库网媒监测网媒监测简报服务简报服务定期报告定期报告信息检索信息检索KIT建立建立情报论坛情报论坛服务种类服务种类全体员工全体员工决策层决策层/管理层管理层决策层决策层/管理层管理层全体员工(权限)全体员工(权
18、限)KIT建立(情报分析员)建立(情报分析员)全体员工全体员工对象对象信息主管信息主管信息主管信息主管情报分析员情报分析员信息主管信息主管情报分析员情报分析员信息主管信息主管管理者管理者个性定制个性定制全体员工全体员工用户个人用户个人情报服务:体现个性化的情报服务理念 TeamPage 以群组管理为核心的情报服务方以群组管理为核心的情报服务方式,为不同的服务对象提供不同式,为不同的服务对象提供不同服务界面和情报信息。服务界面和情报信息。Viva Intelligence Portal个性化的信息推送服务,允许用个性化的信息推送服务,允许用户订阅感兴趣的情报分类和情报户订阅感兴趣的情报分类和情报
19、文档,系统会将信息推送到用户文档,系统会将信息推送到用户的的Email中或者移动电话中。中或者移动电话中。TRS CIS支持专业的竞争情报门户,并可支持专业的竞争情报门户,并可以为不同角色的用户,提供不同以为不同角色的用户,提供不同内容。同时也支持个性化的信息内容。同时也支持个性化的信息推送服务。推送服务。情报安全:更加注重情报安全和权限控制 安全机制:用户权限管理、用户组管理、加密设安全机制:用户权限管理、用户组管理、加密设置以及每条情报的访问级别控制。置以及每条情报的访问级别控制。 认证方式:支持认证方式:支持LDAP、支持包含、支持包含X.509客户证客户证书的书的SSL.情报加工:情报
20、的智能处理功能进一步增强v国外知名国外知名CI工具提供商工具提供商Knowledge Works 支持自动文摘等Knowledge Xchange 内嵌自动分类引擎。v国内知名国内知名CI工具提供商工具提供商TRS CIS以TRS CKM为基础,集成了自动分类、自动文摘、自动排重等文本挖掘技术。情报分析:可视化文献分析技术将得到应用 情报分析和文献分析有很多类似的地方,将文献情报分析和文献分析有很多类似的地方,将文献分析技术融入到分析技术融入到CIS软件中,对竞争情报的分析会有软件中,对竞争情报的分析会有很大的帮助,特别是随着文本挖掘技术的发展,可以很大的帮助,特别是随着文本挖掘技术的发展,可
21、以实现可视化的文献分析,将类似的信息聚集在一起,实现可视化的文献分析,将类似的信息聚集在一起,从而发现潜在行业、企业、产品的发展趋势。从而发现潜在行业、企业、产品的发展趋势。CI系统中的关键技术和应用系统中的关键技术和应用CI软件的三大关键技术引擎v 信息搜索:信息搜索:CI软件的基础引擎软件的基础引擎 实现情报资源的整合和搜索实现情报资源的整合和搜索v 文本挖掘:文本挖掘:CI软件的智能引擎软件的智能引擎 实现情报资源的智能加工实现情报资源的智能加工v 内容管理:内容管理:CI软件的应用引擎软件的应用引擎 实现情报资源的分发和利用实现情报资源的分发和利用CI软件的三大关键技术引擎 信息搜索技
22、术信息搜索技术 文本挖掘技术文本挖掘技术 内容管理技术内容管理技术 内容内容 管理管理 技术技术信息搜索(搜索引擎)分类企业级企业级搜索引擎搜索引擎EnterpriseSearchEnginev各种异构资源和数据库各种异构资源和数据库v严格的安全和权限管理,和业务系统的集成严格的安全和权限管理,和业务系统的集成v数据实时更新数据实时更新v对查询的准确性和全面性要求高对查询的准确性和全面性要求高v结构化和非结构化联合查询,复杂的排序要结构化和非结构化联合查询,复杂的排序要求求互联网互联网搜索引擎搜索引擎Web Search Enginev以互联网信息为主以互联网信息为主,不涉及企业内信息资源不涉
23、及企业内信息资源v更新周期较长,很难满足实时性要求更新周期较长,很难满足实时性要求v主要以主要以PageRank、 Top N 的预算和预估技术的预算和预估技术v信息具有公开性,无需和业务系统紧密集成信息具有公开性,无需和业务系统紧密集成v主要面向个人用户主要面向个人用户行业行业/垂直垂直搜索引擎搜索引擎Vertical Search Enginev综合企业级搜索和互联网搜索主要功能和特点综合企业级搜索和互联网搜索主要功能和特点v满足特定业务为核心需求,必须剔出无关信息。满足特定业务为核心需求,必须剔出无关信息。v信息的整合、关联和挖掘要求高信息的整合、关联和挖掘要求高v和业务系统结合,实现整
24、个信息生命周期管理和业务系统结合,实现整个信息生命周期管理实践证明: CI软件多采用企业搜索引擎来提供搜索服务Knowledge Work内嵌内嵌Verity K2 企业搜企业搜索引擎索引擎 Knowledge Xchange自主开发企业级信息搜索引擎和分类引擎自主开发企业级信息搜索引擎和分类引擎 TRS CIS 以以TRS Server为核心的企业级搜索引擎为核心的企业级搜索引擎企业级搜索引擎应用于竞争情报系统的四大特点v 异构化数据的统一搜索,实现企业内外部资源的整合异构化数据的统一搜索,实现企业内外部资源的整合v 实时的检索和索引,保证情报信息的及时和有效性实时的检索和索引,保证情报信息
25、的及时和有效性v 安全的检索和权限控制,保证情报信息的安全性安全的检索和权限控制,保证情报信息的安全性 v 查准率和查全率的最优化,提供更加准确的情报信息。查准率和查全率的最优化,提供更加准确的情报信息。 TRS 企业搜索引擎 异构数据统一管理,非结构化和结构化数据联合检索vOracle, DB2, SQL ServervNotes, v邮件服务器邮件服务器vFile System:Word,PDF, EXLvWeb: HTML, XMLvMail,vNewsvAudio, VideovFlash v结构化数据:结构化数据:SQL查询查询v非结构化数据:全文检索和搜索引擎非结构化数据:全文检索
26、和搜索引擎v但用户的数据在很多情况下是结构化数据但用户的数据在很多情况下是结构化数据+非结非结构化数据构化数据+半结构化数据半结构化数据v解决方案:解决方案:TRS Database企业级搜索引擎企业级搜索引擎 Verity K2所支持的部分异构数据源实时索引和检索v增量索引增量索引v数据和索引同步数据和索引同步v支持数据的实时支持数据的实时增删改增删改查准率和查全率的最优化v互联网搜索在查准率和查全率方面难以计算,主要追互联网搜索在查准率和查全率方面难以计算,主要追求前几页的相关性。求前几页的相关性。PageRank, TOP N 等v企业级搜索需要满足用户在查询和查全方面的需求。企业级搜索
27、需要满足用户在查询和查全方面的需求。v绝大多数情况下绝大多数情况下CIS中需要精确检索中需要精确检索(特别是结构化和特别是结构化和非结构化数据联合查询情况下)非结构化数据联合查询情况下)v企业级搜索的索引和搜索技术确保查准率和查准率企业级搜索的索引和搜索技术确保查准率和查准率只有下一页,没有最后一页严格的安全检索和信息访问控制TRS 企业搜索引擎的安全机制企业搜索引擎的安全机制v系统级、数据库级、记录级和字段级四级安全系统级、数据库级、记录级和字段级四级安全控制机制控制机制v加密和压缩传输加密和压缩传输v联机和脱机备份联机和脱机备份v完善的日志管理完善的日志管理v系统提供多种权限级别的用户管理
28、系统提供多种权限级别的用户管理v支持用户组的概念,以及支持用户组的概念,以及Group DBA的概念,的概念,适应大型应用中复杂的系统管理和应用适应大型应用中复杂的系统管理和应用 严格的安全检索和信息访问控制Verity 搜索引擎的安全机制搜索引擎的安全机制 Verity 可以使客户和合作伙伴安全的访问可以使客户和合作伙伴安全的访问受权限限制的内容和增值内容,用户可以获受权限限制的内容和增值内容,用户可以获得文档级的访问权限,并可以丛搜索结果或得文档级的访问权限,并可以丛搜索结果或目录列表中去掉受限制的项目。同时目录列表中去掉受限制的项目。同时Verity K2集成了所有标准的安全模式,包括:
29、集成了所有标准的安全模式,包括:LDAP、NT Domain、Lotus Notes 、Microsoft Exchange、ODBC等单一登陆等单一登陆解决方案。解决方案。内容管理技术的定义 实现对异构环境下以各类非结构化和半结构化数据实现对异构环境下以各类非结构化和半结构化数据为主的内容的全面管理,提供内容采集、创建、加工、为主的内容的全面管理,提供内容采集、创建、加工、存储、传递、组织、服务和反馈等内容全生命周期过程存储、传递、组织、服务和反馈等内容全生命周期过程中所需各项功能,以及元数据管理、智能检索和分析、中所需各项功能,以及元数据管理、智能检索和分析、数字版权和内容安全等专项技术,
30、使内容得到高效利用数字版权和内容安全等专项技术,使内容得到高效利用和增值,给内容所有者和消费者带来效益。和增值,给内容所有者和消费者带来效益。全生命周期的内容管理技术采集和创建采集和创建存贮和管理存贮和管理版本控制版本控制先进工作流先进工作流模版设计和管理模版设计和管理内容复制内容复制出版出版分发分发个性化个性化自动归类自动归类检索和导航检索和导航安全控制安全控制用户管理用户管理内容电子商务内容电子商务内容管理技术应用于竞争情报系统v 构建企业竞争情报门户构建企业竞争情报门户v 规范企业情报加工流程规范企业情报加工流程v 实现情报信息的多渠道分发和个性化服务实现情报信息的多渠道分发和个性化服务
31、 v 提供评估反馈机制,把握情报用户需求提供评估反馈机制,把握情报用户需求构建企业竞争情报门户可视化模版,随心所欲的驾驭展示内容模板编辑置标向导 设定最终生成的页面为HTML、SHTML、ASP、JSP等 模板分类管理 通过模板粘贴可以选择将现有站点下的模板文件粘贴至当前模板编辑窗口中 构建企业竞争情报门户灵活的发布策略,为不同的人群提供不同的情报门户服务规范企业情报加工流程可视化工作流技术,规范企业情报加工流程多渠道分发和个性化服务拓展情报服务范围,提高情报服务水平提供评估反馈机制,把握情报需求文本挖掘技术在CIS中的应用现状v作用:目前主要是实现情报信息的粗加工,目前在作用:目前主要是实现
32、情报信息的粗加工,目前在CIS中应用的文本挖掘技术中应用的文本挖掘技术文本分类(自动分类、规则分类和混合分类)自动排重自动摘要和关键词提取v随着文本挖掘技术的发展和随着文本挖掘技术的发展和CIS的深入应用,以下两种技术在的深入应用,以下两种技术在CIS中也将大有用中也将大有用武之地武之地自动聚类(用于可视化的文献分析)信息抽取(用于文本信息中事实信息的抽取) 目前文本分类技术的发展现状(TRS)v为用户提供个性化的服务:为用户提供个性化的服务:允许用户根据自己的分类需求和数据特点设定分类,支持多层分类结构v支持自动分类和规则分类的混合分类机制支持自动分类和规则分类的混合分类机制:分类法,分类算
33、法的问题引起的。比如,支持多种分类标准:内容分类体系,地区分类体系v对文本的类别结果智能给出类别的准确度值对文本的类别结果智能给出类别的准确度值便于用户进行人工干预。用户可集中对准确度值低的文本进行监测。v支持中英文混合自动分类,可以实现跨语言分类支持中英文混合自动分类,可以实现跨语言分类。v具有反馈学习功能具有反馈学习功能v补充训练机制补充训练机制 v产品成熟。经受了千万计数据的压力测试产品成熟。经受了千万计数据的压力测试.v分类速度快,每秒分类速度快,每秒50篇以上篇以上v分类精度高分类精度高: 自动分类的准确率达到自动分类的准确率达到86%90%,规则分类准确率达到,规则分类准确率达到9
34、5%以上以上 自动分类技术的应用v新华社采集入库项目,新华社采集入库项目,待编稿项目,报刊数据待编稿项目,报刊数据库项目等。库项目等。v遵循的分类标准是:遵循的分类标准是:新华社新闻分类法新华社新闻分类法。v该分类法包括两种分类该分类法包括两种分类机制:信息分类、地区机制:信息分类、地区分类,均为四层分类结分类,均为四层分类结构。构。v信息分类总类目数为信息分类总类目数为770个,地区分类总类个,地区分类总类目数为目数为280个。个。v信息分类采用信息分类采用自动分类自动分类+规则分类规则分类,地区分类,地区分类采用采用规则分类。规则分类。v统计分类的准确率为统计分类的准确率为85%。自动摘要
35、和关键词提取(自动标引)v现状:自动摘要技术目前不是十分成熟。现状:自动摘要技术目前不是十分成熟。v基本思想:对文章中的所有句子进行权值运算,基本思想:对文章中的所有句子进行权值运算,对所有的句子按权值排列,提取出权值大的作对所有的句子按权值排列,提取出权值大的作为关键句,进而形成摘要为关键句,进而形成摘要。v功能:功能: 摘要的句数或字数可按用户的要求,随机的产生。根据用户提供的关键词,来形成摘要。便于更好的人机交户。(偏重摘要)形成摘要的同时,可同时提供精确的关键词标引。提供包括行业主题词或自由主题词标引功能。自动分类和自动自动分类和自动提取关键词提取关键词基于内容的去重自动聚类v基本思想
36、:基本思想:自动对大量无类别的文档进行归类,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生把内容相近的文档归为一类,并自动为该类生成主题词,为用户确定类目名称提供方便。成主题词,为用户确定类目名称提供方便。v基本方法:采用相似度的方法,首先将文本聚基本方法:采用相似度的方法,首先将文本聚成一个个小簇,然后合并这些原子簇为越来越成一个个小簇,然后合并这些原子簇为越来越大的簇,直到簇的数目满足聚类要求。大的簇,直到簇的数目满足聚类要求。v应用:新闻事件的实时跟踪。检索结果的聚合应用:新闻事件的实时跟踪。检索结果的聚合等等聚类的信息岛图聚类的信息岛图聚类的时间趋势图聚类的时
37、间趋势图信息抽取v新词的识别:人名、地名、组织机构名等命名新词的识别:人名、地名、组织机构名等命名实体识别实体识别v信息抽取:时间、电话号码、身份证号、护照信息抽取:时间、电话号码、身份证号、护照号、号、email、车牌、案件名称等的抽取、车牌、案件名称等的抽取v采用的主要技术:采用的主要技术:采用规则与统计相结合的策略。基于已标注的语料库,进行知识学习。找到内容和内容之间的关系,从中发现内容找到内容和内容之间的关系,从中发现内容的新价值!的新价值!信息抽取演示总结v企业竞争情报系统在企业的成功应用离不开:企业竞争情报系统在企业的成功应用离不开: 企业竞争情报框架体系的建立。企业竞争情报框架体系的建立。 离不开离不开CI工具提供商、内容提供商和咨询提工具提供商、内容提供商和咨询提供商的合作,为企业提供供商的合作,为企业提供CI综合服务。综合服务。v 企业搜索技术、内容管理技术和文本挖掘技术企业搜索技术、内容管理技术和文本挖掘技术是搭建企业竞争情报系统的核心技术基础。是搭建企业竞争情报系统的核心技术基础。 随着技术的发展和应用的深入,文本挖掘技随着技术的发展和应用的深入,文本挖掘技术在情报分析上将会发挥作用。术在情报分析上将会发挥作用。谢谢!谢谢!S MSN:shi_