trs产品与技术体系总体介绍

上传人:第*** 文档编号:48807145 上传时间:2018-07-20 格式:PPTX 页数:39 大小:4.31MB
返回 下载 相关 举报
trs产品与技术体系总体介绍_第1页
第1页 / 共39页
trs产品与技术体系总体介绍_第2页
第2页 / 共39页
trs产品与技术体系总体介绍_第3页
第3页 / 共39页
trs产品与技术体系总体介绍_第4页
第4页 / 共39页
trs产品与技术体系总体介绍_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《trs产品与技术体系总体介绍》由会员分享,可在线阅读,更多相关《trs产品与技术体系总体介绍(39页珍藏版)》请在金锄头文库上搜索。

1、TRS产品技术体系总体介绍北京拓尔思信息技术股份有限公司交流要点 TRS总体产品与技术体系介绍 TRS技术解决方案介绍(部分) 企业搜索、内容管理解决方案 知识管理解决方案 内网门户解决方案 TRS相关产品Demo演示企业的信息管理现状企企业应业应业应业应用系用系统统统统数据仓库仓库非结结构化资资 源管理各种关键业务数据各种文本、图片、邮件等其他未管理但有用的各 种信息缺缺缺缺 失失失失TRS公司愿景和技术理念自主创新搜索整合发现海量非结构化 信息处理TRS产品具有100% 的自主知识产权现实世界中80%的 信息是非结构化的 每每1818个月新增的存个月新增的存 储量等于有史以来储量等于有史以

2、来 存储量之和存储量之和! !企业搜索引擎让 人们像使用互联 网搜索引擎那样 搜索复杂的企业 信息内容管理技术实 现对非结构化信 息的全生命周期 管理(采集、生 产、存贮、检 索、发布、利用 )智能挖掘技术通 过知识提取和内 容之间关系的挖 掘,发现内容的 新价值面向全球竞争 目标是成为中国和亚洲非结构化信息处理技术的领导 者。TRSTRS行业技术地位行业技术地位自主核心技术术搜索内容管理文本挖掘 的知识识管理1. 国家科技进进步二等奖奖2. 为为全文检检索和非结结构化数据库库第一品牌1. 中文内容管理的首倡者2. 国内内容管理市场场占有率第一3. 覆盖从内容采集、创创建、传递传递 到分析完整

3、的内容全生命周期管理 1. 在多次权权威评测评测 中名列前茅2. 率先实现实现 文本挖掘技术术的产产品化和实实用化TRS市场地位2007年中国企业搜索市场主力厂商份额结构2007年中国内容管理市场主力厂商份额结构 2007年中国Web内容管理市场主力厂商份额结构 企业搜索软件 第一名Web内容管理软件 第一名主要竞争对手均为国际知名大厂商数据来源:赛迪顾问 2008,3TRS产品架构总图公司业务和主要产品应用领域产品类别文本挖掘全文检索内容管理核心技术结构化信息(20%)非结构化信息(80%)数据库 Oracle/SQLServer /DB2/置标信息 XML/网页邮件群件 即时消息/ Dom

4、ino/SharePoint/格式文档 TXT/Office/PDF/P S/音视频/纸质资源 公文/报告/图书/业务应用系统OA/ERP/CRM互联网内联网专有电子资源光盘期刊桌面数据信息源细分市场网站及内容管理市场企业及垂直搜索市场文本分析与挖掘市场知识管理和门户市场内容管理软件企业搜索软件互联网信息服务文本挖掘软件知识管理与门户信息类型主营业务与目标市场关系图企业内容管理电子政务知识管理企业搜索互联网垂直搜索舆情监控门户网站群数字媒体竞争情报数字图书馆TRS主要产品列表1. 企业搜索相关产品 TRS Database Server、Cluster、API、GateWay TRS WAS、

5、TRS CDS2. 内容管理相关产品 TRS WCM、TRS EKP3. 门户及应用整合相关产品 TRS Portal、TRS IDS4. 互联网信息服务相关产品 TRS Inforadar、TRS CIS、TRS OM5. 文本挖掘基础产品 TRS CKM知识挖掘工具包企业信息化相关解决方案 企业搜索解决方案 网站内容管理解决方案 企业知识管理解决方案 企业内网门户解决方案TRS企业搜索解决方案WorldResearchBlogsNewsProductsThe WebImagesPrint ContentEnterpriseFile SharesEnterprise ApplicationI

6、ntranetSecure ContentDatabasesContent MgmtCRMCorporate Web SiteSpreadsheetsDesktopPresentationsReportsIM ChatsDocumentsWeb PagesEmail搜索的对象与范围应用场景1. 互联网搜索 2. 垂直搜索服务 3. 企业内部统一检索服务 4. 某系统内部全文检索服务TRS企业搜索总体架构数据库Web应用文件系统多媒体邮件系统Notes等系统检索入口 数据库网 关网络雷达文件采集邮件采集Notes等网关扩展采集统 一 身 份 及 单 点 登 录智能分析与挖掘自动分类聚类分析关联分

7、析排重分析分类汇总知识发现拼音检索语义 分析全文检索引擎索引库 存储全文检索引擎检索集群服 务用户权 限服 务关键词检 索语义检 索高级检 索结果命中结果排序软件技术架构TRS搜索引擎集群架构TRS搜索集群扩展机制搜索引擎接口体系基于自然语言特点的索引策略 (中文)汉语分词及字词混合索引 采用语料统计的机器学习方法+歧义规则实例知识库的汉语分词 解决方案, 切分正确率达到99.1%。 由于汉语分词不能达到100%准确,所以中文检索系统需要提供一 种索引方式(字词混合索引),保证一定查准率的同时提供100%查 全的手段。 为了兼顾中文检索的查全和查准,索引程序也要做适应性调整。 国外检索产品只是

8、简单地内嵌一个好的分词软件并不能解决问题 (英文) 英文词根 英文词根采用”词典+算法”结合的解决方案, 准确率达 到99.999%。 支持中英文以及其它几十种主流语言的混合检索。支持各种检索高级应用 组合检索 以及属性字段检索和全文检索的联合查询 各种逻辑表达式检索 提供了多达48种检索运算符 多字段相关性排序 支持相关性排序, 并且可以设置文档的不同字段以不同的权重, 提升 关键字段的权重 分类汇总 检索结果的分类统计,支持用正则表达式来筛选分类统计的目标字 段值,并支持抽取部分子串组成新的类别。检索的智能语义扩展 语义分析检索 提供基于短语、句子、段落的模糊检索 英文大小写敏感检索、中文

9、简繁体扩展检索。 支持简繁扩展检索, 且简繁对照是基于词语级语境的, 例如:恢复 复员 报复 复议: 恢復 復員 報復 復議 复杂 复查 复制 重复: 複雜 複查 複制 重複 检索时能够应用同义词典和主题词典进行扩展检 索, 并且词典可维护 拼音检索、相似检索技术性能优势 实时动态索引 索引空间膨胀率小, 一般在100%内。 提供分布式检索和负载均衡集群, 以及二 级集群。 千万级数据秒级响应 支持主流的开发平台,提供CAPI、 JavaBeans和ADO.NET二次开发接口。企业搜索应用举例:搜索的应用集成检索结果的展现,建议先作检索结果汇总的展现点击进入各系统结果界面展现具体列表可以避免异

10、构数据在统一界面展现的繁琐结果的智能化组织热热点词词 自动动追踪用户户搜索行为为 掌握用户户搜索热热点相关文章推荐 1、利用TRS CKM的关键词键词 抽取+TRS like函数 检检索实现实现对对于所有文章抽取5个关键词键词 ,作为为另一个 字段存储储,每次取得文章后根据关键词进键词进 行如下检检索:keyword=like(本文关键词键词 ,60)。2、可以根据关键键字定义义相关检检索结结果 同音字推荐搜索结果的智能化组织信息来源标标注,帮助用户户 迅速判断文档是否所要相关短语语 1、预预置数十万的主题词题词 库库提供关联联 2、提供用户检户检索关键键字 自动动采集、关联联相关度模型 co

11、sine向量空间间模型 简单讲简单讲 : 1、根据关键键字在文章出 现现的频频度自动动匹配 2、关键键字与主题题的相关 性 、剔除贡贡献较较小的虚 词词、助词词等 结果的人性化展现TRS内容管理解决方案TRS WCM 简介 TRS WCM是 TRS内容管理产品家族中的核心成员 国内首款基于SOA架构的内容管理平台产品 可以轻松创建内部门户、外部门户、媒体门户、信息共享平台、组织工 作协作平台等等 TRS WCM 的功能 集成文字库、图片库、视频库、资源库,四位一体,构成业界最为强 大、完善的内容管理应用平台; 集成强大的工作流引擎与基于表单的网上办事功能,突破并丰富了内容 管理内涵 扩展提供内

12、容评论、问卷调查、智能处理、在线访谈、博客、广告管 理、可视化模板等的即插即用的功能选件,极大扩展了内容管理外延 全面支持Web Service,具有灵活的扩展集成应用与二次开发功能 系统与TRS全文检索、信息采集、信息分发、单点登录等产品无缝集成 应用,为用户提供最为完善、先进的内容管理解决方案定位:一套系统实现多种应用一套内容管理平台,就可以建立外部大型 站点、内部信息门户、内部办公平台,部 署不同的内容管理应用。TRS WCMTRS WCM外部网站内部门户办公平台通讯平台网站群的管理模式TRS知识管理解决方案TRS内网门户解决方案TRS产品相关演示 TRS WCM Demo演示 TRS

13、检索Demo演示 TRS 知识管理Demo演示 TRS 内网门户Demo演示TRS重点产品介绍 TRS CKM产品介绍 其他(根据现场要求)TRS中文知识管理工具包(TRS CKM)q主要功能是为中文文本应用提供开发工具箱。它集成了TRS公司最新推出的多项中文处理 技术。q工具包组成 TRS文本分类工具 TRS文本摘要工具 TRS文本聚类工具TRS相似性检索工具 TRS文本分词工具 TRS政治常识校对工具TRS信息过滤工具 TRS相关短语检索工具 TRS拼音同音检索工具q调用各功能模块均提供ANSI C和web service标准接口,可以轻松地嵌入到各种编 程环境中。目前已经被TRS 网络雷

14、达系统等多个TRS产品及项目采用。功能模块简介 自动分词可以对文本进行分词,识别文本中的人名、地名、组织机构 名等信息,是各种文本应用的基础。 自动分类可以自动地对文档进行分类,赋予文档一个预先定义的类别 主题词,便于文档的组织,不需人工干预。 自动摘要+主题词标引可以提取文本的主题,自动生成文本摘要,为用户快速浏览 信息提供快捷有效的方式。功能模块简介 自动聚类可以自动对文档进行归类,把内容相近的文档归为一类,并 自动为该类生成主题词。 相似性检索(自动排重)可以帮助用户检索与给定文档相似的文档,可以应用于文档 查重等诸多领域。 (政治)常识校对 可以对文章中敏感的政治内容进行校对,是审稿,校对过程 的有效工具。功能模块简介 自动过滤识别和过滤各种有害文本信息(如色情,反动,封建迷信,商业 垃圾邮件等),帮助用户摆脱有害信息的侵扰。以及个性化的服 务等。 拼音、同音检索提供全拼检索、简拼检索、同音检索技术,帮助用户快速有效 地检索自己所需要的内容,提供一个方便快捷的检索界面,方便 用户使用全文检索系统。 相似短语检索在交互式的检索过程中,根据用户输入的查询,向用户提供高 质量的“查询建议”,提供一组比较常用的相关查询供用户参考 ,方便用户使用全文检索系统拓尔思拓展你的思维!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 外语文库 > 英语学习

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号