TRS和autonomy比较

上传人:206****923 文档编号:41628586 上传时间:2018-05-30 格式:DOC 页数:9 大小:105.50KB
返回 下载 相关 举报
TRS和autonomy比较_第1页
第1页 / 共9页
TRS和autonomy比较_第2页
第2页 / 共9页
TRS和autonomy比较_第3页
第3页 / 共9页
TRS和autonomy比较_第4页
第4页 / 共9页
TRS和autonomy比较_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《TRS和autonomy比较》由会员分享,可在线阅读,更多相关《TRS和autonomy比较(9页珍藏版)》请在金锄头文库上搜索。

1、TRS 公司与公司与 AUTONOMY 公司及两公司全文检索产品的比较公司及两公司全文检索产品的比较一、从公司的规模、产品线等方面进行总体的比较:TRSTRSAutonomyAutonomy公司简介中文全文检索的创始者,在企业和互联网搜索、内容管理和 信息挖掘等领域具有领先的技术和产品,是国内最大的搜索 和内容管理技术提供者,是非结构化信息处理技术领域的创 新者和领导者。Autonomy 是世界上技术领先,产品优秀的不规整信息智 能处理软件公司,在美国和欧洲纳斯达克高科技股票市场, 伦敦股票市场都已上市数年。作为一家国际软件公司, 提供全面完整的智能软件结构,自动化地处理,操作和 应用不规整的

2、信息。 公司规模公司总部在北京,现有员工 200 多人,已在全国主要城市建 立了分公司、办事处或合作伙伴网络,为当地客户提供高水 平的本地化服务。Autonomy 总部设于英国剑桥和美国旧金山,作为一家国 际性软件公司,拥有遍布世界各地的分公司。包括伦敦, 罗马,慕尼黑,纽约,芝加哥,悉尼,新加坡,北京等 20 多个分公司和办事处。 产品体系结 构TRS 不但提供企业搜索服务,还提供完善的内容管理服务, 且拥有大量的应用产品。 Autonomy 由动态推理引擎、用户服务器和分类服务器组 成的核心架构。外围缺少可直接应用的企业级产品 市场占有率在大中华地区有 2000 家企业级用户全球有 160

3、0 家客户,在大中华地区客户不超过 20 家 公司发展公司成立十余年来,销售收入和利润始终保持持续的增长, 自 1996 年以来连续 10 年盈利,是中国从事自主核心技术和 软件产品研发的典范企业之一。在国际上发展比较快,保持增长。在中国,由于已知的 原因,发展刚刚起步,可持续发展有待验证。小结1、两家公司都提供全文检索的解决方案,AutonomyAutonomy 公司更擅长多语言,TRSTRS 公司更擅长中文处理。 2、两家公司技术能力都非常强,都是该领域的领头羊。 3、TRSTRS 公司是自主研发的中文处理技术,AutonomyAutonomy 公司外购中文分词等技术,对于中文处理没有基础

4、性技术的储备和 经验。4、TRSTRS 公司针对中文处理有自己的技术研发团队,力量雄厚,产品升级快、性能提高迅速。AutonomyAutonomy 公司对中文处理 起步晚,研发力量相当薄弱。 5、TRSTRS 公司全国各地都有分公司,业务遍及全国;AutonomyAutonomy 公司是国际化公司,拥有遍布世界各地的分公司,近年进 入中国。 6、AutonomyAutonomy 公司在中文处理上基本上不如 TRSTRS 有竞争力,TRSTRS 在其他国家竞争力不如 AutonomyAutonomy 公司。 7、实施 AutonomyAutonomy 公司产品成本比较高,TRSTRS 公司产品成

5、本比较合理8、TRSTRS 公司本地化服务能力远强于 AutonomyAutonomy 公司,TRS 在中国本地拥有经验丰富的搜索引擎系统咨询、设计、开发和部署实施力量,AutonomyAutonomy 在中国的代理或办事处的技术人员相对很少,且对 AutonomAutonomy 产品的理解和开发部署能力有限。二、针对全文检索产品的比较:TRSTRS(TRSServerTRSServer)AutonomyAutonomy速度单机环境下使得 G 级数据库查询速度达到亚秒级 T 级静态文本数据库,一个任意词的检索都在 1 秒钟之内可以达到毫秒级自然语言检索提供自然语言检索功能(Like 函数)可以

6、直接以自然语言 检索手段允许使用文中的任意字、词、短语、句和片段进行 检索 提供了多达 48 种检索运算符。包括外部特征与正 文内容的各种逻辑组合检索、位置检索、二次检索、 渐进检索、历史检索、词根检索、大小写敏感检索、 概念检索、对检索结果按与检索表达式的相关性程 度排序等提供带布尔逻辑条件的关键词检索、字 段检索、参数检索、多语种混合检索、 关键词之间位置关系检索、二次精确检 索等功能。 布尔逻辑条件搜索:支持“与、或、非、 异或”等逻辑条件;检索相似性关联相似性检索在效率上达到百万级资料库上的秒级响 应速度,支持多线程调用机制,能够满足实用要求。特点: 基于文本内容的相似度计算方法,保证

7、检索结果的 准确性。 内嵌高效准确的 TRS 检索引擎,可同时检索数百万 篇文档,保证速度可用(秒级响应)。 可自由设定文档相似度的阈值和检索结果集的大小。提供信息的自动关联服务。 Autonomy 的架构可以通过识别文档的主 要概念,进而分析信息间的主要关系, 从而实现内容间的交叉索引对照。支持跨语言相似性检索,输入中文文档,可以在库 中检索相似的英文文档。 检索效率与文档长度无关,长文档的相似检索与短 文档的相似检索同样高效。 基于文档“指纹”的文本查重技术,支持千万量级 的网页查重。 内嵌 TRS 汉语自动分词系统。 内置主题词典、分类词典等丰富的语言学资源。 装库并建立索引效 率2G/

8、小时3G 文本/小时动态索引能够实时提供检索服务。即数据增删改时快速同步 更新索引,无需重建整个索引也无需局部重建索引。不支持动态容量每个数据库可加载 42 亿条记录, 数据库大小没有 限制支持 20,000,000 份文档数据库、试图数量多达数十亿个数据库/视图不确定 同时检索的数据库 个数没有限制不确定空间膨胀率高效的数据和索引压缩, 实现了低空间膨胀率(一 般介于 01.0 之间)较高镜像支持数据库一对多的单向镜像, 提高系统的并发访 问性能不支持数据库性 能安全性具有系统级、数据库级、记录级和字段级四级安全 控制机制 加密和压缩传输 除了可对数据库进行联机备份外,还提供系统所有Auto

9、nomy DRE 支持和第三方的安全认证 系统(如 LDAP)的权限无缝集成。 Autonomy 支持 SSO 单点登陆,即用户以 一个用户名和密码登陆到系统后,会同信息的联机备份 检索实例的唯一化, 妥善处理无用请求,提高系统 资源利用率 最大检索时间和最大排序记录数限制,提高系统资 源利用率 较完善的日志管理,可以根据需要灵活配置 系统提供多种权限级别的用户管理 支持用户组的概念,以及 Group DBA 的概念,适应 大型应用中复杂的系统管理和应用 支持的用户类别 超级用户(SYSTEM)。 系统数据库管理员(DBA)。 用户组数据库管理员(GDA)。 系统资源用户(RESOURCE)。

10、 系统登录用户(CONNECT)。步其它应用系统的用户信息,不用再次 输入其它资源的用户名和密码。 Autonomy 支持整合文件系统 (Unix/Linux 文件权限和微软活动目录 权限)、Notes、Documentum、Oracle 数据库等各种系统的权限信息,保证用 户只能浏览和搜索(其权限范围内)的 文档。词典的维护分词词典 主题词表 同义词 反义词典 禁用词典未知索引按词索引 按字索引 字词混合 按关键词 二元索引关键字索引 交叉索引数据库维 护编码客户端支持以下三种字符集:GB2312/GBK/GB18030基于 Unicode 设计,支持多国语言和多编码,BIG5 编码, UT

11、F8 编码。 核心直接支持 GB2312/GBK/GB18030,BIG5 和 UTF8。GB18030 编码种编码共存。语种支持支持中英文或其它语种的混合检索 多语种的分词:包括拉丁语(英语、法语、德语、 西班牙语等等)、西里尔语(俄语等等)、阿拉伯 语 多语种的词根:包括英语、俄语、法语、西班牙语、 葡萄牙语、意大利语、德语、荷兰语、瑞典语、挪 威语、丹麦语、芬兰语 12 种语言Autonomy 提供多达 80 种以上的多语言 支持,实现在一套系统之上的多语言检 索能力。备份支持工具备份和命令语言两种备份方式 支持索引库、数据库的冷备份 支持数据恢复 支持数据库之间的导入、导出Autono

12、my 支持对索引库实现冷备份,在 索引库出现问题时可以及时恢复数据。数据库客户端提供 TRS 管理员工具,主要用于对各种 TRS 对象进 行管理、设计和维护等,并具备完整的检索、浏览 和维护功能。无接口C/C+应用开发接口 COM 应用开发接口 Java 应用开发接口 .Net 应用开发接口 单机版应用开发接口未知。扩展性负载均衡支持数据分布以及负载均衡两种基本分布方式,并 支持两种方式的组合运用。 提供分布式检索和负载均衡集群服务器 并为此为提供了以下几项具有针对性的功能:通过 Autonomy DAH(分布式请求服务器) 和 Autonomy DIH(分布式索引服务器)来实 现负载均衡1.

13、 增加排序向量的输出功能,以加速集群对检索 结果的归并排序。 2. 直接输出绝对相关性,以便于集群对检索结果 相关性的统一处理。 3. 为集群提供动态的负载状态指标,以便集群在 均衡负载时计算调度权值。 4. 对来自集群的登录进行特殊处理。 音视频处理支持音视频加载存储和基于相关文本介绍内容的检 索处理提供对音视频信息进行实时监控和内容 处理 自动摘要基于统计技术的文本自动摘要技术 同时支持中英文文本的自动摘要,并可根据用户需 求扩展到其他语种。 用户可根据需求调整自动摘要的长度,调整百分比、 字数、句数。 支持主题词标引功能,包括公文主题词标引和任意 主题词标引两种。 支持偏重摘要功能,可以

14、根据用户的摘要意图进行 摘要。 内嵌 TRS 汉语自动分词系统 内置主题词典、分类词典等丰富的语言学资源。 包含国办公文主题词表、中办主题词表等多部主题 词表。 自动摘要速度每秒 40 篇以上。 支持中英文摘要,还可根据用户需求扩展到其他语 种。可以对文档中最主要的概念进行概括内 容摘要。分布式部署分布式部署支持分布式部署和检索支持分布式部署平台Unix(Solaris2.6/7,AIX4.3/5.1,HP-UX11.0; 及以 上)、Microsoft Windows NT/2000/2003/XP、Linux2.4 及以上windows NT/windows 2000 /windows x

15、p/windows 2003 Linux/AIX/HP Unix/Solaris 数据接口网关提供 GATEWAY,实现与主流关系数据库 (Sybase、Oracle, SQL Server 和 DB2)以及 Lotus Notes 无缝连接 支持 BLOB/CLOB 大字段类型; 支持数据库中存储文件路径,支持抓取文件系统中 的物理文件位置; 支持所有常用字段数据类型; 支持对抓取字段的处理,如去除 商标信息、去除 空白字符、去除 HTML 标签、字段合并、字段重命 名等。所有支持 ODBC 的数据库,如 ORACLE、DB2、MS SQL Server、Sybase 等; 支持 BLOB/

16、CLOB 大字段类型; 支持数据库中存储文件路径,支持抓取 文件系统中的物理文件位置; 支持所有常用字段数据类型; 支持对抓取字段的处理,如去除 商标信 息、去除空白字符、去除 HTML 标签、字 段合并、字段重命名等。 小结1、查询性能上,两个产品无明显的差别。但在中文海量数据检索处理上,TRS 优势明显。 2、两个产品都实现了跨平台支持 3、数据库的维护方便性、扩展性方面,TRS 优于 Autonomy。 4、两个产品都提供多种接口的二次开发 5、两个产品都提供与主流关系数据库无缝连接 6、TRS 在非结构化和结构化数据结合起来进行检索方面优势明显,如结合很多其他的(文档)属性 条件.Autonomy 此方面比较简单和初级。 7、TRS 全文数据管理系统更擅长于企业专有数据的搜索。支持按词索引、按字索引、字词混合索引。 即适应不同应用环境的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号