elasticsearch技术分享

上传人:小** 文档编号:91945631 上传时间:2019-07-04 格式:PPT 页数:11 大小:1.40MB
返回 下载 相关 举报
elasticsearch技术分享_第1页
第1页 / 共11页
elasticsearch技术分享_第2页
第2页 / 共11页
elasticsearch技术分享_第3页
第3页 / 共11页
elasticsearch技术分享_第4页
第4页 / 共11页
elasticsearch技术分享_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《elasticsearch技术分享》由会员分享,可在线阅读,更多相关《elasticsearch技术分享(11页珍藏版)》请在金锄头文库上搜索。

1、ElasticSearch,制作人:高博文,延时符,目录 Contents,Analyzer内部机制,存储模型,节点分类,Write实现原理,Read实现原理,02,延时符,Analyzer内部机制,04,字符过滤器(character filter),他们的任务实在分词前整理字符串,可以用来去掉HTML标签,或者将&转化成“and”,分词器(tokenization),一个简单的分词器遇到空格和标点的时候,会将文本拆成词条,Token过滤器(Token filtering),最后,词条按顺序通过每个Token过滤器,这个过程可能会改变词条(例如小写化,删除无用词或增加同义词),延时符,Ana

2、lyzer内部机制,04,延时符,05,标准分析器( Standard Analyzer ),简单分析器( Simple Analyzer ),空白分析器( Whitespace Analyzer ),停止分析器(Stop Analyzer),语言分析器( Language Analyzers ),关键词分析器( Keyword Analyzer ),延时符,模式分析器( Pattern Analyzer ),指纹分析器( Fingerprint Analyzer ),内置分析器,存储模型,04,设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live i

3、n Guangzhou too 文章2的内容为:He once lived in Shanghai.,经过处理后(分词,过滤无用词,小写化): 文章1的所有关键词为:tom live guangzhou i live guangzhou 文章2的所有关键词为:he live shanghai,建立倒排索引,关键词 文章号 出现频率 出现位置 guangzhou 1 2 3,6 he 2 1 1 i 1 1 4 live 1 2 2,5 2 1 2 shanghai 2 1 3 tom 1 1 1,延时符,节点分类,04,默认节点(node.master:true AND node.data:t

4、rue),默认值,既有成为主节点的资格,又可以存储数据,还可以处理客户端的请求,Master节点(node.master:true AND node.data:false),有成为主节点的资格,可以参与选举,master节点负责维护整个集群状态并保证数据一致性,Data节点(node.master:false AND node.data:true),存储数据节点,提供建立索引和查询索引的服务,延时符,Client节点(node.master:false AND node.data:false),又称coordinate节点和ingest节点,这些节点只负责处理用户请求,实现请求转发,负载均衡等

5、功能,write(写)/create(创建)操作实现原理,07,延时符,协调节点(coordinating node)使用文档ID(默认)将文档路由到对应的分片。Elasticsearch将文档ID以murmur3作为散列函数进行散列,并通过索引中的主分片数量进行取模运算,以确定文档应被索引到哪个分片。 shard = hash(document_id) % (num_of_primary_shards),Read的实现原理,08,延时符,获取阶段(Fetch Phase),查询阶段(Query Phase),39,结束语 conclusion,概述: ElasticSearch是一个基于Lu

6、cene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。,摘要:我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。我们希望搜索解决方案要运行速度快,我们希望能有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP来索引数据,我们希望我们的搜索服务器始终可用,我们希望能够从一台开始并扩展到数百台,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。因此我们利用Elasticsearch来解决所有这些问题及可能出现的更多其它问题。,延时符,感谢各位同僚的观看!,延时符,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号