一本书主要展现怎么使用Elasticsearch搭建可拓展的搜索手机应用程序。书中遮盖了Elasticsearch的主要特点,从使用不同的粉碎室和查询网站类型进行关联性调优,到使用集聚功能进行实时性分析,还有自然地理空间搜索和文本文档过滤系统等更多吸引人的特点。 全书共有两个部分,*部分表述了核心特点,内容主要牵涉Elasticsearch的介绍,数据的引索、刷新和全部删除,数据的搜索,数据的分析,使用关联性进行搜索,使用集聚来探寻数据,文本文档间的关系等;第二部分介绍每个特点工作的更多细节及其对性能和可维护性的影响,为了对核心功能进行产品化,内容主要牵涉水平拓展和性能提升等。除此以外,一本书还有6个附录(网络上免费下载),提供了小读者应该知道的特点,展现了关于自然地理空间搜索和集聚,怎么管理Elasticsearch软件,学习在百度搜索中如何高亮度查询网站英语单词,在生产环境中用于帮助管理Elasticsearch的三方的网络监控工具有什么,怎么使用Percolator过滤系统为多个查询网站配对小量文本文档,怎么使用不同的建议器来实现自动完成的功能。
目录
- 第1章 Elasticsearch介绍 2
- 第2章 深入功能 17
- 第3章 索引、更新和删除数据 47
- 第4章 搜索数据 74
- 第5章 分析数据 106
- 第6章 使用相关性进行搜索 136
- 第7章 使用聚集来探索数据 164
- 第8章 文档间的关系 197
- 第二部分
- 第9章 向外扩展 238
- 第10章 提升性能 268
- 第11章 管理集群 311
- 附录A 处理地理空间的数据(网上下载)
- 附录B 插件(网上下载)
- 附录C 高亮(网上下载)
- 附录D Elasticsearch的监控插件(网上下载)
- 附录E 使用渗滤器将搜索颠倒过来(网上下载)
- 附录F 为自动完成和“您是指”功能使用建议器(网上下载)
读书笔记
安装elasticsearch-analysis-ik中文分词器的步骤讲解
1 安装elasticsearch-analysis-ik中文分词器
Ik介绍:ik是一款中文的分词插件,支持自定义词库。
1.1 下载ik分词器
下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases
下载指定版本的分词器(zip版本)
1.2 解压ik分词器
[es@bigdata1 plugins]$ cd /home/es/ [es@bigdata1 ~]$ ls elasticsearch-6.2.2 jdk1.8.0_161 kibana-6.2.2-linux-x86_64.tar.gz elasticsearch-6.2.2.tar.gz jdk-8u161-linux-x64.tar.gz logstash-6.2.2.tar.gz elasticsearch-analysis-ik-6.2.2.zip kibana-6.2.2-linux-x86_64 [es@bigdata1 ~]$ unzip elasticsearch-analysis-ik-6.2.2.zip Archive: elasticsearch-analysis-ik-6.2.2.zip creating: elasticsearch/ inflating: elasticsearch/elasticsearch-analysis-ik-6.2.2.jar inflating: elasticsearch/httpclient-4.5.2.jar inflating: elasticsearch/httpcore-4.4.4.jar inflating: elasticsearch/commons-logging-1.2.jar inflating: elasticsearch/commons-codec-1.9.jar inflating: elasticsearch/plugin-descriptor.properties creating: elasticsearch/config/ inflating: elasticsearch/config/extra_single_word_full.dic inflating: elasticsearch/config/quantifier.dic inflating: elasticsearch/config/IKAnalyzer.cfg.xml inflating: elasticsearch/config/main.dic inflating: elasticsearch/config/extra_single_word_low_freq.dic inflating: elasticsearch/config/extra_stopword.dic inflating: elasticsearch/config/preposition.dic inflating: elasticsearch/config/extra_main.dic inflating: elasticsearch/config/extra_single_word.dic inflating: elasticsearch/config/suffix.dic inflating: elasticsearch/config/surname.dic inflating: elasticsearch/config/stopword.dic [es@bigdata1 ~]$ ls elasticsearch elasticsearch-analysis-ik-6.2.2.zip kibana-6.2.2-linux-x86_64 elasticsearch-6.2.2 jdk1.8.0_161 kibana-6.2.2-linux-x86_64.tar.gz elasticsearch-6.2.2.tar.gz jdk-8u161-linux-x64.tar.gz logstash-6.2.2.tar.gz [es@bigdata1 ~]$ mv elasticsearch/* ./elasticsearch-6.2.2/plugins/ik/ [es@bigdata1 ~]$ vim ./elasticsearch-6.2.2/config/elasticsearch.yml
1.3 重新启动Elasticsearch服务
ps -ef | grep elasticsearch
然后kill掉相关的进程。
然后按照18.8的方式启动elasticsearch进程
1.4 然后执行以下命令
GET _analyze { "analyzer":"ik_smart", "text":"2018年5月全球编程语言排行榜" }
运行结果是:
{
"tokens": [
{
"token": "2018年",
"start_offset": 0,
"end_offset": 5,
"type": "TYPE_CQUAN",
"position": 0
},
{
"token": "5月",
"start_offset": 5,
"end_offset": 7,
"type": "TYPE_CQUAN",
"position": 1
},
{
"token": "全球",
"start_offset": 7,
"end_offset": 9,
"type": "CN_WORD",
"position": 2
},
{
"token": "编程",
"start_offset": 9,
"end_offset": 11,
"type": "CN_WORD",
"position": 3
},
{
"token": "语言",
"start_offset": 11,
"end_offset": 13,
"type": "CN_WORD",
"position": 4
},
{
"token": "排行榜",
"start_offset": 13,
"end_offset": 16,
"type": "CN_WORD",
"position": 5
}
]
}
Kibana的效果图
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对码农之家的支持。如果你想了解更多相关内容请查看下面相关链接