Solr权威指南(上卷) 以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。
目录
- 序言
- 第1章 初识Solr 1
- 1.1 Solr是什么 1
- 1.2 Solr的历史 2
- 1.3 为什么要选择Solr 2
- 1.4 Solr功能预览 3
- 1.5 Solr下载 3
- 1.6 Solr学习资源 5
- 1.7 Windows平台下部署Solr 7
- 1.7.1 部署Solr至Jetty 7
- 1.7.2 部署Solr至Tomcat 13
- 1.8 Linux平台下部署Solr 16
- 1.9 玩转post.jar 20
- 1.10 在Eclipse中编译Solr源码 25
- 1.11 本章总结 27
- 第2章 Solr基础 28
- 2.1 Solr Core 28
- 2.1.1 Solr Core简介 28
- 2.1.2 Core的基本管理 30
- 2.1.3 Core Http接口 35
- 2.1.4 添加索引至Core 36
- 2.2 Solr DIH 38
- 2.2.1 索引文件夹下的文本文件 38
- 2.2.2 索引JSON/XML/CSV文件 42
- 2.2.3 使用Tika索引Word/Excel/PDF 45
- 2.2.4 索引网络上的远程文件 52
- 2.2.5 索引XML文件 55
- 2.2.6 从数据库中导入数据至Solr 57
- 2.2.7 Solr DIH总结 62
- 2.3 Solr Full Import全量导入 78
- 2.4 Solr Delta-import增量导入 80
- 2.5 Solr索引 85
- 2.5.1 Lucene索引原理 85
- 2.5.2 Lucene中常见术语详解 87
- 2.5.3 创建Solr索引 98
- 2.5.4 Solr Cell 99
- 2.5.5 Solr索引去重检测 102
- 2.5.6 Solr更新请求处理链 104
- 2.5.7 Solr原子更新 105
- 2.5.8 使用Luke查看索引 107
- 2.6 本章总结 109
- 第3章 Solr配置 110
- 3.1 solr.xml配置详解 110
- 3.2 solrconf?ig.xml配置详解 112
- 3.3 schema.xml配置详解 139
- 3.3.1 Solr Schema设计思想 139
- 3.3.2 Solr眼里的世界 139
- 3.3.3 域分词 140
- 3.3.4 Solr的schema文件 140
- 3.3.5 Solr的域类型 141
- 3.3.6 Solr的域 153
- 3.3.7 Schema API 157
- 3.3.8 Schemaless Mode 165
- 3.4 data-conf?ig.xml配置详解 167
- 3.5 zoo.cfg配置详解 169
- 3.6 本章总结 169
- 第4章 Solr分词 170
- 4.1 分词的基本概念 170
- 4.1.1 理解Analyzer 170
- 4.1.2 理解Tokenizer 171
- 4.1.3 理解TokenFilter 172
- 4.2 Solr分词器 172
- 4.2.1 Analyzer 173
- 4.2.2 Tokenizer 174
- 4.2.3 TokenFilter 182
- 4.2.4 CharFilter 202
- 4.2.5 Solr自定义分词 206
- 4.3 中文分词器 217
- 4.3.1 IK分词器 217
- 4.3.2 Ansj分词器 223
- 4.3.3 MMSeg4J分词器 233
- 4.3.4 Paoding分词器 240
- 4.3.5 Jcseg分词器 245
- 4.3.6 Ictclas分词器 258
- 4.3.7 FudanNLP 259
- 4.3.8 HanLP 262
- 4.3.9 Jieba分词器 266
- 4.3.10 分词器使用建议 268
- 4.4 本章总结 270
- 第5章 Solr查询 271
- 5.1 Solr查询概述 271
- 5.2 Solr查询相关度简述 273
- 5.3 Solr的查询语法解析器 275
- 5.4 Lucene的基本查询语法 283
- 5.5 Solr的标准查询语法解析器 287
- 5.6 Solr DisMax 288
- 5.7 Solr eDisMax 291
- 5.8 Solr的其他查询语法解析器 298
- 5.9 Query VS Filter Query 305
- 5.9.1 fq VS q 306
- 5.9.2 Filter Query缓存 307
- 5.9.3 Filter Query执行顺序 308
- 5.9.4 Post Filter 308
- 5.10 Solr返回结果 309
- 5.10.1 设置响应输出格式 309
- 5.10.2 选择返回域 310
- 5.10.3 分页查询 312
- 5.11 Solr排序 313
- 5.11.1 根据域进行排序 313
- 5.11.2 缺失值处理 314
- 5.11.3 排序的内存占用 315
- 5.12 调试查询结果 315
- 5.12.1 返回调试信息 315
- 5.12.2 开启调试模式 316
- 5.13 本章总结 316
- 第6章 Solr Facet 317
- 6.1 理解Facet 317
- 6.2 Facet简单示例 319
- 6.3 Query Facet 326
- 6.4 Range Facet 328
- 6.5 FacetFilter 330
- 6.6 Multiselect Faceting 335
- 6.6.1 key 335
- 6.6.2 tag 336
- 6.7 本章总结 339
- 第7章 Solr高亮 340
- 7.1 什么是Solr高亮 340
- 7.2 Solr高亮的工作原理 342
- 7.2.1 Fragmenter 348
- 7.2.2 Scorer 349
- 7.2.3 Encoder & Formatter 349
- 7.3 Facet & Highlighting 350
- 7.4 高亮多值域 351
- 7.5 高亮参数 352
- 7.6 FastVectorHighlighter 355
- 7.7 PostingsHighlighter 356
- 7.8 本章总结 358
- 第8章 Solr Query Suggestion查询建议 360
- 8.1 Spell-Check 361
- 8.1.1 Spell-Check简单示例 361
- 8.1.2 Spell-Check查询组件 362
- 8.2 Autosuggest 366
- 8.3 基于N-Gram实现Autosuggest 369
- 8.4 基于用户行为实现Autosuggest 371
- 8.5 本章总结 375
- 第9章 Solr Group分组 376
- 9.1 Result grouping VS Field collapsing 377
- 9.2 按照指定域分组 377
- 9.3 每个分组返回多个文档 381
- 9.4 按照Function动态计算值分组 382
- 9.5 按照任意Query分组 383
- 9.6 Group的分页与排序 383
- 9.7 Group& Facet 384
- 9.8 Group分布式查询 387
- 9.9 Group缓存 388
- 9.10 使用Collapsing Query Parser实现高效的Field Collapsing 388
- 9.11 Solr Group VS SQL Group by 389
- 9.12 本章总结 390
- 第10章 Solr企业级应用 391
- 10.1 Solr源码编译与补丁应用 391
- 10.2 部署Solr 396
- 10.2.1 构建你自己的Solr发布版本 397
- 10.2.2 Embedded Solr 397
- 10.3 Solr硬件要求与系统配置 397
- 10.3.1 内存和SSD 397
- 10.3.2 JVM配置 398
- 10.3.3 思考Solr索引与查询性能 401
- 10.4 Solr数据批量导入 405
- 10.5 Solr Shard与Replication 406
- 10.5.1 Shard 406
- 10.5.2 Replicate 408
- 10.6 Core管理 410
- 10.7 Solr集群管理 412
- 10.7.1 Solr Ping健康检测 412
- 10.7.2 Solr配置文件管理 413
- 10.8 如何与Solr交互 414
- 10.8.1 使用REST API与Solr交互 415
- 10.8.2 使用SolrJ与Solr进行交互 415
- 10.9 监控你的Solr 418
- 10.9.1 Solr的性能统计 418
- 10.9.2 Solr的缓存性能 419
- 10.9.3 Solr JMX 419
- 10.9.4 Solr日志 424
- 10.9.5 Solr负载测试 424
- 10.10 Solr版本升级 428
- 10.11 本章总结 428