魔众集成ElasticSearch,只为更好的搜索

2020-05-25 13:03:01   

Elasticsearch(简称ES) 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎。

使用ElasticSearch可以做什么

通过 Lucene 的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在 18 和 30 之间,性别为女性这样的组合查询。作为一个准实时的搜索引擎,基于Lucene构建,它的主要强项还是在全文检索方面,具有以下特点。

全文检索的概念

首先介绍全文检索的概念,就是对一篇文章进行索引,可以根据关键字搜索,类似于mysql里的like语句。 全文索引就是把内容根据词的意义进行分词,然后分别创建索引,例如“魔众系统提供高标准交付服务” 可能会被分词成:“魔众“,”系统“,“提供“,“高标准”,“交付服务”等token,这样当搜索“魔众” 或者 “高标准” 都会把这句搜出来。

内置分词器

ElasticSearch实现全文索引,首先要确定分词器,ElasticSearch默认有很多分词器,具体设置可以参考ElasticSearch的官方文档。

魔众系统如何集成ElasticSearch

目前魔众系统在题库系统率先支持ElasticSearch的配置,后续在全文搜索的地方会陆续支持。

魔众,只为更好的技术。

QQ
微信
公众号
客服