【ElasticSearch搜索推荐】基于ngram分词机制实现index-time搜索推荐
2021/12/21 6:21:01
本文主要是介绍【ElasticSearch搜索推荐】基于ngram分词机制实现index-time搜索推荐,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
数据准备
使用edge ngram将每个单词都进行进一步的分词切分,用切分后的ngram来实现前缀搜索推荐功能
//创建索引 PUT my_index { "mappings": { "my_type": { "properties": { "title": { "type": "keyword" } } } } }
//指定ngram相关配置 PUT /my_index { "settings": { "analysis": { "filter": { "autocomplete_filter": { "type": "edge_ngram", //类型 "min_gram": 1, //最小1个字符 "max_gram": 50 //最大分50个字符 } }, "analyzer": { "autocomplete": { "type": "custom", "tokenizer": "standard", "filter": [ "lowercase", "autocomplete_filter" ] } } } } }
//创建数据 POST my_index/my_type { "title":"hello win" } POST my_index/my_type { "title":"hello world" } POST my_index/my_type { "title":"hello dog" }
//测试分词器 GET /my_index/_analyze { "analyzer": "autocomplete", "text": "quick brown" }
//为目标字段指定分词器 PUT /my_index/_mapping/my_type { "properties": { "title": { "type": "string", "analyzer": "autocomplete", "search_analyzer": "standard" } } }
//查询 GET my_index/my_type/_search { "query": { "match_phrase": { "title": "hello win" } } }
注意:
搜索原理:
h
he
hel
hello w
hello --> hello,doc1
w --> w,doc1
搜索的时候,不用再根据一个前缀,然后扫描整个倒排索引了; 简单的拿前缀去倒排索引中匹配即可,如果匹配上了,那么就好了; match,全文检索
这篇关于【ElasticSearch搜索推荐】基于ngram分词机制实现index-time搜索推荐的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-01lip-sync公司指南:一文读懂主要玩家和技术
- 2024-11-01Anthropic的新RAG方法——提升大型语言模型在特定领域的表现
- 2024-11-01UniApp 中组件的生命周期是多少-icode9专业技术文章分享
- 2024-11-01如何使用Svg Sprite Icon简化网页图标管理
- 2024-10-31Excel数据导出课程:新手从入门到精通的实用教程
- 2024-10-31Excel数据导入课程:新手入门指南
- 2024-10-31RBAC的权限课程:新手入门教程
- 2024-10-31Svg Sprite Icon课程:新手入门必备指南
- 2024-10-31怎么配置 L2TP 允许多用户连接-icode9专业技术文章分享
- 2024-10-31怎么在FreeBSD上 安装 OpenResty-icode9专业技术文章分享