Django_haystack全文搜索
2022/6/19 23:20:40
本文主要是介绍Django_haystack全文搜索,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
haystack是全文搜索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎,点击查看官方网站。
whoosh是用纯Python编写的全文搜索引擎,虽然性能比不上sphinx、xapian、Elasticsearc等,但是无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用,点击查看whoosh文档。
jieba是一款免费的中文分词包,如果觉得不好用可以使用一些收费产品。
一、全文搜索配置
1)在环境中安装依赖包
pip install django-haystack pip install whoosh pip install jieba
2)在项目配置文件settings.py中注册应用
INSTALLED_APPS = ( ... 'haystack', )
3)在项目配置文件settings.py中指定搜索引擎
# haystack全文搜索配置 HAYSTACK_CONNECTIONS = { 'default': { # 使用whoosh引擎 'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine', # 索引文件存储路径 'PATH': os.path.join(BASE_DIR, 'whoosh_index'), } } # 当添加、修改、删除数据时,自动生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 修改haystack 默认返回数据量。默认20 HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1
4)在项目的urls.py中添加路由
path('search/', include('haystack.urls'))
5)在haystack中使用jieba分词包
修改haystack源码包目录下的 ./backends/whoosh_backend.py文件
from jieba.analyse import ChineseAnalyzer #将StemmingAnalyzer()替换为 ChineseAnalyzer() schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer()), field_boost=field_class.boost, sortable=True)
二、生成索引文件
1)在需要进行全文搜索的模型类同目录下,新建一个search_indexes.py文件(注:文件名称不能自定义),在其中定义
from haystack import indexes # 导入需要创建索引的模型类 from apps.goods.models import GoodsSKU class GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable): # 索引字段 use_template=True指定根据表中的哪些字段建立索引文件的说明放在一个文件中 text = indexes.CharField(document=True, use_template=True) def get_model(self): # 返回创建索引模型类 return GoodsSKU # 建立索引的数据 def index_queryset(self, using=None): return self.get_model().objects.all()
2)在templates下面新建目录search/indexes/goods,其中search/indexes/为固定名称,goods为创建索引模型类对应的应用名称。
并在目录下新建一个文件goodssku_text.txt,goodssku为模型类小写,后面部分为固定名称。
3)在goodssku_text.txt文件中指定索引字段
# 指定索引的字段 {{ object.name }} # object为固定值,可以看成是模型类的实例 {{ object.desc }} {{ object.goods.detail }}
4)使用命令生成索引文件
python manage.py rebuild_index
索引文件存储在settings中配置的目录下,即whoosh_index
三、使用全文搜索
这篇关于Django_haystack全文搜索的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-15SendGrid 的 Go 客户端库怎么实现同时向多个邮箱发送邮件?-icode9专业技术文章分享
- 2024-11-15SendGrid 的 Go 客户端库怎么设置header 和 标签tag 呢?-icode9专业技术文章分享
- 2024-11-12Cargo deny安装指路
- 2024-11-02MongoDB项目实战:从入门到初级应用
- 2024-11-01随时随地一键转录,Google Cloud 新模型 Chirp 2 让语音识别更上一层楼
- 2024-10-25Google Cloud动手实验详解:如何在Cloud Run上开发无服务器应用
- 2024-10-24AI ?先驱齐聚 BAAI 2024,发布大规模语言、多模态、具身、生物计算以及 FlagOpen 2.0 等 AI 模型创新成果。
- 2024-10-20goland工具下,如修改一个项目的标准库SDK的版本-icode9专业技术文章分享
- 2024-10-17Go学习:初学者的简单教程
- 2024-10-17Go学习:新手入门完全指南