PHP-elasticsearch/elasticsearch包分词功能实现及源码解析
2022/1/19 11:51:03
本文主要是介绍PHP-elasticsearch/elasticsearch包分词功能实现及源码解析,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
安装
直接使用 composer 安装 ES 包就可以了,这里使用官方的 elasticsearch/elasticsearch
这个包。
composer require elasticsearch/elasticsearch
安装好以后,创建一个客户端。hosts如果是多个节点的集群,那么可以配置一个二维数组。
$hosts = [ 'host' => '127.0.0.1', 'port' => '9200', 'scheme' => 'http', 'user' => '', 'pass' => '' ]; $client = ClientBuilder::create() //创建客户端 ->setHosts($hosts) //hosts连接地址 ->build();
如果想跳过ssl证书校验,可以添加一些curl的参数放进客户端
$curlParams = [//不校验ssl CURLOPT_SSL_VERIFYPEER => 0, CURLOPT_SSL_VERIFYHOST => 0, ]; $client = ClientBuilder::create() ->setConnectionParams(['client' => ['curl' => $curlParams]]) //设置curl参数 ->setHosts($hosts) ->build();
分词
简单的增删改查在 elasticsearch 的文档中有介绍了,就不说了,可以看(https://www.elastic.co/guide/cn/elasticsearch/php/current/_quickstart.html)[文档]。
分词的话隐藏的比较深,文档中没有介绍,他放在了indices
这个 namespace 下面。如果看源码,可以在Endpoints/Indices
目录下面发现 Analyze.php
文件,当然了,除了分词,这里面还有其他功能,可以自己看。
这个文件也很简单啊,只有几个函数,就是设置请求的API地址,参数这些。
使用起来是这样的,我们用上面创建好的客户端。
$parmas['index'] = 'test' //这个是分词的index,也可以不加,加了请求的API就是 $index/_analyze //请求体 这个就和你直接写DSL没区别了,参数啥的都一样,可以在 kibana里面试试参数 $parmas['body'] = [ 'text' => 'php开发', //要分词的文字 'analyzer' => 'ik_smart', //分词器,可以不写 ]; $client->indices()->analyze($params);
扩展
indices函数返回的就是 indices 文件夹的 namespace,对应文件在namespace/IndicesNamespace.php
,然后后面的函数就相当于文件名,她会拼接在 indices 后面,像我们上面请求的文件就是indices/Analyze.php
。具体的拼接就是在 namespace/IndicesNamespace.php
这个里面做的,有一个函数如下
/** * $params['index'] = (string) The name of the index to scope the operation * $params['body'] = (array) Define analyzer/tokenizer parameters and the text on which the analysis should be performed * * @param array $params Associative array of parameters * @return array * @see https://www.elastic.co/guide/en/elasticsearch/reference/master/indices-analyze.html */ public function analyze(array $params = []) { //获取$params['index'], $params['body'] $index = $this->extractArgument($params, 'index'); $body = $this->extractArgument($params, 'body'); //设置endpoints处理类 $endpointBuilder = $this->endpoints; //$endpoint 就相当于 indices/Analyze.php 这个文件了 $endpoint = $endpointBuilder('Indices\Analyze'); //设置参数,index, 请求体 $endpoint->setParams($params); $endpoint->setIndex($index); $endpoint->setBody($body); //发起请求 return $this->performRequest($endpoint); }
$this->endpoints 是一个函数,外面传进来的,函数内容如下
$this->endpoint = function ($class) use ($serializer) { //拼接处理类 $fullPath = '\\Elasticsearch\\Endpoints\\' . $class; //反射获取 $reflection = new ReflectionClass($fullPath); $constructor = $reflection->getConstructor(); //执行 if ($constructor && $constructor->getParameters()) { return new $fullPath($serializer); } else { return new $fullPath(); } };
这篇关于PHP-elasticsearch/elasticsearch包分词功能实现及源码解析的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-12-19php8的协程和hyperf的协程有什么区别?-icode9专业技术文章分享
- 2024-12-19php8 的fiber是什么?-icode9专业技术文章分享
- 2024-12-05怎么在php8,1 里面开启 debug?-icode9专业技术文章分享
- 2024-12-05怎么在php8,1 里面开启 debug?-icode9专业技术文章分享
- 2024-11-29使用PHP 将ETH账户的资产汇集到一个账户
- 2024-11-23怎么实现安卓+php 热更新方案?-icode9专业技术文章分享
- 2024-11-22PHP 中怎么实现判断多个值是否为空、null 或者为 false?-icode9专业技术文章分享
- 2024-11-11开源 PHP 商城项目 CRMEB 二次开发和部署教程
- 2024-11-09怎么使用php在kaufland平台刊登商品?-icode9专业技术文章分享
- 2024-11-05PHP的抽象类和接口是什么,有什么区别-icode9专业技术文章分享