请选择 进入手机版 | 继续访问电脑版

2020-12-30

[复制链接]
茂忠想你 发表于 2020-12-31 20:24:31 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
ElasticSearch中IK分词器的使用

Ik分词器可以按照你想要的需求来拆分词组。本博客先容了IK分词器的安装即简单使用。
一。下载安装。
扫码复兴: 1002 。下载Ik的压缩包。 如果要elasticsearch和kibana的压缩包,请复兴1001

如果还没安装elastic search和kibana的,请先观看:Elasticsearch的下载安装教程(包括Kibana)
下载完成之后。 打开elasticsearch的文件目次,打开plugins,新建一个文件夹,定名为ik,将你下载的压缩包解压到ik文件夹里。(完成之后移除你的压缩包)

重启elasticsearch, 你就会发现在加载过程中,ik分词器已经加载成功了。

二。运行测试
打开kibana,在欣赏器输入 127.0.1:5601

注意:在ik分词器中提供了两种分词算法
ik_smart: 最少切分
ik_max_word: 最细粒度分别

最少切分:

最细粒度:

text中的值你自己可以随便测试一下(好玩吧,会玩吧,没玩过吧。)
重点来了!重点来了!重点来了!重点来了!重点来了!
三。自界说分词组合。
有的时候,这两种算法拆分的词语你照旧不满足,并没有按照你的要求来拆分,怎么办呢?很好办的。
就以上面那个“对每个人都不公平”, 这个词语为例子。我想要 “都不公平” 这四个字组合在一起。(上面的拆分是没有的)
解决办法:
1.进入ik的目次,打开config。

2.新建一个文件, 注意是文件。名字自界说,但是后缀必须是.dic末端的。体现辞书。

3.打开my.dic。输入你想组合的词语。比如说 我想把 “都不公平” 这四个字组合在一起。 保存。

4.打开IKAnalyzer.cfg.xml文件。把你刚刚写的my.dic字典引用进去。然后重启elastic search。运行测试。


重启elasticsearch,重新测试一下。


这就是我们在搜索引擎上搜索一些东西。他会自动拆分你搜索的内容并以赤色字体高亮显示的原因了!

来源:https://blog.csdn.net/weixin_46295656/article/details/111998849
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题

专注素材教程免费分享
全国免费热线电话

18768367769

周一至周日9:00-23:00

反馈建议

27428564@qq.com 在线QQ咨询

扫描二维码关注我们

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.( 蜀ICP备2021001884号-1 )