win10 elasticsearch安装IK中文分词器

win10 elasticsearch安装IK中文分词器

大家好,又见面了,我是全栈君。

IK压缩包下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.7.0

需要下载对应的版本

win10 elasticsearch安装IK中文分词器

我的es:6.2.1 , 所以 分词器版本

使用IK分词器可以实现对中文分词的效果。
下载IK分词器:(Github地址:https://github.com/medcl/elasticsearch-analysis-ik
下载zip:解压,并将解压的文件拷贝到ES安装目录的plugins下的ik目录下

win10 elasticsearch安装IK中文分词器

 https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.2.1 

ctrl+C 退出es,再次重新执行 elasticsearch.bat ,可以看到已加载插件

win10 elasticsearch安装IK中文分词器

 

补充:

下载完成之后,上传到服务器,然后解压到elasticsearch的plugins文件夹下,然后重命名为analysis-ik

也可以先在别处解压之后,然后重命名,以下代码,每个人可能不一样,根据自己实际的来

mv elasticsearch-analysis-ik-6.6.2 elasticsearch-6.6.0/plugins/analysis-ik

在这里要注意层级,以下这个IKAnalyzer.cfg.xml文件和plugins文件夹的层级是这样的

/plugins/analysis-ik/config/IKAnalyzer.cfg.xml

然后关闭elasticsearch

[root@localhost config]# ps -ef|grep elast
elas+  49202      1  1 18:10 pts/1    00:00:23 /usr/web/java/jdk1.8/bin/java -Xms256m -Xmx256m -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly -Des.networkaddress.cache.ttl=60 -Des.networkaddress.cache.negative.ttl=10 -XX:+AlwaysPreTouch -Xss1m -Djava.awt.headless=true -Dfile.encoding=UTF-8 -Djna.nosys=true -XX:-OmitStackTraceInFastThrow -Dio.netty.noUnsafe=true -Dio.netty.noKeySetOptimization=true -Dio.netty.recycler.maxCapacityPerThread=0 -Dlog4j.shutdownHookEnabled=false -Dlog4j2.disable.jmx=true -Djava.io.tmpdir=/tmp/elasticsearch-628240789535257481 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=data -XX:ErrorFile=logs/hs_err_pid%p.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -Xloggc:logs/gc.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=32 -XX:GCLogFileSize=64m -Des.path.home=/usr/web/elasticsearch/elasticsearch-6.6.0 -Des.path.conf=/usr/web/elasticsearch/elasticsearch-6.6.0/config -Des.distribution.flavor=default -Des.distribution.type=tar -cp /usr/web/elasticsearch/elasticsearch-6.6.0/lib/* org.elasticsearch.bootstrap.Elasticsearch -d
hoi+  49216  49202  0 18:10 pts/1    00:00:00 /usr/web/elasticsearch/elasticsearch-6.6.0/modules/x-pack-ml/platform/linux-x86_64/bin/controller
root      49738   3679  0 18:37 pts/0    00:00:00 grep --color=auto elast

然后杀掉进程

kill 49202

然后切换到普通账号(使用root账号启动会失败)重新启动,进入elasticsearch文件目录的bin文件夹下

./elasticsearch

 或者后台启动

nohup ./elasticsearch &

如果出现以下报错

org.elasticsearch.bootstrap.StartupException: java.lang.IllegalArgumentException: Plugin [analysis-ik] was built for Elasticsearch version 6.5.0 but version 6.6.0 is running

问题原因

elasticsearch版本和 ik分词器版本不一致。
由于我用的elasticsearch时最新版本 6.6.0,而ik分词器master编译出来的是6.5.0

解决办法

进入插件目录的分词文件夹下 analysis-ik/ ,修改 plugin-descriptor.properties 文件中的

win10 elasticsearch安装IK中文分词器

   改为你的elasticsearch版本号,我的是6.6.0

win10 elasticsearch安装IK中文分词器

然后保存退出  使用非root用户重启

win10 elasticsearch安装IK中文分词器

IK提供了两个分词算法ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细粒度划分

参考:https://www.cnblogs.com/pxblog/p/12633189.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111474.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • double 转BigDecimal 丢失精度问题解决

    double 转BigDecimal 丢失精度问题解决错误方式BigDecimalbigDecimal=newBigDecimal(0.11D);logger.info(“bigDecimal====”+bigDecimal);//bigDecimal0.11000000000000000055511151231257827021181583404541015625正确方式:BigDecimalbigDecimal1=bigDecimal.valueOf(0.11D);logger.info(“bigDecimal1″+bigDeci

    2022年6月1日
    39
  • 锐捷交换机开启poe_锐捷交换机status灯绿灯闪烁

    锐捷交换机开启poe_锐捷交换机status灯绿灯闪烁Ruijie#conft//进入配置模式Enterconfigurationcommands,oneperline.EndwithCNTL/Z.Ruijie(config)#vlan800//配置网管VLAN,此VLANID固定为800Ruijie(config-vlan)#nameManager-Vlan//配置网管VLAN名称Ruijie(config-vlan)#v…

    2025年11月10日
    3
  • Python面试的一些心得,与Python练习题分享

    Python面试的一些心得,与Python练习题分享关于基础项目打算招聘一个自动化运维 主要需求是 python Linux 与 shell 脚本能力 但面试几天发现一些问题 简历虚假这个不管哪行 简历含水量大都是普遍存在的 看简历犀利的一比 一面是能力弱的一腿 谁都希望自己 80 分的能力写成 120 但有时候假的有些离谱 问一两个问题就漏气了 年龄与薪酬目前的 IT 行业 最敢坐地起薪的就是 27 33 这年龄段的 低于范围的往往因为能

    2026年2月4日
    0
  • 【分享】外链建设方法大全【转载】

    【分享】外链建设方法大全【转载】外链是影响网站排名的最重要因素之一 也是我们 SEO 工作者常谈的话题 最近也有很多朋友不断的问我外链是怎么做的 所以打算做个总结 结果在论坛上看到有朋友总结的很不错 所以转过来给大家分享 一般 SEO 的操作流程就是先确定网站关键词 然后架设网站 接着就是添加内容 这些做好之后就是外链的建设了 而且很多时候外链会直接影响到最终排名 下面来说说我做外链的一些方式途径 一 利用免费博

    2025年11月23日
    5
  • SM2246EN+闪迪15131

    SM2246EN+闪迪15131由于正常的SM2246EN开卡工具不会有闪迪15131的数据,所以我们要先进行一点骚操作A773=SanDisk,1Tbit(16K),15131SanDisk,1Tbit(16K),15131=45,3C,A5,93,7E,D0,2,08,10,0,4036,4096,2,9,5,256,4,16,1280,3,180,8F,27,30,2,5F,21,29,1,2,1,52,51,0,A2,0,1,0,0,C0,99,99,99,99,12,26,99,99,77,77,77,77,0,0,..

    2022年6月11日
    71
  • CLoin 2021激活码破解方法[通俗易懂]

    CLoin 2021激活码破解方法,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月15日
    61

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号