win10 elasticsearch安装IK中文分词器

win10 elasticsearch安装IK中文分词器

大家好,又见面了,我是全栈君。

IK压缩包下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.7.0

需要下载对应的版本

win10 elasticsearch安装IK中文分词器

我的es:6.2.1 , 所以 分词器版本

使用IK分词器可以实现对中文分词的效果。
下载IK分词器:(Github地址:https://github.com/medcl/elasticsearch-analysis-ik
下载zip:解压,并将解压的文件拷贝到ES安装目录的plugins下的ik目录下

win10 elasticsearch安装IK中文分词器

 https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.2.1 

ctrl+C 退出es,再次重新执行 elasticsearch.bat ,可以看到已加载插件

win10 elasticsearch安装IK中文分词器

 

补充:

下载完成之后,上传到服务器,然后解压到elasticsearch的plugins文件夹下,然后重命名为analysis-ik

也可以先在别处解压之后,然后重命名,以下代码,每个人可能不一样,根据自己实际的来

mv elasticsearch-analysis-ik-6.6.2 elasticsearch-6.6.0/plugins/analysis-ik

在这里要注意层级,以下这个IKAnalyzer.cfg.xml文件和plugins文件夹的层级是这样的

/plugins/analysis-ik/config/IKAnalyzer.cfg.xml

然后关闭elasticsearch

[root@localhost config]# ps -ef|grep elast
elas+  49202      1  1 18:10 pts/1    00:00:23 /usr/web/java/jdk1.8/bin/java -Xms256m -Xmx256m -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly -Des.networkaddress.cache.ttl=60 -Des.networkaddress.cache.negative.ttl=10 -XX:+AlwaysPreTouch -Xss1m -Djava.awt.headless=true -Dfile.encoding=UTF-8 -Djna.nosys=true -XX:-OmitStackTraceInFastThrow -Dio.netty.noUnsafe=true -Dio.netty.noKeySetOptimization=true -Dio.netty.recycler.maxCapacityPerThread=0 -Dlog4j.shutdownHookEnabled=false -Dlog4j2.disable.jmx=true -Djava.io.tmpdir=/tmp/elasticsearch-628240789535257481 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=data -XX:ErrorFile=logs/hs_err_pid%p.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -Xloggc:logs/gc.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=32 -XX:GCLogFileSize=64m -Des.path.home=/usr/web/elasticsearch/elasticsearch-6.6.0 -Des.path.conf=/usr/web/elasticsearch/elasticsearch-6.6.0/config -Des.distribution.flavor=default -Des.distribution.type=tar -cp /usr/web/elasticsearch/elasticsearch-6.6.0/lib/* org.elasticsearch.bootstrap.Elasticsearch -d
hoi+  49216  49202  0 18:10 pts/1    00:00:00 /usr/web/elasticsearch/elasticsearch-6.6.0/modules/x-pack-ml/platform/linux-x86_64/bin/controller
root      49738   3679  0 18:37 pts/0    00:00:00 grep --color=auto elast

然后杀掉进程

kill 49202

然后切换到普通账号(使用root账号启动会失败)重新启动,进入elasticsearch文件目录的bin文件夹下

./elasticsearch

 或者后台启动

nohup ./elasticsearch &

如果出现以下报错

org.elasticsearch.bootstrap.StartupException: java.lang.IllegalArgumentException: Plugin [analysis-ik] was built for Elasticsearch version 6.5.0 but version 6.6.0 is running

问题原因

elasticsearch版本和 ik分词器版本不一致。
由于我用的elasticsearch时最新版本 6.6.0,而ik分词器master编译出来的是6.5.0

解决办法

进入插件目录的分词文件夹下 analysis-ik/ ,修改 plugin-descriptor.properties 文件中的

win10 elasticsearch安装IK中文分词器

   改为你的elasticsearch版本号,我的是6.6.0

win10 elasticsearch安装IK中文分词器

然后保存退出  使用非root用户重启

win10 elasticsearch安装IK中文分词器

IK提供了两个分词算法ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细粒度划分

参考:https://www.cnblogs.com/pxblog/p/12633189.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111474.html原文链接:https://javaforall.net

(0)
上一篇 2022年2月20日 上午6:00
下一篇 2022年2月20日 上午6:00


相关推荐

  • AI的提示词专栏:Prompt 编写的日志分析与关键字聚类

    AI的提示词专栏:Prompt 编写的日志分析与关键字聚类

    2026年3月13日
    4
  • 语音信号处理入门系列(1)—— 语音信号处理概念「建议收藏」

    语音信号处理入门系列(1)—— 语音信号处理概念「建议收藏」文章目录1.语音交互2.复杂的声学环境2.1声学回声消除2.2解混响2.3语音分离2.4波束形成2.5噪声抑制2.6幅度控制2.7前端信号处理的技术路线3.参考4.推荐开源项目原博客地址:https://www.cnblogs.com/LXP-Never/p/13620804.html1.语音交互你知道苹果手机有几个麦克风吗?语音交互(VUI)是指人与人/设备通过自然语音进行信息传递的过程。语音交互的优势:输入效率高。语音输入的速度是传统键盘输入方式的3倍以上。例如:语

    2022年5月18日
    60
  • MySQL concat函数的使用

    MySQL concat函数的使用MySQLconcat函数是MySQL数据库中众多的函数之一,下文将对MySQLconcat函数的语法和使用进行说明,供您参考和学习。MySQLconcat函数使用方法:CONCAT(str1,str2,…) 返回结果为连接参数产生的字符串。如有任何一个参数为NULL,则返回值为NULL。注意:如果所有参数均为非二进制字符串,则结果为非二进制字符串。 

    2022年6月6日
    88
  • 静态数据成员和静态成员函数

    静态数据成员和静态成员函数转载自 https blog csdn net computer liuyun article details c 中的 static 静态数据成员和静态成员函数应该是让大家比较头疼的东西 好像也是找工作公司面试中常常问到的东西 我自己也深有体会 在学习 c 的过程中 总感觉 static 很烦人 但是又是一个必须懂的东西 所以今天就对静态数据成员和静态成员函数坐下小结哈 一

    2025年12月2日
    6
  • sklearn KFold()

    最近实践过程中遇到需要KFold()记录一下,以便日后查阅KFold()在sklearn中属于model_slection模块fromsklearn.model_selectionimportKFoldKFold(n_splits=’warn’,shuffle=False,random_state=None)参数:n_splits表示划分为几块(至少是2)shuffle…

    2022年4月5日
    96
  • C语言字节对齐

    C语言字节对齐文章最后本人做了一幅图 一看就明白了 这个问题网上讲的不少 但是都没有把问题说透 一 概念 对齐跟数据在内存中的位置有关 如果一个变量的内存地址正好位于它长度的整数倍 他就被称做自然对齐 比如在 32 位 cpu 下 假设一个整型变量的地址为 0x00000004 那它就是

    2026年3月20日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号