jieba分词,自定义词库分词 java语言

全栈程序员-站长 • 2026年3月18日下午4:24 • 未分类 • 阅读 1

jieba分词,自定义词库分词 java语言其实这是一个解决 JAVA 端使用 Jeba 分词的方式 Jeba 相较于其他产品的优势是双向匹配分词 GITHUB 地址 https github com huaban jieba analysis 第一步引用 Maven lt Jeba 分词器几年没更新了 GitHub gt lt dependency gt lt groupId gt com huaban lt gro

其实这是一个解决JAVA端使用Jeba分词的方式。Jeba相较于其他产品的优势是双向匹配分词

GITHUB地址：https://github.com/huaban/jieba-analysis

第一步引用Maven

 
   
   
   
     com.huaban 
    
   
     jieba-analysis 
    
   
     1.0.2

第二步自定义词词典：

创建的文件结构以及文件名称：dicts/jieba.dict

自定义的词典请放到：resource/dicts/jieba.dict

自定义词词库的内容

塑料 3 n 塑料管件 3 n 塑料管 3 n 管件 3 n

第三步调用：

public void contextLoadsJeba() { String text = "塑料管件" ; System.out.println( "Jeba 分词 -------------" ); JiebaSegmenter segmenter = new JiebaSegmenter(); System.out.println(segmenter.process( text , JiebaSegmenter.SegMode.INDEX).toString()); System.out.println("加载自定义词库的信息，开始做自定义词库的分词------->>>>>>>>"); // 词典路径为Resource/dicts/jieba.dict Path path = Paths.get(new File( getClass().getClassLoader().getResource("dicts/jieba.dict").getPath() ).getAbsolutePath() ) ; //加载自定义的词典进词库 WordDictionary.getInstance().loadUserDict( path ) ; //重新分词 segmenter = new JiebaSegmenter(); System.out.println(segmenter.process( text , JiebaSegmenter.SegMode.INDEX).toString()); }

搞定

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/214378.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

PHP Excel表格导出图片方法,PHPExcel导出图片到单元格

上一篇 2026年3月18日下午4:24

【ceph】ceph osd启动及peering过程中osdmap相关加载和更新流程

下一篇 2026年3月18日下午4:25

SpringBoot面试题及答案整理

SpringBoot面试题及答案整理什么是SpringBootSpringBoot建立spring框架之上,使用spring启动，帮我们避免了大量的配置。因此，SpringBoot可以帮助我们以最少的工作量，更加健壮地使用现有的Spring功能。SpringBoot有哪些优点？1、减少开发，测试时间和努力。2、使用JavaConfig有助于避免使用XML。3、避免大量的Maven导入和各种版本冲突。4、提供意见发展方法。5、通过提供默认值快速开始开发。6、没有单独的Web服

全栈程序员-站长
2022年5月11日
52
【运筹学】整数规划、分支定界法总结 ( 整数规划 | 分支定界法 | 整数规划问题 | 松弛问题 | 分支定界法 | 分支定界法概念 | 分支定界法步骤 ) ★★

【运筹学】整数规划、分支定界法总结 ( 整数规划 | 分支定界法 | 整数规划问题 | 松弛问题 | 分支定界法 | 分支定界法概念 | 分支定界法步骤 ) ★★一、整数规划、1、整数规划概念、2、整数规划分类、二、整数规划示例、三、整数规划解决的核心问题、四、整数规划问题解的特征、五、整数规划问题与松弛问题示例、六、分支定界法、1、整数规划概念、2、分支定界法求解整数规划步骤、3、分支定界理论分析、七、分支过程示例、八、分支定界法求整数规划示例、1、分支定界法求整数规划示例、2、求整数规划的松弛问题及最优解、3、第一次分支操作、4、第二次分支操作、5、第三次分支操作、6、整数规划最优解

全栈程序员-站长
2022年7月12日
18
linux搭建php运行环境_docker部署php项目

linux搭建php运行环境_docker部署php项目方案一、phpStudyforLinuxphpStudyforLinux支持Apache/Nginx/Tengine/Lighttpd，支持php5.2/5.3/5.4/5.5切换已经在centos-6.5,debian-7.4.,ubuntu-13.10测试成功使用说明：服务进程管理：phpstudy(start|stop|restart|uninstall)

全栈程序员-站长
2025年12月9日
4
Tomcat配置ssl协议及遇到的问题https页面无法访问

Tomcat配置ssl协议及遇到的问题https页面无法访问

全栈程序员-站长
2021年5月30日
253
poj2586 Y2K Accounting Bug（贪心）

poj2586 Y2K Accounting Bug（贪心）

全栈程序员-站长
2021年11月29日
36
shell检查语法模式

shell检查语法模式方法sh-ntest.sh直接上例子

全栈程序员-站长
2022年7月16日
18

发表回复

关注全栈程序员社区公众号