java版jieba分词及解释
导入依赖
com.huaban
jieba-analysis
1.0.2
字典(可选)
词性
a 形容词 ad 副形词 an 名形词 e 叹词 i 成语 m 数词 n 名词 nr 人名 ns 地名 nt 机构团体 nz 其他专名 v 动词 q 量词 t 时间词 y 语气词 w 标点符号 p 介词 r 代词 c 连词 f 方位词
字典实例
短语 最大分词字数 词性
六合採 3 n
代码实现
// 获得词典路径对象 Path path = Paths.get(new File("路径")) ; //加载自定义的词典进词库 WordDictionary.getInstance().loadUserDict( path ) ; //jieba分词实例对象 JiebaSegmenter segmenter = new JiebaSegmenter(); //分词后置获得分词后的短语集合 List<String> list = segmenter.sentenceProcess("要分词的句子"); //获得短语及其所在位置索引对象手集合 List<SegToken> process = segmenter.process(text, JiebaSegmenter.SegMode.SEARCH); List<SegToken> process1 = segmenter.process(text, JiebaSegmenter.SegMode.INDEX);
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/202477.html原文链接:https://javaforall.net
