【实例简介】
结巴分词,很不错的分词工具,python写的,亲身试用,不管英文还是中文分得很准!
【实例截图】
【核心代码】
jieba-0.32
└── jieba-0.32
├── jieba
│ ├── analyse
│ │ ├── analyzer.py
│ │ ├── idf.txt
│ │ └── __init__.py
│ ├── dict.txt
│ ├── finalseg
│ │ ├── __init__.py
│ │ ├── prob_emit.p
│ │ ├── prob_emit.py
│ │ ├── prob_start.p
│ │ ├── prob_start.py
│ │ ├── prob_trans.p
│ │ └── prob_trans.py
│ ├── __init__.py
│ └── posseg
│ ├── char_state_tab.p
│ ├── char_state_tab.py
│ ├── __init__.py
│ ├── prob_emit.p
│ ├── prob_emit.py
│ ├── prob_start.p
│ ├── prob_start.py
│ ├── prob_trans.p
│ ├── prob_trans.py
│ └── viterbi.py
├── PKG-INFO
├── setup.py
└── test
├── test_bug.py
├── test_change_dictpath.py
├── test_cutall.py
├── test_cut_for_search.py
├── test_file.py
├── test_multithread.py
├── test_no_hmm.py
├── test_pos_file.py
├── test_pos_no_hmm.py
├── test_pos.py
├── test.py
├── test_tokenize_no_hmm.py
├── test_tokenize.py
├── test_userdict.py
├── test_whoosh_flie.py
├── test_whoosh_flie_read.py
└── test_whoosh.py
6 directories, 41 files
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/219790.html原文链接:https://javaforall.net
