MMSeg一个基于最大匹配算法的两种变体的中文单词识别系统。是中文分词中一个常见的、基于词典的分词算法(作者主页:HTTP://chtsai.org/index_tw.HTML),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较快。
MMSeg 算法有两种分词方法:Simple和CompLex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。
发布于 2016-06-25 14:01:40 | 141 次阅读