Minidx原先采用的是单字分词,效率方面比较低,所以重写了Minidx的分词模块,实现了超高速分词以及相当的准确率效果,随后发布这一机能实现的相关论文(暂且这么称呼……)。不知大家是否有需要,这一分词模块开发包(C++实现),更多信息请到
http://minidx.com英文因为还没有对单词作处理,所以出来结果比较奇怪,中文和日文应该准确率还是挺高的。先来几张图片Show一下

中文分词



日文分词

英文分词
posted on 2007-09-07 00:25
minidxer 阅读(1421)
评论(17) 编辑 收藏 引用 所属分类:
Minidx全文检索相关