09 2007 档案
【Minidxer】Minidx的IFilter Com组件中的一个字符串处理函数
摘要: 声明:可任意转载,复制,修改,以及用于任何您所希望的目的而与作者无关。 来自:Minidx全文检索(http://minidx.com)
Minidx的IFilter Com组件中的一个字符串处理函数,过滤掉一些特殊字符,转为标准的ASCII字符.因为要处理包括欧洲以及阿拉伯等其他一些特殊字符,所以case比较多,请结合自己的需要选择性的修改使用,:)
阅读全文
posted @
2007-09-20 23:37 minidxer 阅读(660) |
评论 (0) 编辑
【Minidxer】分享--文本挖掘课程课件(研究生课程)
摘要: 北大研究生课程《文本挖掘技术》的全套课件,分享的目的旨在给与勤奋者更多的资源。不得用于任何以营利为目的的活动/方式
阅读全文
posted @
2007-09-19 23:42 minidxer 阅读(1012) |
评论 (10) 编辑
【Minidxer】分享一些论文以及参考书籍
摘要: 一些值得一看的论文,有的看一次需要30$,这里与大家分享,有需要的自己取吧……
・ Query Time Trade-offs in Dynamic Information Retrieval System
・ Hybrid index maintenance for growing text collections(非常好地在线索引论文)
・ 信息检索模型
・ 信息过滤
・ 搜索引擎技术
・ 双数组Trie树算法
……
以及其他参考书,共12篇
阅读全文
posted @
2007-09-15 15:20 minidxer 阅读(974) |
评论 (3) 编辑
【Minidxer】翻译了Swig Tutorial
摘要: 最近唐同学比较闲,所以让她翻译了SWIG的文档,贴上翻译成果,因为时间的关系没有仔细校对,发现错误之处还望能够指出……swig是一个非常优秀的作品/项目,希望这个小孩可以坚持翻译完其全部文档.:) 感谢一下唐菁睿同学,以资鼓励!
------翻译:唐菁睿 校对:丁志刚
※注:SWIG中文已转移至>>>
http://swig.minidx.com 阅读全文
posted @
2007-09-12 21:32 minidxer 阅读(1155) |
评论 (7) 编辑
不使用第三方变量交换x,y的几种方法
摘要: 不使用第三方变量,交换x,y的值,除了下面4种,是否还有?
申明:问题的本身地解决可能没什么意义,换个角度来思考解决问题的方式通常却会带给我们意外的收获/惊喜
阅读全文
posted @
2007-09-10 12:16 minidxer 阅读(864) |
评论 (11) 编辑
Minidx字典整理程序发布(包含源代码)
摘要: 几千条数据排序并去除重复纪录可以有很多排序算法直接内存中操作,但是假如说有几百万条记录需要处理……
阅读全文
posted @
2007-09-09 16:34 minidxer 阅读(847) |
评论 (1) 编辑
大牛们是否还记得这些补码运算公式
摘要: 还记得大学编译原理老师经常向我们灌输“位运算=高性能……”
阅读全文
posted @
2007-09-08 10:49 minidxer 阅读(1174) |
评论 (6) 编辑
超高速中日英分词的实现(10MB/S)
摘要: 重写了Minidx的分词模块,实现了超高速分词 (10MB/S)以及相当的准确率。当然其实还包括韩,法,德……等计算机上可以显示的语言,更多信息请到http://minidx.com
阅读全文
posted @
2007-09-07 00:25 minidxer 阅读(1421) |
评论 (17) 编辑
博客园支持顶级域名绑定,希望Cppblog也尽早实现
摘要: 不知道这篇放在首页是否合适,不合适的话还请管理员麻烦一下,移致非技术区,只是好消息迫切的想和大家分享,:)
阅读全文
posted @
2007-09-03 15:22 minidxer 阅读(762) |
评论 (9) 编辑
Minidx机能概要设计书(中文版)新鲜出炉~
摘要: (下载文件已修正) 来自:Minidx全文检索(http://minidx.com)
Minidx机能概要设计书中文版OK了。纯属产品概要设计/使用说明,没什么技术含量,顺便感谢唐菁睿同学一下
作者:丁志刚 翻译:唐菁睿 校对:丁志刚
阅读全文
posted @
2007-09-03 07:25 minidxer 阅读(882) |
评论 (5) 编辑