twzheng's cppblog

『站在风口浪尖紧握住鼠标旋转!』 http://www.cnblogs.com/twzheng

  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  136 随笔 :: 78 文章 :: 353 评论 :: 0 Trackbacks
[源] http://news.csdn.net/n/20070410/102662.html


CSDN记者廖俊才4月9日报道】近日,“谷歌拼音输入法涉嫌抄袭搜狗输入法词库”事件闹得沸沸扬扬,搜狐公司继48正式发表关于Google盗用词库的声明之后,今日下午又召开新闻发布会,向记者和著名博客展示谷歌抄袭搜狗词库的关键证据。

 搜狐公司CTO王小川首先表示已经向律师咨询过,搜狗输入法的词库不是简单的中文词汇的集合,而是对“拼音串的注解”的汇编,是花费很长的人工编辑时间不断遴选和复杂的机器算法不断改进才诞生的智力劳动的结晶,在法律上肯定是受著作权保护的。王还在现场发问:金山词霸的词库不受保护吗?基于此搜狐公司已经给谷歌发去了律师函,但谷歌并没有对此做出正式回应。


随后王现场使用一个输入法指标测评工具进行模拟演示,最后得出结论:在谷歌输入法的第一版即
1.0.15.0版中,整个词库与搜狗词库重合率居然高达%96。王表示,如果两种中文输入法词库重合率达到40%其实也是正常现象,因为中文常用词汇本身就这么多,重合是在所难免的,但高达96%却无论如何不能以巧合来解释,更何况网上已经流行的“彩蛋”问题和“冯巩”问题。

 在召开这次新闻发布会之前,谷歌已经发表了一篇致歉声明,表示谷歌输入法词库已经全面升级,绝大多数取自谷歌自己的搜索引擎。很多技术人员也在网上表示很敬佩谷歌工程师的技术水平,但针对此点王特别强调,谷歌输入法的确现在已经更新了两次,但对其最新版本1.0.17.0版使用专业工具测评发现:尽管词库重合率已经从96%降到了还是很厉害的79%,但用户打字输入的体验度却大大下降,首词命中率明显下降,平均翻页次数显著增加。王表示:“一个好词库是一个好用的输入法的核心基础,而一个好词库绝不可能是两个实习工程师花两三个月时间每天只用所谓的20%的业余时间就能完成的。而现在经过“改良”后的最新版本的谷歌输入法与搜狗输入法相比,差距自然是明显的。

 也有普通网友疑惑:为什么谷歌能这么轻易的盗取搜狗的词库呢?为什么搜狗这么看重自己的词库?针对这点王特别说明,搜狗输入法的词库是凝聚了搜狐众多开发工程师,测试工程师,中文编辑长达十几个月的心血,但是破解一个就算是已经加过密的词库却只需要一个高级软件工程师一天的工作,两相对比,原因显而易见。因为输入法本身是已经下载到了客户端的,词库随之加载到了本地机器,破解就不是非常难的技术工作。

 在随后的记者提问中,第一个记者说他现在上网发现上午11:24谷歌在其官方博客上发表文章,承认盗用搜狗词库,再次向用户,搜狐及各方表示歉意。但搜狐公关人员表示希望对方尽快对律师函作出直接回应。

 接着有记者问道,律师函里面有哪些要求?搜狐会进一步采取什么措施?刘表示律师函里要求谷歌立即停止下载和运营谷歌输入法软件以及相关的宣传工作,同时还要求赔偿。至于进一步采取什么措施将视对方的回应而定。

至于双方最终会以什么样的方式结束这场输入法事件,我们将会作进一步的后续报道。

posted on 2007-04-13 01:00 谭文政 阅读(145) 评论(0)  编辑 收藏 引用 所属分类: 技术·业界

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理