随笔 - 79  文章 - 58  trackbacks - 0
<2024年4月>
31123456
78910111213
14151617181920
21222324252627
2829301234
567891011

常用链接

留言簿(9)

随笔分类

随笔档案

文章档案

相册

搜索

  •  

积分与排名

  • 积分 - 291982
  • 排名 - 87

最新评论

阅读排行榜

评论排行榜

     摘要:   阅读全文
posted @ 2008-04-22 23:33 merlinfang 阅读(653) | 评论 (1)编辑 收藏

       当我们看网页的时候,常常看见大量和我们所关心内容无关的导航条、广告信息、版权信息以及调查问卷等。有时候,我们可能从中得到一些意外的惊喜;但大多数时候都是非常讨厌。
       飞行广告可以说是其中的佼佼者,但已经有插件可以让它不显示了。但更多更多的无关广告,特别是那种点进去还中毒的广告,是不是也该开发个插件让它们不要出现在我们面前了。

        最近看搜索引擎,搜索引擎分析网页的时候也需要这样处理,称之为网页净化。

        不过不知道加了这种插件之后,那网站还能不能接到广告哈。。。

 

posted @ 2008-03-09 22:52 merlinfang 阅读(1249) | 评论 (0)编辑 收藏
     摘要:   阅读全文
posted @ 2008-03-05 23:10 merlinfang 阅读(736) | 评论 (0)编辑 收藏

最新研究搜索引擎了,做点笔记。

搜索引擎一般分为三个模块: 网页搜集、预处理和查询服务。

网页搜集是事先搜集的,在查询的时候再去搜集明显不可能了。而事先搜集又分为定期搜集和增量搜集。定期搜集是个全量的搜集过程,往往更新一次需要很长的时间,基本也不时新了,但是实现无疑要简单点;增量搜集除第一次是全量的外,后续做的就是更新了(包括新增网页,删除过期的,以及更新),实现上要复杂的多。现实上这两种也是相辅相成的,如新闻的搜索要及时更新,但某些学术网站就很少更新了。

网页搜集要解决的问题:
(1)各种类型的网页(html、asp、javascript),各种语种(ascii, utf-8)

(2)网络资源的多样化(文件,图片,文档,音频,视频 etc.)
(3)搜索策略(深度优先,广度优先)
(4)并发搜集(避免对同一站点同一时刻的大量访问,不然就变成Dos攻击了)

(5)避免重复搜集
          记录未访问、已访问URL和网页内容摘要信息

          域名与IP的对应问题 
(6)判断网页的重要程度

         1) 网页的入度大,表明被其他网页引用的次数多;
         2) 某网页的父网页入度大;
         3) 网页的镜像度高,说明网页内容比较热门,从而显得重要;
         4) 网页的目录深度小,易于用户浏览到。

posted @ 2008-03-04 21:52 merlinfang 阅读(592) | 评论 (2)编辑 收藏

好可怜啊,我差一点,就是没过. 上午倒是50多分,下午考差2分,论文才考了40分.
总结一下,下午按道理肯定能过的,也不知道是打字打多了,写字手都在发抖,
很多字想不出来怎么写,瀑布汗~~~~~,全还给小学语文老师了.

不过论文没过也很正常,完全跟不上时代,还好是4选1,只能选迭代开发吹吹牛,
心里本来就没觉得迭代开发有多么好,硬着写了那3千字,一年的字还学那次写的
多.

 

要被GF耻笑了,5555,没事吹牛必过干吗........

 

 

posted @ 2008-01-30 20:27 merlinfang 阅读(288) | 评论 (0)编辑 收藏

    记得hibernate刚有点火的时候,04年吧,公司也希望能做C++版,愿望是美好,可惜最终是失败的,作为最后一个接手的人,心中是不尽的失落啊。

    现在在另外一个项目组,看到的是4,500张表结构,基本上每张表都写了个管理类,来封装一些方法吧。看着感觉是很幼稚啊,感觉象在填充代码而已,光这些都能折腾几W行。才觉得当年的持久层如果还在的话是一件多么美好的事情。

   总结最终失败的原因不外乎两点:
(1)性能太差,既然用了C++肯定就喜欢获得好的性能;
(2)面向对象不深入人心,就试点项目而言,别人能画ER图,但却不能画类图去设计,说是说OQL的方式符合人的思考习惯,但SQL多少年了习惯的人更多。

  面向对象的数据库已经提出好些年,但理论还是不如关系数据库成熟啊。礼拜天晚上发发牢骚,偶尔想起,缅怀一下我那失败可怜的项目。

 

 

posted @ 2008-01-27 21:49 merlinfang 阅读(1855) | 评论 (4)编辑 收藏
     摘要:   阅读全文
posted @ 2007-11-17 20:51 merlinfang 阅读(330) | 评论 (0)编辑 收藏

   最近上班真的是一点事情也没有,下班回到家也一样,发现人太闲了也很难受,于是就有了写个加密软件的冲动,主要想做成winrar的样子,但突出加密和可编辑,没有压缩功能。准备剩下的三个月完成第一个版本的开发,好兴奋,一定要完成。。。
   今天完成了0.01版,真是粗糙啊,有兴趣的同僚们破解下看看。。

/Files/merlinfang/encrypt_0.01.rar

  

   加密后成为了"*.era"文件,但原文件目前没有删除,怕破坏了大家的文件。

=================================================

一个新的版本,使用AES加密的了.
/Files/merlinfang/encrypt_0.02.rar
不过离真正完成还差很远.

界面上的差距:
修改密码功能
完成进度条
界面根据实际情况灰化
规划程序目录

 

posted @ 2007-08-13 22:35 merlinfang 阅读(1709) | 评论 (6)编辑 收藏
     摘要:   阅读全文
posted @ 2007-07-20 21:28 merlinfang 阅读(3901) | 评论 (2)编辑 收藏
     摘要:   阅读全文
posted @ 2007-07-16 20:46 merlinfang 阅读(2268) | 评论 (0)编辑 收藏
仅列出标题
共8页: 1 2 3 4 5 6 7 8