金庆的专栏

  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  423 随笔 :: 0 文章 :: 454 评论 :: 0 Trackbacks

2008年3月13日 #

     摘要: 原来的代码是参考“Recipe 12.11. Using MSHTML to Parse XML or HTML”,利用htmlfile提取文本。将当前目录下的所有html文件转换为text文件。jigloo经过对10W+个html文件的测试,得出结论,htmlfile的容错比InternetExplorer.Application要差很多。  阅读全文
posted @ 2008-03-13 11:55 金庆 阅读(1770) | 评论 (1)编辑 收藏