socketref,再见!高德

https://github.com/adoggie

  C++博客 :: 首页 :: 联系 :: 聚合  :: 管理
  246 Posts :: 4 Stories :: 312 Comments :: 0 Trackbacks

常用链接

留言簿(54)

我参与的团队

搜索

  •  

最新评论

阅读排行榜

评论排行榜


上海交通违章查询网站: http://www.shjtaq.com/Server1/dzjc_new.asp
验证码图片获取地址: http://www.shjtaq.com/Server1/validatecode.asp?m=2304.046

服务器通过页面请求的session-id来区分之后提交的验证码。 第一次请求查询页面时,服务器将访问session(cookie)传到客户端,之后的查询和验证码获取时客户端携带之前的cookie传送到服务器,服务器端保存着当前 session-id与验证码 的对应关系。 

查询返回记录可通过 xpath或者 beautifulsoup进行解析

程序使用python完成,也是个简单的小爬虫,scrapy 之类的没必要使用了,gevent完成异步通信。

交通网的验证码生成还是比较简单,做自动识别可找几个简单的图形识别程序即可。
如若不行,则人工输入喽
posted on 2014-10-08 00:45 放屁阿狗 阅读(1307) 评论(0)  编辑 收藏 引用

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理