有声有色工作,有滋有味生活,有情有义做人
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2015年1月21日

摘要: 背景在Python去写爬虫,网页解析等过程中,比如:如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站常常需要涉及到HTML等网页的解析。当然,对于简单的HTML中内容的提取,Python内置的正则表达式Re模块,就足够用了,但是对于复杂的HTML的处理,尤其是一些非法的,... 阅读全文

posted @ 2015-01-21 14:50 小采采 阅读(1804) 评论(0) 推荐(0) 编辑