摘要: 通过Resquest或urllib2抓取下来的网页后,一般有三种方式进行数据提取:正则表达式、beautifulsoup和lxml,留下点学习心得,后面慢慢看。 1. 正则表达式 参考文档: 正则表达式30分钟入门教程 python3 re模块 看完文档后理解正则表达式的基本概念就行,然后知道贪婪匹 阅读全文
posted @ 2018-12-23 16:17 silence_cho 阅读(1151) 评论(0) 推荐(0) 编辑