2018 年 12月 23 日随笔档案 - silence_cho

2018年12月23日

摘要：通过Resquest或urllib2抓取下来的网页后，一般有三种方式进行数据提取：正则表达式、beautifulsoup和lxml，留下点学习心得，后面慢慢看。 1. 正则表达式参考文档：正则表达式30分钟入门教程 python3 re模块看完文档后理解正则表达式的基本概念就行，然后知道贪婪匹阅读全文

posted @ 2018-12-23 16:17 silence_cho 阅读(1151) 评论(0) 推荐(0) 编辑

silence_cho

公告