09 2018 档案

摘要:写爬虫的时候老是遇到,昨天还把编码问题列入日程。今天看到前辈们都有总结,就拿来主义了。谢谢。 Chown-Jane-Y 《浅析Python3中的bytes和str类型》 skyflask 《彻底搞清楚python字符编码》 John_ABC 《Python-字符编码详解》 编码 1 Byte(Byt 阅读全文
posted @ 2018-09-04 01:26 hyeTi 阅读(118) 评论(0) 推荐(0) 编辑
摘要:参照cuiqingcai大佬的教程把代码改了下,记录一下待以后回头看看当初开始学爬的样子。 代码不健壮/完善,遇到的问题先记下,逐个再深入学习理解。 真的是头铁。获取的图片地址都是列表,没法保存,搜了一圈没找到方法,又不肯重新看教程,耗了大半天时间。这下好了,先曲线解决心态不炸了才能继续看教程。MM 阅读全文
posted @ 2018-09-03 03:50 hyeTi 阅读(294) 评论(0) 推荐(0) 编辑
摘要:cuiqingcai大佬《Python3 网络爬虫开发实战》整理 贪婪与非贪婪 原本打算取出12345678,但 运行结果:8 贪婪匹配模式:.* 会匹配尽可能多的字符。 .*后(\d+)至少匹配一个数字,未指定具体数字。因此,.*尽可能匹配多的字符,把1234567匹配,给\d+留下一个仅满足条件 阅读全文
posted @ 2018-09-02 16:03 hyeTi 阅读(137) 评论(0) 推荐(0) 编辑