摘要: 以抓取网易图片的程序为例说明python的编码问题,主要涉及python中文乱码,unicode和str类型转换,python解释器处理编码方式等问题。 1 #coding:utf-8 2 import sys 3 reload(sys) 4 sys.setdefaultencoding('utf-8') 5 6 import re 7 import requests 8 import os 9 import urllib10 11 def down_pic(url):12 pic_html = requests.get(url)13 if pic_html.statu... 阅读全文
posted @ 2013-08-15 20:21 lkprof 阅读(715) 评论(0) 推荐(0) 编辑
摘要: 一个python抓取程序,用来抓取网易图片新闻中的一系列图片(抓取图片默认为大图)。 首先打开你想要抓取的系列图片的任一一个图片,获取链接。把链接赋值给pic_url,就会在当前目录下生成一个以图片主题命名的文件夹,文件夹下是这个系列的所有图片。 由于Windows下的文件目录路径使用反斜杠“\”来分隔,Python代码里面,反斜杠“\”是转义符,这里有几个处理windows目录的技巧: 1.使用斜杠“/”的路径: “c:/test.txt”… 不用反斜杠就没法产生歧义了 (本程序使用的方法) 2.将反斜杠符号转义: “c:\\test.txt”… 因为反斜杠是转义符,所以”\... 阅读全文
posted @ 2013-08-15 16:51 lkprof 阅读(847) 评论(0) 推荐(0) 编辑