摘要: 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 4 import re 5 import requests 6 #from bs4 import BeautifulSoup 7 #sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8') 8 XiC... 阅读全文
posted @ 2018-07-20 16:21 陌路不归 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 1 import io 2 import os 3 import re 4 import sys 5 import datetime 6 from bs4 import BeautifulSoup 7 from pxydowwload import request 8 from pymongo import MongoClient 9 10 sys.std... 阅读全文
posted @ 2018-07-20 16:19 陌路不归 阅读(2957) 评论(0) 推荐(0) 编辑
摘要: 1 import os 2 import io 3 import sys 4 import re 5 import urllib.request 6 7 sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='gb2312') 8 9 """ 10 headers = {'User-Agent': 'Mozill... 阅读全文
posted @ 2018-07-20 16:15 陌路不归 阅读(282) 评论(0) 推荐(0) 编辑
摘要: import os import io import sys import ssl import urllib.request #from importlib import reload # 第一个爬虫练习 """ url= "http://www.baidu.com" data = urllib.request.urlopen(url).read()# #data = data.decode... 阅读全文
posted @ 2018-07-20 16:13 陌路不归 阅读(109) 评论(0) 推荐(0) 编辑