上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: 1 words2=re.sub("[\s+\.\!\/_,$%^*(+\"\'\n]+|[+——;!,”。《》,。:“?、~@#¥%……&*()1234567①②③④)]+", "", words) 阅读全文
posted @ 2017-12-06 14:55 不可叽叽歪歪 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 文件不能同名(import re re.py) 阅读全文
posted @ 2017-12-06 14:43 不可叽叽歪歪 阅读(512) 评论(0) 推荐(0) 编辑
摘要: 1 from selenium import webdriver 2 browser=webdriver.Chrome() 3 import time 4 from lxml import etree 5 import requests 6 import re 7 import json 8 import random 9 10 def search(): 11 br... 阅读全文
posted @ 2017-12-05 23:05 不可叽叽歪歪 阅读(221) 评论(0) 推荐(0) 编辑
摘要: https://github.com/lzjun567/crawler_html2pdf/blob/master/zhihu/auto_login.py 阅读全文
posted @ 2017-12-04 23:23 不可叽叽歪歪 阅读(1001) 评论(0) 推荐(0) 编辑
摘要: https://github.com/xchaoinfo/fuck-login/blob/master/001%20zhihu/zhihu.py 阅读全文
posted @ 2017-12-04 23:06 不可叽叽歪歪 阅读(569) 评论(0) 推荐(0) 编辑
摘要: https://github.com/qiyeboy/IPProxyPool 阅读全文
posted @ 2017-12-04 23:06 不可叽叽歪歪 阅读(74) 评论(0) 推荐(0) 编辑
摘要: pip install chardet 阅读全文
posted @ 2017-12-04 21:15 不可叽叽歪歪 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 'url1'+str(page)+'url2' url{ofssset} url.formate(20) 阅读全文
posted @ 2017-12-04 19:08 不可叽叽歪歪 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 1:存入本地(返回二进制,r.content,'wb') 阅读全文
posted @ 2017-12-04 19:05 不可叽叽歪歪 阅读(67) 评论(0) 推荐(0) 编辑
摘要: requests.Session() _xsrf 阅读全文
posted @ 2017-12-04 19:04 不可叽叽歪歪 阅读(91) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页