摘要: requests库解析时 r.encoding='utf-8' 阅读全文
posted @ 2017-12-02 22:37 不可叽叽歪歪 阅读(93) 评论(0) 推荐(0) 编辑
摘要: string1 = '\xa1\xa1\xb0\xe9' #GBK下显示为“ 伴” string2 = '\xb0\xa1\xa1\xe9' #GBK下显示为“啊¢” print string1.decode('GBK').replace(u'\u3000', u'') #输出“伴” print s 阅读全文
posted @ 2017-12-02 22:36 不可叽叽歪歪 阅读(7413) 评论(1) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup from urllib.parse import urljoin class tieba(): def request(self,url): headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit... 阅读全文
posted @ 2017-11-27 16:58 不可叽叽歪歪 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-11-26 23:07 不可叽叽歪歪 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 整理后做成脑图 阅读全文
posted @ 2017-11-26 14:57 不可叽叽歪歪 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 《深入浅出数据分析》 最后整理成脑图形式 阅读全文
posted @ 2017-11-26 12:06 不可叽叽歪歪 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 微信大数据分析工具:新媒体指数:http://www.gsdata.cn 数据可视化工具: 词频分析工具: 舆情分析工具: 互联网趋势分析工具: 在线调查工具: 网站分析监测工具: 社交媒体监测工具: 其他数据网站: 阅读全文
posted @ 2017-11-25 13:07 不可叽叽歪歪 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-11-22 16:42 不可叽叽歪歪 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 爬取相关职位和对应的公司 阅读全文
posted @ 2017-11-21 20:08 不可叽叽歪歪 阅读(395) 评论(0) 推荐(0) 编辑
摘要: #Queue(队列对象)(堆) 阅读全文
posted @ 2017-11-21 16:59 不可叽叽歪歪 阅读(243) 评论(0) 推荐(0) 编辑