会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
不可叽叽歪歪
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
下一页
2017年12月2日
网页编码问题
摘要: requests库解析时 r.encoding='utf-8'
阅读全文
posted @ 2017-12-02 22:37 不可叽叽歪歪
阅读(93)
评论(0)
推荐(0)
编辑
去除\u3000
摘要: string1 = '\xa1\xa1\xb0\xe9' #GBK下显示为“ 伴” string2 = '\xb0\xa1\xa1\xe9' #GBK下显示为“啊¢” print string1.decode('GBK').replace(u'\u3000', u'') #输出“伴” print s
阅读全文
posted @ 2017-12-02 22:36 不可叽叽歪歪
阅读(7413)
评论(1)
推荐(0)
编辑
2017年11月27日
demo
摘要: import requests from bs4 import BeautifulSoup from urllib.parse import urljoin class tieba(): def request(self,url): headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit...
阅读全文
posted @ 2017-11-27 16:58 不可叽叽歪歪
阅读(135)
评论(0)
推荐(0)
编辑
2017年11月26日
网站分析工具
摘要:
阅读全文
posted @ 2017-11-26 23:07 不可叽叽歪歪
阅读(81)
评论(0)
推荐(0)
编辑
谁说菜鸟不会数据分析(入门篇)
摘要: 整理后做成脑图
阅读全文
posted @ 2017-11-26 14:57 不可叽叽歪歪
阅读(166)
评论(0)
推荐(0)
编辑
《深入浅出数据分析》
摘要: 《深入浅出数据分析》 最后整理成脑图形式
阅读全文
posted @ 2017-11-26 12:06 不可叽叽歪歪
阅读(114)
评论(0)
推荐(0)
编辑
2017年11月25日
数据分析工具大全
摘要: 微信大数据分析工具:新媒体指数:http://www.gsdata.cn 数据可视化工具: 词频分析工具: 舆情分析工具: 互联网趋势分析工具: 在线调查工具: 网站分析监测工具: 社交媒体监测工具: 其他数据网站:
阅读全文
posted @ 2017-11-25 13:07 不可叽叽歪歪
阅读(269)
评论(0)
推荐(0)
编辑
2017年11月22日
selenium简单入门
摘要:
阅读全文
posted @ 2017-11-22 16:42 不可叽叽歪歪
阅读(126)
评论(0)
推荐(0)
编辑
2017年11月21日
实习僧招聘网站信息采集
摘要: 爬取相关职位和对应的公司
阅读全文
posted @ 2017-11-21 20:08 不可叽叽歪歪
阅读(395)
评论(0)
推荐(0)
编辑
多线程(大量密集的I/O处理);多进程(大量密集并行计算);Scrapy(异步,协程)
摘要: #Queue(队列对象)(堆)
阅读全文
posted @ 2017-11-21 16:59 不可叽叽歪歪
阅读(243)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
8
9
10
下一页
公告