随笔分类 - 编程语言/Python
摘要:当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息。 模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容。 实现微博登录的方法有很多,一般我们在模拟登录时首选WAP版。 因为PC版网页源码中包括很多的js代码,提交的内容也更多,不适合机器模拟登录
阅读全文
摘要:socket socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。 socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。 socket就是该
阅读全文

随笔分类 (749)
- ACM/Basis(110)
- ACM/CF(27)
- ACM/HDU(14)
- ACM/KMP(14)
- ACM/LC(55)
- ACM/Math(57)
- ACM/SGU(13)
- ACM/STL(12)
- ACM/博弈论(3)
- ACM/动态规划(27)
- ACM/概率论(23)
- ACM/计算几何(7)
- ACM/模拟(19)
- ACM/区间树(11)
- ACM/数据结构(69)
- ACM/数论(59)
- ACM/搜索(55)
- ACM/图论(22)
- ACM/文本处理(39)
- ACM/心路历程(2)
- ACM/自动机(11)
- Cache(3)
- Git笔记(6)
- Linux/服务器篇(3)
- Linux/基础篇(20)
- 编程语言/C++(10)
- 编程语言/Java(22)
- 编程语言/Python(2)
- 操作系统(2)
- 机器学习(7)
- 爬虫(3)
- 数据库(8)
- 网络(10)
- 文本处理(2)
- 阅读杂记(2)
随笔档案 (461)
- 2017年5月(2)
- 2017年4月(2)
- 2017年3月(5)
- 2016年12月(3)
- 2016年10月(4)
- 2016年9月(3)
- 2016年8月(5)
- 2016年7月(7)
- 2016年6月(11)
- 2016年5月(11)
- 2016年4月(5)
- 2016年3月(48)
- 2016年2月(16)
- 2016年1月(21)
- 2015年12月(25)
- 2015年11月(3)
- 2015年10月(16)
- 2015年9月(5)
- 2015年8月(24)
- 2015年7月(35)
- 2015年6月(2)
- 2015年5月(23)
- 2015年4月(8)
- 2015年3月(10)
- 2014年12月(1)
- 2014年11月(5)
- 2014年10月(12)
- 2014年9月(33)
- 2014年8月(21)
- 2014年7月(7)
- 2014年6月(6)
- 2014年5月(57)
- 2014年4月(13)
- 2014年3月(12)