摘要:
选取了站长之家作为目标站点 右键检查看到的标签 实际爬取下来的网页源代码 按照这个解析规则,一般就能正确的解析出来需要的内容了。 阅读全文
摘要:
网页抓包 通过观察,改变start后面数字,会出现不同的数据,第一页是0,第二页是60,依次递增,pagesize则是每一页出现多少条,最好不要改变 将网页中的内容粘贴到在线json解析中,可以看到,这是一个标准的json数据,通过在线解析可以看到清晰的结构 获取到的数据是一个json格式的字符串, 阅读全文
摘要:
# requests是第三方库,需要安装 pip install requests import requests # 在日常的爬虫中,封ip也是一个很常用的反爬虫手段,遇到这种情况,我们只需要在每次请求的时候为每个请求指定一个ip地址即可 url = 'http://www.baidu.com' # 这里指定ip,当然这只是个示范, # 获取代理ip有这几个途径: # 付费代理:花钱买代理ip... 阅读全文
摘要:
# requests是第三方库,需要安装 pip install requests import requests import random # 通常很多网站都会设置检测请求头中的User-Agent,所以在编写爬虫代码时一般都会加上user-agent url = 'http://www.zhihu.com' # 如果同一个user-agent请求次数过多,可能也可能被检测出来,所以我们可... 阅读全文
摘要:
经过对前端技术的学习,感触良多,虽然之前也接触过前端的知识,但是没有进行系统的学习过,在大三上学期学过h5和简单的css,老师也没有深度讲解,知识也没有形成体系,经过一段时间的学习,有以下感触与大家分享: 整个前端知识就像一座房子,而Html是砖,建一个网页,里面有很多砖(html里面最重要的就是标 阅读全文
摘要:
要使用一个模块,首先要把模块导入进来 我们先把这一篇文章需要用的模块导入进来 首先说一下time模块,time模块中的函数 --sleep:休眠指定的秒数(可以是小数) --time:获取时间戳 --localtime:将时间戳转换为对象 mktime:根据年月日等信息转换为时间戳 gmtime:功 阅读全文
摘要:
冒泡排序和选择排序 首先引用一下百度百科对于冒泡算法的定义: 冒泡排序算法的原理如下: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。 对每一对相邻元素做同样的工作,从开始第一对到结尾的最后一对。在这一点,最后的元素应该会是最大的数。 针对所有的元素重复以上的步骤,除了最后一个。 持续每次对 阅读全文
摘要:
python中有两种数据类型:一种是可变数据类型,一种是不可变数据类型 不可变数据类型包括(整型及其他数据类型,字符串及元组) 可变数据类型(列表,集合,字典,类和类实例) 鉴定是否为拷贝还是只是引用计数加1,我们可以用python的内置函数(id())来验证. 程序运行结果表明s和s1的内存地址是 阅读全文
摘要:
给定一组(串)数据,根据输入得号码,查询归属地 如有错误,感谢指正! 阅读全文
摘要:
运行结果: 阅读全文