摘要: 目标:爬取网站上的书名和简介 以下为代码: import requests # 调用requests库 from bs4 import BeautifulSoup # 调用BeautifulSoup库 res = requests.get('https://localprod.pandateache 阅读全文
posted @ 2020-12-15 23:22 止一 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 编程理解无偏性与相合性 无偏性 1 from statistics import mean 2 from statistics import variance 3 import random 4 import matplotlib.pyplot as plt 5 6 7 def variance_b 阅读全文
posted @ 2020-12-15 23:10 止一 阅读(295) 评论(0) 推荐(0) 编辑
摘要: # 创建一个人事系统类class hrSystem:# 创建存储员工名字的变量 namename = ''# 创建存储员工工资的变量 salarysalary = 0# 创建存储员工绩效的变量 kpi kpi = 0# 定义录入员工信息的类方法 @classmethod def record(cls 阅读全文
posted @ 2020-12-15 23:00 止一 阅读(1187) 评论(0) 推荐(0) 编辑
摘要: 对于爬虫被封禁 ! 爬虫一般来说只要你的ip够多,是不容易被封的。 一些中小网站要封杀你,他的技术成本也是很高的,因为大多数网站没有vps,他们用的是虚拟空间或者是sae,bae这样的paas云。 其实就算他们不考虑seo搜索优化,用ajax渲染网页数据,我也可以用webkit浏览器组件来搞定aja 阅读全文
posted @ 2020-12-15 22:53 止一 阅读(1448) 评论(0) 推荐(0) 编辑
摘要: # proxy_list 代理列表 run_times = 100000 for i in range(run_times): for item in proxy_list: proxies = { 'http': item, 'https': item, } print(proxies) try: 阅读全文
posted @ 2020-12-15 22:47 止一 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 因在程序中需要做城市间跳转,但是页面中包含的css、scripts和图片等路径是要排除在外的。这就需要在正则中指定当遇到哪些 字符时需要略过。 正则如下: /((?!css)(?!scripts)(?!images)[a-zA-Z]+)/ 指定当路径中包含 css scripts 和 images 阅读全文
posted @ 2020-12-15 22:42 止一 阅读(6317) 评论(0) 推荐(0) 编辑
摘要: 经常我们会遇到想找出不包含某个字符串的文本,程序员最容易想到的是在正则表达式里使用,^(hede)来过滤”hede”字串,但这种写法是错误的。我们可以这样写:[^hede],但这样的正则表达式完全是另外一个意思,它的意思是字符串里不能包含‘h',‘e',‘d'三个但字符。那什么样的正则表达式能过滤出 阅读全文
posted @ 2020-12-15 22:39 止一 阅读(6826) 评论(0) 推荐(0) 编辑
摘要: 如何估计总体的均值? 通过抽样得到样本均值,但显然一个样本不足以消除偶然性,所以需要多次抽样, 多次样本可以得到多个样本均值,这些样本均值 的 期望,就可以代表总体均值。 如何估计总体的方差? 多次抽样得到多个样本,每个样本计算一次方差,可以得到多个方差, 注意:计算每一个样本的方差时要除的是n-1 阅读全文
posted @ 2020-12-15 22:30 止一 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 在适当的条件下,相互独立的随机变量之和经适当标准化后,其分布近似于正态分布;不要求变量本身服从正态分布。 代码: 1 import random 2 import matplotlib.pyplot as plt 3 from statistics import mean 4 5 6 def sam 阅读全文
posted @ 2020-12-15 22:19 止一 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-12-15 22:00 止一 阅读(156) 评论(0) 推荐(0) 编辑