2020 年 12月 15 日随笔档案 - 止一

2020年12月15日

摘要：目标：爬取网站上的书名和简介以下为代码： import requests # 调用requests库 from bs4 import BeautifulSoup # 调用BeautifulSoup库 res = requests.get('https://localprod.pandateache 阅读全文

posted @ 2020-12-15 23:22 止一阅读(239) 评论(0) 推荐(0) 编辑

09.编程理解无偏性与相合性

摘要：编程理解无偏性与相合性无偏性 1 from statistics import mean 2 from statistics import variance 3 import random 4 import matplotlib.pyplot as plt 5 6 7 def variance_b 阅读全文

posted @ 2020-12-15 23:10 止一阅读(311) 评论(0) 推荐(0) 编辑

在类方法中引用另一个另一个类方法

摘要： # 创建一个人事系统类class hrSystem:# 创建存储员工名字的变量 namename = ''# 创建存储员工工资的变量 salarysalary = 0# 创建存储员工绩效的变量 kpi kpi = 0# 定义录入员工信息的类方法 @classmethod def record(cls 阅读全文

posted @ 2020-12-15 23:00 止一阅读(1197) 评论(0) 推荐(0) 编辑

Python 爬虫使用动态切换ip防止封杀

摘要：对于爬虫被封禁！爬虫一般来说只要你的ip够多，是不容易被封的。一些中小网站要封杀你，他的技术成本也是很高的，因为大多数网站没有vps，他们用的是虚拟空间或者是sae，bae这样的paas云。其实就算他们不考虑seo搜索优化，用ajax渲染网页数据，我也可以用webkit浏览器组件来搞定aja 阅读全文

posted @ 2020-12-15 22:53 止一阅读(1456) 评论(0) 推荐(0) 编辑

Python3网络爬虫-- 使用代理，轮换使用各种IP访问

摘要： # proxy_list 代理列表 run_times = 100000 for i in range(run_times): for item in proxy_list: proxies = { 'http': item, 'https': item, } print(proxies) try: 阅读全文

posted @ 2020-12-15 22:47 止一阅读(263) 评论(0) 推荐(0) 编辑

正则表达式不包含某个字符串写法

摘要：因在程序中需要做城市间跳转，但是页面中包含的css、scripts和图片等路径是要排除在外的。这就需要在正则中指定当遇到哪些字符时需要略过。正则如下： /((?!css)(?!scripts)(?!images)[a-zA-Z]+)/ 指定当路径中包含 css scripts 和 images 阅读全文

posted @ 2020-12-15 22:42 止一阅读(6369) 评论(0) 推荐(0) 编辑

正则表达式匹配不包含某些字符串的技巧

摘要：经常我们会遇到想找出不包含某个字符串的文本，程序员最容易想到的是在正则表达式里使用，^(hede)来过滤”hede”字串，但这种写法是错误的。我们可以这样写：[^hede]，但这样的正则表达式完全是另外一个意思，它的意思是字符串里不能包含‘h'，‘e'，‘d'三个但字符。那什么样的正则表达式能过滤出阅读全文

posted @ 2020-12-15 22:39 止一阅读(7349) 评论(0) 推荐(0) 编辑

08.参数估计_点估计

摘要：如何估计总体的均值？通过抽样得到样本均值，但显然一个样本不足以消除偶然性，所以需要多次抽样，多次样本可以得到多个样本均值，这些样本均值的期望，就可以代表总体均值。如何估计总体的方差？多次抽样得到多个样本，每个样本计算一次方差，可以得到多个方差，注意：计算每一个样本的方差时要除的是n-1 阅读全文

posted @ 2020-12-15 22:30 止一阅读(149) 评论(0) 推荐(0) 编辑

07.编程理解中心极限定理

摘要：在适当的条件下，相互独立的随机变量之和经适当标准化后，其分布近似于正态分布；不要求变量本身服从正态分布。代码： 1 import random 2 import matplotlib.pyplot as plt 3 from statistics import mean 4 5 6 def sam 阅读全文

posted @ 2020-12-15 22:19 止一阅读(175) 评论(0) 推荐(0) 编辑

06.样本及抽样分布

摘要：阅读全文

posted @ 2020-12-15 22:00 止一阅读(159) 评论(0) 推荐(0) 编辑