摘要: 在爬取网页时,由于会遇到登录问题而被阻止,此时通过改变头部信息来解决此问题 以爬取京东商品页面为例 1、 先登录京东账号 2、 摁F12进入调试页面,然后刷新页面,在Network栏中的第一行会出现一个document文件 3、 在那个文件上点右键,Copy→Copy as cURL(bash) 4 阅读全文
posted @ 2022-10-22 19:38 又一岁荣枯 阅读(489) 评论(0) 推荐(0) 编辑
摘要: import matplotlib.pyplot as plt import matplotlib as mpl # 解决中文乱码问题 #sans-serif就是无衬线字体,是一种通用字体族。 #常见的无衬线字体有 Trebuchet MS, Tahoma, Verdana, Arial, Helv 阅读全文
posted @ 2022-10-22 11:41 又一岁荣枯 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 在python里有一个非常烦人的问题就是给数组填充新值时,假如用append的方法,最终填充进数组的不是实际的值,而是类似于一个指针(比喻一下,和指针的差别还是很大的)如果原数组继续append数据,那么新数组也会跟着变化。就像下面这段程序: b = [] a = ['aaaaaaa'] b.app 阅读全文
posted @ 2022-10-22 09:55 又一岁荣枯 阅读(124) 评论(0) 推荐(0) 编辑
摘要: Python中有join()和os.path.join()两个函数, 具体作用如下: join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串 os.path.join(): 将多个路径组合后返回,语法: os.path.join(path1[,pat 阅读全文
posted @ 2022-10-22 09:42 又一岁荣枯 阅读(486) 评论(0) 推荐(0) 编辑