2021年7月28日

爬取豆瓣TOP250电影

摘要: 自己跟着视频学习的第一个爬虫小程序,里面有许多不太清楚的地方,不如怎么找到具体的电影名字的,那么多级关系,怎么以下就找到的是那个div呢? 诸如此类的,有许多,不过先做起来再说吧,后续再取去弄懂。 import requests import bs4 import re def open_url(u 阅读全文

posted @ 2021-07-28 15:57 lmqljt 阅读(93) 评论(0) 推荐(0) 编辑

浏览器代理user-agent

摘要: 两种方法: 法1:浏览器地址栏输入:about://version,然后复制用户代理; 如果法1不行,法2肯定可以。 法2:打开任意浏览器,输入任意网址,下面以火狐和百度网址为例来进行说明; 打开火狐浏览器,输入www.baidu.com 如果输入网址并点击了F12后,刷新快捷键除了F5外,还可以用 阅读全文

posted @ 2021-07-28 15:11 lmqljt 阅读(493) 评论(0) 推荐(0) 编辑

2021年7月27日

浏览器代理爬虫问题

摘要: 以上参考:https://blog.csdn.net/weixin_43902320/article/details/104342771 以下是自己的第一个爬虫小程序,虽然简单,但也值得记录下来: import requests import bs4 headers={'User-Agent':'M 阅读全文

posted @ 2021-07-27 21:52 lmqljt 阅读(58) 评论(0) 推荐(0) 编辑

python集合

摘要: ii=set(12,3,5,6,9,9,8,8) print(ii) 输出: Traceback (most recent call last): File "<input>", line 1, in <module> TypeError: set expected at most 1 argume 阅读全文

posted @ 2021-07-27 18:51 lmqljt 阅读(47) 评论(0) 推荐(0) 编辑

python字典

摘要: 此处的in,not in 注意,在序列中使用时查找的时值,而不是建;此处字典中查找的是键,而不是值。 另外清空字典最好用clear(); 如果a是一个子弹,b=a,则当你用a={}时,只是生成了一个空的字典,并把a标识指向了它的地址;但是b还指向a字典原来指向的地址。 并没有真正的清空原来地址里的内 阅读全文

posted @ 2021-07-27 18:23 lmqljt 阅读(28) 评论(0) 推荐(0) 编辑

可变长参数(元组,字典),关键字参数

摘要: 可变长参数 以下一个参考:https://www.cnblogs.com/QLeelulu/archive/2009/09/09/1563148.html 上述参考:https://www.jb51.net/article/169959.htm 以下参考:https://www.jianshu.co 阅读全文

posted @ 2021-07-27 12:30 lmqljt 阅读(127) 评论(0) 推荐(0) 编辑

Python列表推导式,字典推导式,元组推导式

摘要: 参考:https://blog.csdn.net/A_Tu_daddy/article/details/105051821 my_list = [ [[1, 2, 3], [4, 5, 6]] ] flat = [x for sub1 in my_list for sub2 in sub1 for 阅读全文

posted @ 2021-07-27 11:59 lmqljt 阅读(463) 评论(0) 推荐(0) 编辑

2021年7月26日

Python3 filter()函数和map()函数

摘要: filter(function or None,iterable) 函数用于过滤序列,过滤掉不符合条件的元素,返回一个迭代器对象,如果要转换为列表,可以使用 list() 来转换。 该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,然后返回 True 或 Fals 阅读全文

posted @ 2021-07-26 14:07 lmqljt 阅读(99) 评论(0) 推荐(0) 编辑

reduce()函数

摘要: 在Python 3里,reduce()函数已经被从全局名字空间里移除了,它现在被放置在fucntools模块里用的话要 先引入from functools import reduce functools.reduce(function, iterable[, initializer]) functo 阅读全文

posted @ 2021-07-26 13:30 lmqljt 阅读(320) 评论(0) 推荐(0) 编辑

python @staticmethod

摘要: 阅读全文

posted @ 2021-07-26 12:40 lmqljt 阅读(42) 评论(0) 推荐(0) 编辑

导航