03 2022 档案
摘要:无法运行以及调用模块 pip 命令 : 我们每次在用到的时候才会取安装模块。所以每一个模块的位置是不一样的。pip会通过下面的安装包把所有的模块串联起来,当我们在用模块的时候,都能用得到,当我们的安装包受损时,就无法调用其他模块。 解决方法:根据报错把其他位置完整的安装包覆盖掉受损的安装包。 这样我
阅读全文
摘要:get 请求 #安装requests pip install requestsimport requests #第一步:导入模块requestsqurey = input("输入你想知道的内容:") #改进第六步:给我们想知道的内容赋一个变量url = f'https://www.sogou.com
阅读全文
摘要:# #什么是代理:通过 第三方 发送请求网页#import requests## #117.157.197.18 3128##结构:proxies:把代理的地址端口放进去(下面为示例:固定搭配)proxies = { "https":"https://117.157.197.18:3128" # "
阅读全文
摘要:from selenium.webdriver import Chrome #导入Chrome驱动from selenium.webdriver.common.keys import Keys #导入键盘对应的库#创造浏览器对象web = Chrome()#打开网页web.get("https://
阅读全文
摘要:# 能放我们的程序连接浏览器,让浏览器完成复杂的操作,我们只接受最终的结果# selenium : 自动化测试工具# 可以打开浏览器 像人一样操作# 程序员可以从selenium中拿到浏览器网页上各种信息# 环境搭建: pip install selenium# 下载浏览器驱动:https://re
阅读全文
摘要:from selenium.webdriver import Chrome #导入Chrome驱动from selenium.webdriver.common.keys import Keys #导入键盘对应的库#创造浏览器对象web = Chrome()#打开网页web.get("http://l
阅读全文
摘要:tboty问题: 当我们用浏览器直接copy Xpath 时(因为浏览器时实时解析),tbody这个元素是html生成时产生的,在使用xpath解析的时候无法解析,因此返回的列表为空值。 解决方法:把tbody去掉就行啦 路径问题: 完整路径(就是我们内容所在的位置的路径):/html/body/d
阅读全文
摘要:多线程 from threading import Thread #多线程需要导入的包 方法一: def func(name): #第一个循环 for i in range(1000): print(name, i)if __name__ == '__main__': #第二个循环 t = Thre
阅读全文
摘要:乱码解决方法 content中间存的是字节码,而text中存的是Beautifulsoup根据猜测的编码方式将content内容编码成字符串。 当我们编码是中文类型(GBK,GB2312等),有时我们直接用text进行解码有时会发生乱码,这是我们需要用字节码的解码函数content.decode('
阅读全文
摘要:requests中的session模块思路:# 1. 登录 --> 等到cookie# 2.带着cookie 请求到书架的url-->书架上的内容#注意:# 两个操作要连续起来操作# 我们可以用session进行请求-->session可以连续进行对话,而且我们得到的cookie不会丢失import
阅读全文
摘要:非标准代码处理 from lxml import etree #导入lxml 中erree模块 parser = etree.HTMLParser(encoding="utf-8") #解释器指定编码tree = etree.parse("b.html", parser=parser) #把解释器加
阅读全文
摘要:报错分析: 我们检查代码没有任何问题,但报错显示:开始和结束标记不匹配。 html:因为html是超文本标记语言,代码不规范也能解析。 python:python是编程语言,代码不规范则解析不了。 解决方案: 我们只要给python指定解析器,他是不是能解析出网页呢? parser = etree.
阅读全文
摘要:报错原因:第一次安装虚拟机intel vt-x 处于禁用状态,没有启用 分析思路:找到 Intel vt - x 位置,并打开 。(intel - x在bios) 解决方法: 联想笔记本为例:进入bios方法一:开机看到图标狂按 按Fn + F2 >(运气好)进入bios 进入bios方法二:win
阅读全文
摘要:1.打开命令行输入sudo vim /etc/apt/sources.list,并输入密码(也许你进入终端是空白的,也是没有问题的。)。这里我们用root身份进去。不然后期会报错。 (E45: 'readonly' option is set (add ! to override:原因式:当前用户没
阅读全文
摘要:表达式全集 字符描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“n”匹配字符“n”。“\n”匹配一个换行符。串行“\\”匹配“\”而“\(”则匹配“(”。 ^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配
阅读全文
摘要:这个报错与代码时没有关系 当文件名与调用模块名重合时,系统找不到我们调用的requests模块。 在命名时,我们要注意不要重合。
阅读全文