摘要: 目标:去掉vaule 值上面的"" 引号,中间保持不变 test01.txt "value": "[{\"registrationType\":\"TaxId\",\"description\":\"Tax ID\",\"taxNumberType\":\"CPI-TEST\",\"registra 阅读全文
posted @ 2022-08-04 17:20 yintian908 阅读(392) 评论(0) 推荐(0) 编辑
摘要: 浏览器对象的初始化并将其赋值为 browser 对象from selenium import webdriver browser = webdriver.Chrome() browser = webdriver.Firefox() browser = webdriver.Edge() browser 阅读全文
posted @ 2021-06-07 16:40 yintian908 阅读(36) 评论(0) 推荐(0) 编辑
摘要: def extract_question(doc): list_ques=[] questions = doc('.ContentItem-title') #选择class为ContentItem-title的标签 questions = questions.find('meta[itemprop= 阅读全文
posted @ 2021-06-01 17:41 yintian908 阅读(122) 评论(0) 推荐(0) 编辑
摘要: etree.xpath 使用 参考网站:https://www.w3school.com.cn/xpath/xpath_functions.asp 第1步导入lxml模块 第2步 初始化准备要用处理的文件或者字符串 第3步,按照各种规则来提取第2步已经处理好的html 第一种:利用现有的html文件 阅读全文
posted @ 2021-05-15 14:46 yintian908 阅读(1158) 评论(0) 推荐(0) 编辑
摘要: 目标: 需要把字典类型的数据写入文件 步骤: 新建一个文件(或者打开一个文件),然后按照函数提供的类型,写文件。但是每个函数都要自己的入参要求,所以要根据需要把参数转化成需要的类型 使用的函数为: 打卡文件的函数 open(path, ‘-模式-‘,encoding=’UTF-8’) 即open(路 阅读全文
posted @ 2021-05-11 16:01 yintian908 阅读(491) 评论(0) 推荐(0) 编辑
摘要: match()方法在使用时需要考虑到开头的内容,这在做匹配时不方便,它更适合用来检测某个字符串是否符合某一个规则 search()方法,它在匹配时会扫描整个字符串,然后返回第一个成功匹配的结果。如果未搜索到,就会返回None import re content01 = 'Extra things H 阅读全文
posted @ 2021-05-06 19:53 yintian908 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 修饰符描述 re.I 使匹配对大小写不敏感 re.L 做本地化识别(locale-aware)匹配 re.M 多行匹配,影响 ^ 和 $ re.S 使 . 匹配包括换行在内的所有字符 re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. re.X 该标志通过给予你 阅读全文
posted @ 2021-05-06 17:34 yintian908 阅读(54) 评论(0) 推荐(0) 编辑
摘要: content02 = 'Hello 1234567 World_This is a Regex Demo' result03 = re.match('^Hello.*(\d+).*Demo',content02) #贪婪模式 print(result03) print(result03.group 阅读全文
posted @ 2021-05-06 16:48 yintian908 阅读(65) 评论(0) 推荐(0) 编辑
摘要: #re.match有两个函数 group() span()其中group()为查询结果,有这个(),则读取的时候为group(1),如果有多个(),则依次为group(2) group(3),group()为全部结果,而group(1)为正则表达式中有()包围的第一个匹配结果span()为查询范围 阅读全文
posted @ 2021-05-06 15:55 yintian908 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 关于requests认证使用官方文档: https://requests-oauthlib.readthedocs.io/en/latest/ python3内置函数API https://docs.python.org/3/library/functions.html 第3方requests包函数 阅读全文
posted @ 2021-05-06 14:54 yintian908 阅读(649) 评论(0) 推荐(0) 编辑