随笔分类 - 关于python
记录一些python中遇到的坑
摘要:输出 格式化输出,使用prettify()方法将BeautifulSoup文档树格式化以后以Unicode编码输出,每个XML/HTML标签单独占一行 markup = '<a href="http://example.com/">I linked to <i>example.com</i></a>
阅读全文
摘要:bs4 修改文档树 BeautifulSoup还能对文档树进行修改操作,下面主要是列举一些修改文档书的方法 下面的例子都已引入相应的库或包 from bs4 import BeautifulSoup,Comment from bs4.element import NavigableString 修改
阅读全文
摘要:bs4 搜索文档树 搜索文档树有很多方法,比较常用的是find()和find_all() ,在方法中我们通常需要加上特定的参数去查找我们需要的内容,这样的参数就被看作为过滤器。 依然使用官方提供的测试html文档 html_doc = """ <html><head><title>The Dormo
阅读全文
摘要:遍历文档树 一个html或者是xml格式的文档经过bs处理后会变成一个文档树,顶级节点为一个tag,这个tag里面包含了很多个子节点,这些子节点可以是字符串也可以是tag,接下来以一段示例文档来学习遍历这个文档树。 html_doc = """<html> <head> <title>The Dor
阅读全文
摘要:戳这里:bs4 的官方文档 ps:下面部分内容摘自官方文档 来自bs4的简介 Beautiful Soup是一个可以提取html或者xml这种具有格式的文件句柄或者字符串的python三方库,它可以在短时间内通过转换器对符合提取条件的文件进行批量的修改、文件指南等操作; 安装Beautiful So
阅读全文
摘要:参考博客:https://www.cnblogs.com/hany-postq473111315/p/12268076.html 因为博主之前做的都是java与c系的编程语言相关的内容,所以遇到Python中的for...else...不太熟悉,因此记录下来 for 变量 in 可迭代对象: 执行语
阅读全文
摘要:本文涉及驻留机制,参考博客园:https://www.cnblogs.com/wuxiaoqian726/articles/1991946.html 在Python中,通过身份标识“is”来判断是通过内存地址来判断两个是否相等,而关系运算符“==”是通过值来判断两个是否相等 例如: str1 = "
阅读全文