第14.13节 BeautifulSoup的其他功能导览
前面《第14.9节 Python中使用urllib.request+BeautifulSoup获取url访问的基本信息
》、《第14.10节 Python中使用BeautifulSoup解析http报文:html标签相关属性的访问》和《第14.11节 Python中使用BeautifulSoup解析http报文:使用查找方法快速定位内容》三个章节详细介绍了使用BeautifulSoup解析html文档的功能,老猿对BeatifulSoap的介绍暂时到此为止,因为老猿也暂时只需要用这么多。但实际上BeatifulSoap的功能除了解析html文档的功能之外,还有非常强大的对html文档操作的其他功能,包括:
1、 HTML元素标签及标签内的字符串的修改;
2、 在标签中添加内容;
3、 增加新的标签;
4、 增加新的字符串;
5、 在指定位置插入标签;
6、 删除指定标签;
7、 替换指定内容;
8、 在某个标签外面再包装一个块元素标签;
9、 将某个标签内的html元素解包;
10、 输出格式控制;
11、 指定HTML文档编码类型或排除某些文档类型以加快文档解析过程;
12、 将html文档指定输出编码类型来输出不同编码类型的html文档;
13、 对某些指定的标签元素的字符串进行encode编码;
14、 使用SoupStrainer指定解析html文档的指定部分以只解析需要的内容。
这些内容老猿暂时就不研究和介绍了,大家可以参考BeautifulSoup文档官网。
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
老猿Python博客文章目录:https://blog.csdn.net/LaoYuanPython/article/details/98245036
请大家多多支持,点赞、评论和加关注!谢谢!