12月28日学习内容整理:博客系统之后台管理,kindeditor编辑器,beautifulsoup4模块
1、kindeditorb编辑器:
http://kindeditor.net/doc.php
2、beautifulsoup4模块:只针对标签字符串
》》引入:
from bs4 import BeautifulSoup
》》soup=BeautifulSoup(标签字符串,"html.parser") 后者是python自带的解析器
得到了BeautifulSoup对象,也就是整篇文档对象
》》soup.标签名 只能获取到第一个指定的标签名
返回一个标签对象
》》soup.find_all("标签名")
返回一个列表,元素是一个个匹配的标签对象
》》soup.find_all(attrs={}) 获取所有指定属性或属性值的标签
》》soup.find_all("标签名",id="xxx") 表示且的关系
》》soup.find_all(["标签名1","标签名2"]) 表示或的关系
》》soup.find_all() 获取到了所有的标签,包括嵌套的标签
》》soup.text 或者 soup.get_text() 拿到标签字符串中所有的文本
标签对象tag
》》tag.get("属性名") 得到这个标签指定的属性值
》》tag.text 获取文本
》》tag[属性名] 获取属性值
》》tag.attrs 对应的所有属性和属性值,是个字典
》》tag.string.replace_with("xxxx") 也是获取到文本,并将文本替换为指定的内容
》》tag.name 获取到标签名
CSS选择器
》》soup.select(这里就写选择器的规则) 返回一个列表
标签对象的方法
》》tag.clear() 清空标签中的内容,并不清除标签本身
》》tag.decompose() 从文档中完全移除标签
补充:
前端中:
location.href 就是当前页面完整的url,带着域名的
location.search 就是当前页面URL中携带的数据,也就是以?开头的字符串