beautifulsoup4进阶学习笔记
requests库是可以找到想要的东西,基本上几行代码就搞定,但是进一步把有用的内容提取出来变成自己想要的格式来方便后续进行数据分析
正则表达式提取的话,需要一些时间成本,这个可以每天积累一点。
这里我直接看的官方文档
因此记录一些比较容易忘记的
安装解析器
BeautifulSoup支持python标准库中的html解析器,还支持一些第三方的解析器,有一个很不错的是lxml
win系统
pip install lxml
requests库是可以找到想要的东西,基本上几行代码就搞定,但是进一步把有用的内容提取出来变成自己想要的格式来方便后续进行数据分析
正则表达式提取的话,需要一些时间成本,这个可以每天积累一点。
这里我直接看的官方文档
因此记录一些比较容易忘记的
BeautifulSoup支持python标准库中的html解析器,还支持一些第三方的解析器,有一个很不错的是lxml
win系统
pip install lxml