安装beautifulsoup库时遇到麻烦
一、Beautiful Soup库遇到的问题
1.ImportError: No module named BeautifulSoup
当你成功安装BeautifulSoup 4库后,“from BeautifulSoup import BeautifulSoup”可能会遇到该错误。
2.TypeError: an integer is required
当你使用“print soup.title.string”获取title的值时,可能会遇到该错误。如下:print unicode(soup.title.string)
print str(soup.title.string)
下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/
下载完成后解压到python安装包的地方,存放在Beautifulsoup.**文件下
win+R ————cmd cd (第 2 步放置安装包的位置)C:\Python36\beautifulsoup4-4.6.0
安装:python steup.py install
二. 安装及介绍Beautiful Soup库
安装beautiful soup库
#安装 pip install beautifulsoup4 #检查 from bs4 import Beautiful Soup #安装 lxml pip install lxml
别的就不多说了
pip install beautifulsoup4
安装完成后
from bs4 import BeautifulSoup
进行导入模块,如果运行没有问题,那么我们就是成功了--------如果是报的‘import name HTMLParseError’,就说明我们的python版本与beautiful soup4的支持版本不符,那么我要更新运行beautiful soup,或者直接下载最新的(才脑壳痛哦)
pip3 install --upgrade beautifulsoup4
更新完成后,那么我们就可以使用 bs4 了,如果还是报错 (那么我就进入他老巢————文件夹看看)打开 finder ,前往文件夹:
/usr/local/lib/python3.6/site-packages
在这个文件夹里找一找,看有没有两个beautifuls4的文件,如果有,删掉那个旧版本的,我的是不知道什么原因,site-packages里多了个 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,删除掉就好了。
beautifulsoup4安装完成之后,还需要一个叫 lxml 的依赖库:
pip3 install lxml
ok,完成,我的也就是到这里为止了,可能还有更好的操作方法也说不定的哈,小弟课多也就再花功夫在研究咯0.....0
Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。
Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。
Beautiful Soup已成为和lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度
具体的介绍我们还是参考官方文档吧:
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html