安装beautifulsoup库时遇到麻烦

一、Beautiful Soup库遇到的问题

       1.ImportError: No module named BeautifulSoup       

当你成功安装BeautifulSoup 4库后,“from BeautifulSoup import BeautifulSoup”可能会遇到该错误。


        其中的原因是BeautifulSoup 4库改名为bs4,需要使用“from bs4 import BeautifulSoup”导入。

        2.TypeError: an integer is required

        当你使用“print soup.title.string”获取title的值时,可能会遇到该错误。如下:

        它应该是IDLE的BUG,当使用命令行Command没有任何错误。参考:stackoverflow。同时可以通过下面的代码解决该问题:
        print unicode(soup.title.string)
        print str(soup.title.string)

下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/

下载完成后解压到python安装包的地方,存放在Beautifulsoup.**文件下

 

win+R  ————cmd  cd (第 2 步放置安装包的位置)C:\Python36\beautifulsoup4-4.6.0

安装:python steup.py install

二. 安装及介绍Beautiful Soup库

安装beautiful soup库

#安装
pip install beautifulsoup4
#检查
from bs4 import Beautiful Soup
#安装 lxml
pip install lxml
捷径

别的就不多说了

pip install beautifulsoup4

安装完成后

from bs4 import BeautifulSoup

进行导入模块,如果运行没有问题,那么我们就是成功了--------如果是报的‘import name HTMLParseError’,就说明我们的python版本与beautiful soup4的支持版本不符,那么我要更新运行beautiful soup,或者直接下载最新的(才脑壳痛哦)

pip3 install --upgrade beautifulsoup4

更新完成后,那么我们就可以使用 bs4 了,如果还是报错 (那么我就进入他老巢————文件夹看看)打开 finder ,前往文件夹:

/usr/local/lib/python3.6/site-packages

在这个文件夹里找一找,看有没有两个beautifuls4的文件,如果有,删掉那个旧版本的,我的是不知道什么原因,site-packages里多了个 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,删除掉就好了。

beautifulsoup4安装完成之后,还需要一个叫 lxml 的依赖库:

pip3 install lxml

ok,完成,我的也就是到这里为止了,可能还有更好的操作方法也说不定的哈,小弟课多也就再花功夫在研究咯0.....0

Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。

Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。

Beautiful Soup已成为和lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度

具体的介绍我们还是参考官方文档吧:
 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

 
posted @ 2018-04-11 16:30  脚本小孩  阅读(1569)  评论(0编辑  收藏  举报