Python3_pip3_安装支持包_mysql_pycurl_pdfplumber_camelot-py
转载注明来源: 本文链接 来自osnosn的博客,写于 2020-09-06.
pip3安装太慢,设置换源, 设置代理,参考 这篇文章
pip3 安装支持包
- 如果安装某个包时出错,退出。(比如少装了库文件,少了命令支持。)
当你补装库文件后。再次 pip3 install 会失败。- 用
pip3 install --no-cache-dir xxxx
否则不会重新编译。
或者删除缓存目录rm -rf ~/.cache/pip/
再pip3 install xxxx
。
- 用
MySQLclient
- 需要
pip3
,gcc
- 需要
mysql_config
命令- 根据你已经安装的数据库,选装
mariadb-connector-c-devel
或者mysql-connector-c-devel
- 根据你已经安装的数据库,选装
- 需要
python3-devel
pip3 install mysqlclient
- python3中使用: 推荐
import MySQLdb
或者 底层库(不推荐)import _mysql
- 这个包速度快些。(比pymysql快)
- debian 中, 装
apt install python3-mysqldb
,就是mysqlclient。
PyMySQL
pip3 install PyMySQL
- python3中使用:
import pymysql
- 这个包速度慢些。(比mysqlclient慢)
web client 访问, pycurl
- python3 可以用 urllib, requests, pycurl 。
其中 requests,pycurl 使用都比较方便。
pycurl 功能和性能也更好。并且更通用,好多其他语言中都有 curl 的支持。 - requests 需要 pysocks 才能使用 socks5 代理。
- 如果用
pip3 install pycurl
, 安装失败,centos需要 python-devel curl-devel。
pdfplumber 和 camelot-py
这两个包,都是用于提取pdf中的文本/表格。各有优缺点。
对于纯表格的pdf,pdfplumber表现更好点。
记录一下。这是在 uos 系统中,python3.7 下安装。
- uos的py3版本比较低。
- 先在root中,
apt install python3-pip
。 - 再在root中,
apt install python3-socks
为了pip3 能支持 socks5 代理。 - 下面切换到普通用户下。
pip3 install --upgrade pip
首先升级pip 自己。- 之前没升级pip自己,导致安装很多包的时候,各种错误。某包版本不匹配,某包找不到,某包安装失败....
- 然后用 pip 装 pdfplumber 和 camelot-py。
- 这两个包,都附带装了很多依赖,pdfplumber 比较大,camelot-py 更大。
- pdfplumber 依赖有,Pillow Wand pdfminer.six (charset-normalizer cryptography)。
- camelot-py 依赖有,chardet click numpy openpyxl pandas pdfminer.six PyPDF2 opencv-python 。
- 在debian中安装 pdfplumber成功,安装后约占30MB, 使用也OK。
转载注明来源: 本文链接 https://www.cnblogs.com/osnosn/p/13636275.html 来自osnosn的博客.