摘要:
jieba 是目前最好的 Python 中文分词组件 1.安装 pip install jieba 2.简单使用 支持3 种分词模式: 精确模式 import jieba seg_list = jieba.cut("再回首恍然如梦,再回首我心依旧", cut_all=False) print("【精 阅读全文
摘要:
读取文件时遇到 Traceback (most recent call last): File "fenci.py", line 21, in <module> text = open(path.join(d, 'job1000.txt')).read()UnicodeDecodeError: 'g 阅读全文
摘要:
OCR可以自动对手写或者印刷字体进行类型转化为机器编码文本字符串,供我们存取和操作 1.安装Tesseract (1)Ubuntu16下 sudo apt-get install tesseract-ocr 验证Tesseract是否安装成功 tesseract -v (2)windows下 下载h 阅读全文
摘要:
生成词云 安装wordcloud模块 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ wordcloud 用重复的单个单词组成单词云 import numpy as np from wordcloud import WordCloud 阅读全文
摘要:
Matplotlib 是一个 Python 的 2D绘图库 安装 pip install matplotlib 绘图的准备 1.添加Figure对象 2.添加Axes import matplotlib.pyplot as plt fig = plt.figure() ax = fig.add_su 阅读全文
摘要:
MyQR 库是 Python 中最流行的二维码制作函数库。 通过一个简单的函数就可生成生动有趣的二维码,是二维码制作神器 安装MyQR模块 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ myqr 经常使用 MyQR 库中的一个模块 阅读全文
摘要:
Python安装后pip不能使用 解决的方法: 执行 python -m ensurepip 升级 python -m pip install --upgrade pip 阅读全文