初识Spacy
之所以想接触Spacy,是看到其自称为工业级的应用,所以想尝试下
windows下安装Spacy:
直接安装pip install spacy是会报错的
解决方法:
到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载spacy及其相关的包,挨个安装,最后安装spacy即可
与nltk类似,spacy也需要下载一些常用的包或是模型之类的东西
python -m spacy download en
python -m spacy download de
python -m spacy download fr
python -m spacy download en_core_web_md
基础功能的测试:
1. 断词与断句
2. 词干化(Lemmatize)
3.标注词性(POS Tagging)
4.命名实体识别(NER)
5.名词短语提取
6. 基于词向量计算词间相似度
Spacy与中文:
spacy对中文的支持调用的是jieba的接口,所以需要预先安装jieba,在调用时,使用
nlp=spacy.load('zh')
后面的操作与英文的类似
但是只有断词还能用,其他功能需要有依赖的包库,所以,还不如直接用jieba来得直接