2020年6月17日

IntroductionToNLP - ch02 - 2.2.2 词典的加载

摘要: from pyhanlp import * def load_dictionary(): """ 加载HanLP中的mini词库 :return: 一个set形式的词库 """ IOUtil = JClass('com.hankcs.hanlp.corpus.io.IOUtil') path = H 阅读全文

posted @ 2020-06-17 22:51 HBU_DAVID 阅读(132) 评论(0) 推荐(0) 编辑

IntroductionToNLP - ch02 - 2.1.2 词的性质—齐夫定律

摘要: icwb2-data 数据集: 由北京大学、香港城市大学、台湾 CKIP, Academia Sinica 及中国微软研究所联合发布的数据集,用以进行中文分词模型的训练。 其中 AS 和 CityU 为繁体中文数据集,PK 和 MSR 为简体中文数据集。 http://sighan.cs.uchic 阅读全文

posted @ 2020-06-17 22:46 HBU_DAVID 阅读(235) 评论(0) 推荐(0) 编辑

【VS Code + Python + HanLP】unresolved import 'pyhanlp' Python(unresolved-import)

摘要: unresolved import 'pyhanlp' Python(unresolved-import) ?? Ref: VS Code关闭Pylint警告或错误提示 阅读全文

posted @ 2020-06-17 12:19 HBU_DAVID 阅读(489) 评论(0) 推荐(0) 编辑

IntroductionToNLP - ch01 - hello world

摘要: from pyhanlp import * def main(): HanLP.Config.enableDebug() # 为了避免你等得无聊,开启调试模式说点什么:-) print(HanLP.segment("王国维和服务员")) if __name__ == '__main__': main 阅读全文

posted @ 2020-06-17 01:12 HBU_DAVID 阅读(221) 评论(0) 推荐(0) 编辑

HanLP: Han Language Processing

摘要: HanLP:面向生产环境的自然语言处理工具包 安装: pip install pyhanlp https://hanlp.hankcs.com/ https://github.com/hankcs/HanLP/tree/1.x 阅读全文

posted @ 2020-06-17 00:42 HBU_DAVID 阅读(132) 评论(0) 推荐(0) 编辑

配置学习环境:VS CODE + Python 3.8

摘要: 1. 安装Python3.8 2. VS CODE 安装好以后,要进行配置:https://www.cnblogs.com/springsnow/p/12905885.html 新建文件 hello.py 输入 print('hello, world') 结果显示:hello,world 这样,环境 阅读全文

posted @ 2020-06-17 00:18 HBU_DAVID 阅读(164) 评论(0) 推荐(0) 编辑

导航