摘要: 1、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库,需要额外安装 - jieba库提供三种分词模式,最简单只需掌握一个函数 (2)、jieba分词的原理 Jieba分词依靠中文词库 - 阅读全文
posted @ 2019-11-03 21:42 马秀昆 阅读(635) 评论(1) 推荐(0) 编辑
摘要: 在编写python程序的过程中,中英文混用经常会出现编码问题。围绕此问题,本文首先介绍编码的含义及常用编码,随后列举几个python经常遇到的编码异常及解决方法,接着列举笔者在实践中遇到的异常出现的情景及原因,最后针对编码问题提出最佳实践。 一 常见编码 1.1 unicode编码 在文本文件中,看 阅读全文
posted @ 2019-11-03 21:37 马秀昆 阅读(490) 评论(0) 推荐(0) 编辑
摘要: 1.助教博客:https://www.cnblogs.com/mxk123/ 2.作业情况: 陈康:https://www.cnblogs.com/Chen-K/p/11744164.html 江武:https://www.cnblogs.com/jackyfive/p/11745212.html 阅读全文
posted @ 2019-11-03 21:22 马秀昆 阅读(190) 评论(4) 推荐(0) 编辑