摘要: jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个词语 jieba是优秀的中文分词第三方库,需要额外安装 (pip install jieba) jieba库提供三种分词模式,最简单只需掌握一个函数 jieba分词原理 利用一个中文词库,确定汉字之间的关系概率 汉字之间概率大的组成词组 阅读全文
posted @ 2018-05-01 20:57 maskedguy 阅读(602) 评论(0) 推荐(0) 编辑
摘要: 组合数据:集合类型、序列类型(元组类型、列表类型)、字典类型 集合: 定义:集合是多个元素的无序组合。(无序,唯一,Python中要求放入集合中的数据类型是不可变的)。 集合用大括号 {}表示,元素间用逗号分隔 创建集合用{} 或者 set() 集合操作符:S | T (并集) S - T (差集) 阅读全文
posted @ 2018-05-01 20:19 maskedguy 阅读(655) 评论(0) 推荐(0) 编辑