摘要: 文本处理 文本处理分类 分词 jieba 中文分词库 词性标注 jieba.posseg 命名实体识别 文本张量表示方法 one-hot编码 优点:操作简单,便于理解 缺点:词与词之间的联系被割断了;如果数据量大,内存消耗大 # 用于对象保存和加载 from sklearn.externals im 阅读全文
posted @ 2024-12-16 23:15 liDB 阅读(9) 评论(0) 推荐(0) 编辑