摘要: 文本预处理 实现步骤(处理语言模型数据集距离) 文本预处理的实现步骤 读入文本:读入zip / txt 等数据集 分词:把换行符替换成空格。如果处理的是英文,最好把大写改成小写。(因为第一次接触文本处理,理解的都很浅显) 建立字典,将每个词映射到一个唯一的索引(index):将每个字符映射成一个从0 阅读全文
posted @ 2020-02-14 16:51 司念 阅读(300) 评论(0) 推荐(1) 编辑
摘要: 线性回归 基础知识 实现过程 学习笔记 批量读取 torch_data = Data.TensorDataset(features, labels) dataset = Data.DataLoader(torch_data, batch_size, shuffle=True) 定义模型的两种常见写法 阅读全文
posted @ 2020-02-14 16:13 司念 阅读(574) 评论(0) 推荐(0) 编辑