摘要: 最近参加比赛,写了一个垃圾短信识别器,在这里做一下记录。 官方提供的数据是csv文件,其中训练集有80万条数据,测试集有20万条数据,训练集的格式为:行号 标记(0为普通短信,1为垃圾短信) 短信内容;测试集的格式为: 行号 短信内容;要求输出的数据格式要求为: 行号 标记,以csv格式保存。 实现 阅读全文
posted @ 2015-11-18 16:59 jz_cnblogs 阅读(1915) 评论(0) 推荐(0) 编辑