摘要: 训练语料格式 自定义五个类别及其标签:0 运费、1 寄件、2 人工、3 改单、4 催单、5 其他业务类。 从原数据中挑选一部分作为训练语料和测试语料 建立模型测试并保存 模型评估: 使用模型预测 结果: 阅读全文
posted @ 2018-06-26 17:22 飞末 阅读(1821) 评论(0) 推荐(0) 编辑
摘要: 一、ML组件 ML的标准API使用管道(pipeline)这样的方式,可以将多个算法或者数据处理过程整合到一个管道或者一个流程里运行,其中包含下面几个部分: 1. dataFrame:用于ML的dataset,保存数据 2. transformer:将一个dataFrame按照某种计算转换成另外一个 阅读全文
posted @ 2018-06-26 16:59 飞末 阅读(3066) 评论(0) 推荐(0) 编辑