摘要: 一、你会在时间序列数据集上使用什么交叉验证技术?是用k倍? 答:都不是。对于时间序列问题,k倍可能会很麻烦,因为第4年或第5年的一些模式有可能跟第3年的不同,而我们最终可能只是需要对过去几年的进行验证,这就不能用这种方法了。相反,我们可以采用如下所示的5倍正向链接策略: fold 1 : train 阅读全文
posted @ 2018-07-27 14:47 1直在路上1 阅读(468) 评论(0) 推荐(0) 编辑
摘要: 一、你知道聚类中度量距离的方法有哪些吗? 1)欧式距离 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。即两点之间直线距离,公式比较简单就不写了 应用场景:适用于求解两点之间直线的距离,适用于各个向量标准统一的情况 2)曼哈顿距离(Manhattan Distance) 从名 阅读全文
posted @ 2018-07-27 10:56 1直在路上1 阅读(11196) 评论(0) 推荐(2) 编辑