摘要:
1.算法的四个特性: (1)有穷性; (2)确定性; (3)可行性; (4)输入和输出; 2. (1)穷举法(万能算法):如求N个数的全排列 8皇后问题 (2)分而治之(建而治之): 二分查找:减为治之 归并排序:分而治之 (3)贪心 最小生成树Prim Kruskal 单源最短路径 Dijkstr 阅读全文
摘要:
0.调优模型,让模型在给定的数据集上有更好的效果。 一、前序工作流程 0.数据清洗 (1)不可信的样本丢掉 (2)缺省值极多的字段考虑不用 1.数据采样: (1)下/上采样 (2)保证样本均衡 2.特征处理(特征工程) 数值型 类别型 时间型 文本型 统计型 组合特征 3.特征选择(特征工程) (1 阅读全文