06 2016 档案
摘要:#include<iostream>#include<stack>#include<vector>using namespace std;struct node{ int val; node *left,*right; node(int _val):val(_val),left(NULL),righ
阅读全文
摘要:利用学习曲线判断是否过拟合和欠拟合 过拟合和欠拟合的处理: 其实不全啊,不想补了 过拟合原因: 1、数据N太小 2、噪声数据 3、模型过于复杂 过拟合:1)找更多的数据来学习,2)增大正则化系数 3)减少特征的个数(不太推荐) 欠拟合:1)找更多的特征 2)减少正则化系数
阅读全文
摘要:L1正则化和L2正则化的区别:L1起截断作用,L2起缩放作用(不让参数θ过大) L1稀疏,L2平滑作用 L1的稀疏化性质去掉无关特征,只留下相关特征 L2如果特征有些是共线性的,L1会扔掉这些特征,导致模型误差较大 数据和特征处理 数据清洗 正负样本不平衡的处理方法:上采样,下采样,修改损失函数 数
阅读全文
摘要:损失函数是对数损失函数 对损失函数求导:和线性回归的求导结果一样: 离散化: 快 稀疏化 给线性模型带来一定的非线性 模型稳定 在一定程度上降低过拟合风险
阅读全文
摘要:方法一:头插法 方法二:递归法 #include<iostream>using namespace std;#include<vector>#include<algorithm>#include<string>#include<string.h>#include<queue>#include<alg
阅读全文
摘要:最朴素的做法o(V*V/2+2E)~O(V^2)#include<iostream>using namespace std;#include<vector>#include<algorithm>#include<string>#include<string.h>const int MAX = 200
阅读全文
摘要:KMP的子串长n,模式串长m,复杂度o(m+n),朴素做法的复杂度o((n-m+1)*m) 觉得大话数据结果上面这个讲得特别好 改进版本的KMP leetcode 28. Implement strStr() 28. Implement strStr()
阅读全文
摘要:hive中的各种join操作 join是最简单的关联操作,两边关联只取交集。 outer join分为left outer join、right outer join和full outer join。 left outer join是以左表驱动,右表不存在的key均赋值为null; right ou
阅读全文
摘要:1、引用和指针的区别 1)引用被创建的时候需要初始化,指针可以等到任何时候再初始化 2)引用不能指向NULL,指针可以指向NULL 3) 引用被初始化后,不能再绑定到其它对象,而指针初始化后,可以改变他指向的对象 对于第3条的理解: int m=90; int &n=m; int b=99; n=b
阅读全文
摘要:前缀自增 UPInt & UPint::operator++() { *this+=1; return *this; } 后缀自增 const UPInt & UPint::operator++(int ) { UPint oldValue=*this; ++(*this); return oldV
阅读全文
摘要:判别模型和生成模型 判别模型:求的是条件概率,如SVM,LR 生成模型: 比如要确定一只羊是山羊还是绵羊,利用生成模型,我们可以根据山羊的特征,首先学习出一个山羊模型;然后根据绵羊的特征学习出一个绵羊模型。然后从某一只羊中提取特征,放到山羊模型中看概率是多少,再放到绵羊模型中看概率是多少,哪个大就是
阅读全文