12 2018 档案
摘要:bagging: 让该学习算法训练多轮,每轮的训练集由从初始的训练集中随机取出的n个训练样本组成,某个初始训练样本在某轮训练集中可以出现多次或根本不出现,训练之后可得到一个预测函数序列h_1,⋯ ⋯h_n ,最终的预测函数H对分类问题采用投票方式,对回归问题采用简单平均方法对新示例进行判别。(可以并
阅读全文
摘要:代码: 输出: <map object at 0x000001B48C30EEF0> 而我们需要的是:数值型而非这些鬼 解决办法:
阅读全文
摘要:lasso:是L1正则化(绝对值) 注:坐标下降法即前向逐步线性回归 lasso算法:常用于特征选择 最小角算法,由于时间有限没有去好好研究(其实是有点复杂,尴尬)
阅读全文
摘要:对一些α的值选取还需要定量分析,分析这些值对预测效果的影响,选择最优的α。(交叉验证实现) 优缺点:Ridge回归在不抛弃任何一个变量的情况下,缩小了回归系数,使得模型相对而言比较的稳定,但这会使得模型的变量特别多,模型解释性差。容易导致过拟合。 它的改进就是lasso回归。
阅读全文
摘要:由于各种原因,pycharm有test字段,或者有test的函数时,会莫名奇妙的进入test模式,有时候怎么也跳不出来,害我花了半天时间,坑。 解决办法:直接在菜单栏找Run,选择不带test的进行运行就可以了。 为了清楚说明解决办法我还上个图吧。
阅读全文
摘要:KNN: 就是计算特征之间的距离,某一个待预测的数据分别与已知的所有数据计算他们之间的特征距离,选出前N个距离最近的数据,这N个数据中哪一类的数据最多,就判定待测数据归属哪一类。 假如N=3,图中待测圆就属于个数最多那个:三角类 总结: 1、KNN是分类数据最简单最有效的算法 2、缺点就是存储空间消
阅读全文
摘要:一、高斯金字塔 金字塔的层是由降采样得到的,而每一层又有多张图像,其他的图像是由初始的一张经过高斯模糊的得到的。 注意的是:高斯金字塔有层,而金字塔的每一层有一组图像,这一组图像也形成了层。注意两个层的区别。 1、降采样时,高斯金字塔上一组图像的初始图像(底层图像)是由前一组图像的倒数第三张图像隔点
阅读全文
摘要:今天就简单学习了下网络爬虫基础知识。网络爬虫其实就是对网站的分析,然后抽取自己需要的信息,这就是一个熟练的过程。 目的:兴趣,以后可能会用到,就暂时先了解下。明天该回到正题了:计算机视觉,。毕竟要开题了,不能瞎浪了,忧伤! 今天:爬取了前程无忧上面关于机器学习的部分职位信息 code:
阅读全文
摘要:由于上周脚受伤了,修养了几天没有学习。今天去实验室发现我的编译器跑不动了,出现找不到模块的情况,很奇怪都安装了,也不会提示什么模块找不到。 查找了些资料,发现是因为某个模块的文件损坏或者被覆盖或者安装不全等原因才会导致一些奇奇怪怪的bug。这个时候你可以看log日志,找到一些相关的模块名字,然后先把
阅读全文