摘要:
AdaBoost是一种迭代型的算法,其核心思想是针对同一个训练集训练不同的学习算法,即弱学习算法,然后将这些弱学习算法集合起来,构造一个更强的最终学习算法。 用于二分类或多分类的应用场景 在AdaBoost算法中,有两个权重,第一个是训练集中每个样本有一个权重,称为样本权重,用向量D表示;另一个是每 阅读全文
摘要:
Flappy Bird Q-learning Q-learning 走出房间 一个强化学习 Q-learning 算法的简明教程 强化学习概念 http://www.cnblogs.com/yifdu25/p/8169226.html 强化学习是一种不同于监督学习和无监督学习的在线学习技术。它把学习 阅读全文
摘要:
网上没什么资料,就分享下:) 简单模式:kafka传数据到Flink存储到mysql 可以参考网站: 利用Flink stream从kafka中写数据到mysql maven依赖情况: 配置文件及sql语句,时间窗口是1分钟: MySQL建表: 发送数据到kafka,用的是flink example 阅读全文
摘要:
Coursera吴恩达《优化深度神经网络》课程笔记(1)-- 深度学习的实用层面 1. Train/Dev/Test sets 训练集(Training sets)、验证集(Development sets)、测试集(Test sets) 之前人们通常设置Train sets和Test sets的数 阅读全文
摘要:
Coursera吴恩达《优化深度神经网络》课程笔记(2)-- 优化算法 深度机器学习中的batch的大小 深度机器学习中的batch的大小对学习效果有何影响? 1. Mini-batch gradient descent SGD VS BGD VS MBGD 3. 指数加权平均(Exponentia 阅读全文
摘要:
基础:逻辑回归 Logistic 回归模型的参数估计为什么不能采用最小二乘法? logistic回归模型的参数估计问题不能“方便地”定义“误差”或者“残差”。 对单个样本: 第i层的权重W[i]维度的行等于i层神经元的个数,列等于i-1层神经元的个数;第i层常数项b[i]b[i]维度的行等于i层神经 阅读全文
摘要:
1使用以下模型解决分类问题时,一般情况下对输入数据内的噪音、离群点(outlier)最敏感的是? Adaboost 软间隔SVM Lasso 随机森林 答案A 说明:随机森林受异常点影响较小,这是有决策树性质决定的。异常点对SVM和Lasso都会有一定的影响,但是影响最大的还是Adaboost,因为 阅读全文
摘要:
机器学习(8) -- 降维 核心思想:将数据沿方差最大方向投影,数据更易于区分 简而言之:PCA算法其表现形式是降维,同时也是一种特征融合算法。 对于正交属性空间(对2维空间即为直角坐标系)中的样本点,如何用一个超平面(直线/平面的高维推广)对所有样本进行恰当的表达? 事实上,若存在这样的超平面,那 阅读全文
摘要:
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 总结: 离线评估:经常使用的有准确率(accuracy)、精确率-召回率(precision-recall) 在线评估:一般使用一些商业评价指标,如用户生命周期值(customer lifeti 阅读全文
摘要:
1.决策树 :监督学习 决策树是一种依托决策而建立起来的一种树。 在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。 决策树仅有 阅读全文