摘要: 其实2017年寒假时就已经给新学期定好了必须完成的计划:一篇论文(已发)+ 暑期实习(腾讯网媒产品技术部)。 当时就做好了心理和身体的双重准备,接下来就是撸起袖子好好干了。其实我也做好了无法完成任务的准备。论文的任务应该还是比较胸有成竹的,毕竟idea已经有了,等开学做好实验就OK(但还是没想到做完 阅读全文
posted @ 2017-05-08 21:51 闷头雪IT 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 项目正式开始时间:2015.10.15. 随笔内容:本次项目的主题是基于Spark的ML。对于ML的学习有大概半年了,正好在网上关注到了由上海交通大学所主办的这个飞谷云的大数据项目,我所报名的这期已经是飞谷云的第六期了,在网上和群里了解了一段时间后大算报名参与一次,毕竟之前没有参与过真正的项目开发... 阅读全文
posted @ 2015-10-19 20:59 闷头雪IT 阅读(1034) 评论(6) 推荐(0) 编辑
摘要: 引言 梯度下降法 (Gradient Descent Algorithm,GD) 是为目标函数J(θ),如代价函数(cost function), 求解全局最小值(Global Minimum)的一种迭代算法。 为什么使用梯度下降法 为什么使用梯度下降法 我们使用梯度下降法最小化目标函数J(θ)。在 阅读全文
posted @ 2017-04-10 10:10 闷头雪IT 阅读(1755) 评论(0) 推荐(0) 编辑
摘要: 1.线性模板和最小平方 ·线性回归也可用于简单的分类,boundary虽然简单,但模型势必不准确。 ·存在问题: ESL P13:两种场景 ·scikit-learn: LinearModel.LinearRegression() class LinearRegression(LinearModel 阅读全文
posted @ 2016-03-05 11:53 闷头雪IT 阅读(181) 评论(0) 推荐(0) 编辑
摘要: ·什么是数据仓库?数据仓库(一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于企业或组织的决策分析处理)。·数据仓库的结构和建立过程:数据源(Sq,文档,其他)-----抽取、转换、装载----> 数据存储和管理--------->数据仓库引擎-------->前段展示·什么是Hiv... 阅读全文
posted @ 2015-10-19 19:20 闷头雪IT 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 随笔说明:由于参加了上海交大组织的飞谷云项目,而且报名第三组:基于Spark的机器学习。于是打算先花时间把Spark的基础学习学习。这次学习的参考书选择的是Spark的官方文档(这个肯定是最权威的)和机械工业的《Spark大数据处理 技术、应用与性能优化》;届时肯定还有项目组提供的学习资料。1.S... 阅读全文
posted @ 2015-10-07 19:42 闷头雪IT 阅读(339) 评论(0) 推荐(0) 编辑