随笔分类 -  Programming

摘要:指定分隔符 HIVE输出到文件的分隔符 ,列与列之间是'\1'(ASCII码1,在vim里显示为^A),列内部随着层数增加,分隔符依次为'\2','\3','\4'等。 例:输出为map, array, int类型,则分隔符为: key1 \3 value1 \2 key2 \3 value2 .. 阅读全文
posted @ 2018-12-03 13:58 JeromeBlog 阅读(1236) 评论(0) 推荐(0) 编辑
摘要:写机器学习相关博文,经常会碰到很多公式,而Latex正式编辑公式的利器。目前国内常用的博客系统,好像只有博客园支持,所以当初选择落户博客园。我现在基本都是用Latex写博文,然后要发表到博客园上与大家共享,就又得经历一番功夫:首先,将Latex源码拷贝到博文的HTML源码编辑器中;然后,修改... 阅读全文
posted @ 2014-11-24 23:55 JeromeBlog 阅读(17148) 评论(2) 推荐(0) 编辑
摘要:Markov Chain马尔科夫链(Markov chain)是一个具有马氏性的随机过程,其时间和状态参数都是离散的。马尔科夫链可用于描述系统在状态空间中的各种状态之间的转移情况,其中下一个状态仅依赖于当前状态。因为系统是随机变化的,所以不可能百分百预测出未来某个时刻的系统状态,但是我们可以预测出未... 阅读全文
posted @ 2014-07-09 00:23 JeromeBlog 阅读(2907) 评论(0) 推荐(1) 编辑
摘要:Gradient Descent机器学习中很多模型的参数估计都要用到优化算法,梯度下降是其中最简单也用得最多的优化算法之一。梯度下降(Gradient Descent)[3]也被称之为最快梯度(Steepest Descent),可用于寻找函数的局部最小值。梯度下降的思路为,函数值在梯度反方向下降是... 阅读全文
posted @ 2014-06-21 15:28 JeromeBlog 阅读(4056) 评论(2) 推荐(0) 编辑
摘要:图形是呈现数据的一种直观方式,在用Matlab进行数据处理和计算后,我们一般都会以图形的形式将结果呈现出来。尤其在论文的撰写中,优雅的图形无疑会为文章加分。本篇文章非完全原创,我的工作就是把见到的Matlab绘图代码收集起来重新跑一遍,修改局部错误,然后将所有的图贴上来供大家参考。大家可以先看图,有... 阅读全文
posted @ 2013-10-31 16:18 JeromeBlog 阅读(40911) 评论(3) 推荐(15) 编辑
摘要:在求最优解时,前面很多地方都用梯度下降(Gradient Descent)的方法,但由于最优步长很难确定,可能会出现总是在最优解附近徘徊的情况,致使最优解的搜索过程很缓慢。牛顿法(Newton's Method)在最优解的搜索方面有了较大改进,它不仅利用了目标函数的一阶导数,还利用了搜索点处的二阶导... 阅读全文
posted @ 2013-10-30 09:12 JeromeBlog 阅读(1256) 评论(4) 推荐(0) 编辑