01 2015 档案

推荐的有些东东
摘要:宗成庆的统计自然语言处理 第二版,里面有最大熵的介绍,非常专业,你一看就能明白 最大熵一个是模型的特征期望,一个是经验期望,经验期望是从训练数据中的得到的,模型期望要逼近经验期望,之后使用拉格朗日乘子算法求出模型的数学公式,就是那个指数公式http://www.cs.utexas.edu/~dana... 阅读全文

posted @ 2015-01-28 10:41 雨渐渐 阅读(115) 评论(0) 推荐(0) 编辑

shell 数组
摘要:http://www.cnblogs.com/chengmo/archive/2010/09/30/1839632.html 阅读全文

posted @ 2015-01-27 20:38 雨渐渐 阅读(86) 评论(0) 推荐(0) 编辑

shell awk
摘要:awk 传送参数echo "1 2 3 4 5"|awk -vistor=100 '{if(istor==100){print $0}}' 阅读全文

posted @ 2015-01-27 15:03 雨渐渐 阅读(131) 评论(0) 推荐(0) 编辑

json格式化工具
摘要:http://www.bejson.com/go.html?u=http://www.bejson.com/jsoneditoronline/ 阅读全文

posted @ 2015-01-26 15:34 雨渐渐 阅读(128) 评论(0) 推荐(0) 编辑

精确率与召回率
摘要:http://blog.csdn.net/taohuaxinmu123/article/details/9833001 阅读全文

posted @ 2015-01-13 15:17 雨渐渐 阅读(135) 评论(0) 推荐(0) 编辑

python机器学习库
摘要:http://scikit-learn.org/stable/install.html 阅读全文

posted @ 2015-01-12 15:56 雨渐渐 阅读(118) 评论(0) 推荐(0) 编辑

hadoop-streaming 配置之---参数分割
摘要:map:-D stream.map.output.field.separator=. 定义mapoutput字段的分隔符为. 用户可以自定义分隔符(除了默认的tab)-D stream.num.map.output.key.fields=4 第四个.前面的是key,后面的是value。如果该行.... 阅读全文

posted @ 2015-01-08 12:05 雨渐渐 阅读(620) 评论(0) 推荐(0) 编辑

关于\t
摘要:tail -n 10000 sample_dbl.txt | python sitemap.py | sort -k 1 -t $'\t' | python sitecombiner.py > 1.sorttail -n 10000 sample_dbl.txt | python sitemap.p... 阅读全文

posted @ 2015-01-04 20:23 雨渐渐 阅读(209) 评论(0) 推荐(0) 编辑

导航