摘要: Libliner 中的-s 参数选择:primal 和dual LIBLINEAR的优化算法主要分为两大类,即求解原问题(primal problem)和对偶问题(dual problem)。求解原问题使用的是TRON的优化算法,对偶问题使用的是Coordinate Descent优化算法。总的来说 阅读全文
posted @ 2016-03-06 11:52 白婷 阅读(3578) 评论(0) 推荐(0) 编辑
摘要: 以下对GBDT的介绍深入浅出,非常易懂 转自:http://blog.csdn.net/w28971023/article/details/8240756 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regressi 阅读全文
posted @ 2016-03-04 17:12 白婷 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 一、课程简介: text mining and analytics 是一门在coursera上的公开课,由美国伊利诺伊大学香槟分校(UIUC)计算机系教授 chengxiang zhai 讲授,公开课链接:https://class.coursera.org/textanalytics-001/wi 阅读全文
posted @ 2016-03-03 23:40 白婷 阅读(2540) 评论(0) 推荐(1) 编辑
摘要: 1、Information publication:www2013 author:Yongzheng Zhang 2、What 用社交媒体用户特征 预测用户购买商品类别(排序问题) 3、Dataset facebook-ebay 4、How input: facebook 用户特征(demograp 阅读全文
posted @ 2016-03-02 16:13 白婷 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 1、Information publication:RecSys 2013 author:zhengyong zhang 2、What 是对上一篇论文的拓展:利用社交媒体中用户信息 对用户购买的类别排序;再由预测出的类别,做商品品牌的推荐 3、Dataset Facebook-Eaby 4、How 阅读全文
posted @ 2016-03-02 15:21 白婷 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 相关会议及时间 阅读全文
posted @ 2016-03-02 15:16 白婷 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 一、java中遍历hashmap: 一、java中遍历hashmap: for (Map.Entry<String, Integer> entry : tempMap.entrySet()) { String key = entry.getKey().toString(); String value 阅读全文
posted @ 2016-02-29 11:01 白婷 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 一、NLPIR是什么? NLPIR(汉语分词系统)由中科大张华平博士团队开发,主要功能包括:中文分词,词性标注,命名实体识别,用户词典功能,详情见官网:http://ictclas.nlpir.org/。 二、java环境下的使用: 主要参考了如下资料:http://www.360doc.com/c 阅读全文
posted @ 2016-02-28 09:35 白婷 阅读(3620) 评论(1) 推荐(0) 编辑
摘要: 机器学习中的相似性度量 转自:http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html,感谢分享! 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离 阅读全文
posted @ 2016-02-26 19:36 白婷 阅读(429) 评论(0) 推荐(0) 编辑
摘要: gensim 是处理文本的很强大的工具包,基于python环境下: 1.gensim可以做什么? 它可以完成的任务,参加gensim 主页API中给出的介绍,链接如下: http://radimrehurek.com/gensim/apiref.html 2.word2vec的使用 其中学习词向量的 阅读全文
posted @ 2016-01-23 19:44 白婷 阅读(8494) 评论(0) 推荐(0) 编辑