白婷 - 博客园

2016年3月6日

摘要： Libliner 中的-s 参数选择：primal 和dual LIBLINEAR的优化算法主要分为两大类，即求解原问题(primal problem)和对偶问题(dual problem)。求解原问题使用的是TRON的优化算法，对偶问题使用的是Coordinate Descent优化算法。总的来说阅读全文

posted @ 2016-03-06 11:52 白婷阅读(3655) 评论(0) 推荐(0)

2016年3月4日

GBDT（MART）迭代决策树简介

摘要：以下对GBDT的介绍深入浅出，非常易懂转自：http://blog.csdn.net/w28971023/article/details/8240756 GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regressi 阅读全文

posted @ 2016-03-04 17:12 白婷阅读(322) 评论(0) 推荐(0)

2016年3月3日

coursera 公开课文本挖掘和分析（text mining and analytics） week 1 笔记

摘要：一、课程简介： text mining and analytics 是一门在coursera上的公开课，由美国伊利诺伊大学香槟分校（UIUC）计算机系教授 chengxiang zhai 讲授，公开课链接：https://class.coursera.org/textanalytics-001/wi 阅读全文

posted @ 2016-03-03 23:40 白婷阅读(2607) 评论(0) 推荐(1)

2016年3月2日

Predicting purchase behavior from social media-www2013

摘要： 1、Information publication：www2013 author:Yongzheng Zhang 2、What 用社交媒体用户特征预测用户购买商品类别（排序问题） 3、Dataset facebook-ebay 4、How input: facebook 用户特征（demograp 阅读全文

posted @ 2016-03-02 16:13 白婷阅读(249) 评论(0) 推荐(0)

Recommending branded products from social media -RecSys 2013-20160422

摘要： 1、Information publication：RecSys 2013 author:zhengyong zhang 2、What 是对上一篇论文的拓展：利用社交媒体中用户信息对用户购买的类别排序；再由预测出的类别，做商品品牌的推荐 3、Dataset Facebook-Eaby 4、How 阅读全文

posted @ 2016-03-02 15:21 白婷阅读(217) 评论(0) 推荐(0)

2016年数据挖掘，机器学习可投会议

摘要：相关会议及时间阅读全文

posted @ 2016-03-02 15:16 白婷阅读(217) 评论(0) 推荐(0)

2016年2月29日

java 中遍历hashmap 和hashset 的方法

摘要：一、java中遍历hashmap: 一、java中遍历hashmap: for (Map.Entry<String, Integer> entry : tempMap.entrySet()) { String key = entry.getKey().toString(); String value 阅读全文

posted @ 2016-02-29 11:01 白婷阅读(408) 评论(0) 推荐(0)

2016年2月28日

NLPIR分词工具的使用（java环境下）

摘要：一、NLPIR是什么？ NLPIR(汉语分词系统)由中科大张华平博士团队开发，主要功能包括：中文分词，词性标注，命名实体识别，用户词典功能，详情见官网：http://ictclas.nlpir.org/。二、java环境下的使用：主要参考了如下资料：http://www.360doc.com/c 阅读全文

posted @ 2016-02-28 09:35 白婷阅读(3663) 评论(1) 推荐(0)

2016年2月26日

机器学习中的相似性度量

摘要：机器学习中的相似性度量转自：http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html，感谢分享！在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement)，这时通常采用的方法就是计算样本间的“距离阅读全文

posted @ 2016-02-26 19:36 白婷阅读(444) 评论(0) 推荐(0)

2016年1月23日

doc2vec使用说明（一）gensim工具包TaggedLineDocument

摘要： gensim 是处理文本的很强大的工具包，基于python环境下： 1.gensim可以做什么？它可以完成的任务，参加gensim 主页API中给出的介绍，链接如下： http://radimrehurek.com/gensim/apiref.html 2.word2vec的使用其中学习词向量的阅读全文

posted @ 2016-01-23 19:44 白婷阅读(8537) 评论(0) 推荐(0)

白婷的博客

知乎: https://www.zhihu.com/people/bai-bai-87-80-88

公告