06 2014 档案
一个关于自定义类型作为HashMap的key的问题
摘要:在之前的项目需要用到以自定义类型作为HashMap的key,遇到一个问题:如果修改了已经存储在HashMap中的实例,会发生什么情况呢?用一段代码来试验:import java.util.HashMap;import java.util.Map;public class TestHashMap { ... 阅读全文
posted @ 2014-06-24 18:19 nanoix9 阅读(4704) 评论(7) 推荐(3) 编辑
简单分析Java的HashMap.entrySet()的实现
摘要:关于Java的HashMap.entrySet(),文档是这样描述的:这个方法返回一个Set,这个Set是HashMap的视图,对Map的操作会在Set上反映出来,反过来也是。原文是Returns a Set view of the mappings contained in this map. T... 阅读全文
posted @ 2014-06-16 13:37 nanoix9 阅读(6154) 评论(0) 推荐(1) 编辑
Hive的Transform功能
摘要:Hive的TRANSFORM关键字提供了在SQL中调用自写脚本的功能,适合实现Hive中没有的功能又不想写UDF的情况。例如,按日期统计每天出现的uid数,通常用如下的SQLSELECT date, count(uid)FROM xxxGROUP BY date但是,如果我想在reduce阶段对每天... 阅读全文
posted @ 2014-06-13 14:03 nanoix9 阅读(12114) 评论(0) 推荐(1) 编辑
随机分类器的ROC和Precision-recall曲线
摘要:随机分类器,也就是对于一个分类问题,随机猜测答案。理论上,随机分类器的性能是所有分类器的下界。对随机分类器的理解,可以帮助更好的理解分类器的性能指标。随机分类器的性能也可以作为评价分类器的一个基础。所以简单写了几行代码来研究一下随机分类器的性能。用的是scikit-learn包。这里产生了一个正负样... 阅读全文
posted @ 2014-06-04 16:58 nanoix9 阅读(10659) 评论(0) 推荐(0) 编辑