随笔分类 -  机器学习

人肉工程在机器学习实践中的作用
摘要:关于人肉工程,包括业务知识、领域知识,经验等,在实际的机器学习问题中的应用,是一个屡见不鲜的话题,典型的有苦逼的数据清洗、人肉特征工程等。大家都想把尽可能多的过程由机器自动完成,但是目前的状态是,大部分机器学习问题中,最困难也最重要的部分,还是依靠人的经验来生成特征。那么人的经验为什么重要,能否用机... 阅读全文
posted @ 2015-07-29 10:04 nanoix9 阅读(1971) 评论(3) 推荐(2) 编辑
随机分类器的ROC和Precision-recall曲线
摘要:随机分类器,也就是对于一个分类问题,随机猜测答案。理论上,随机分类器的性能是所有分类器的下界。对随机分类器的理解,可以帮助更好的理解分类器的性能指标。随机分类器的性能也可以作为评价分类器的一个基础。所以简单写了几行代码来研究一下随机分类器的性能。用的是scikit-learn包。这里产生了一个正负样... 阅读全文
posted @ 2014-06-04 16:58 nanoix9 阅读(10659) 评论(0) 推荐(0) 编辑