06 2018 档案

摘要:1、怎么证明凸函数, 二阶Hessian矩阵半正定,函数为凸函数 证明参考:https://math.stackexchange.com/questions/946156/proving-convexity-of-a-function-whose-hessian-is-positive-semide 阅读全文
posted @ 2018-06-25 10:23 zhaop 阅读(249) 评论(0) 推荐(0) 编辑
摘要:总结的很棒! https://xijunlee.github.io/2017/06/03/%E9%9B%86%E6%88%90%E5%AD%A6%E4%B9%A0%E6%80%BB%E7%BB%93/ 1、随机森林 https://www.cnblogs.com/maybe2030/p/458570 阅读全文
posted @ 2018-06-23 14:17 zhaop 阅读(273) 评论(0) 推荐(0) 编辑
摘要:1、词集模型 将每个词的出现与否作为一个特征,不考虑词频。也就是一个词在文本在文本中出现1次和多次特征处理是一样的。 2、词袋模型 与词集相比,会考虑词频 sklearn中 CountVectorizer与 CountVectorizer: 会以每一个词作为特征,求出每一个词的词频 http://w 阅读全文
posted @ 2018-06-19 15:09 zhaop 阅读(150) 评论(0) 推荐(0) 编辑
摘要:1、Bike Sharing Demand kaggle: https://www.kaggle.com/c/bike-sharing-demand 目的:根据日期、时间、天气、温度等特征,预测自行车的租借量 处理:1、将日期(含年月日时分秒)提取出年,月, 星期几,以及小时 2、season, w 阅读全文
posted @ 2018-06-19 10:59 zhaop 阅读(406) 评论(0) 推荐(0) 编辑
摘要:1、选择对象 1.选择特定列和行的数据 a['x'] 那么将会返回columns为x的列,注意这种方式一次只能返回一个列。a.x与a['x']意思一样。 取行数据,通过切片[]来选择 如:a[0:3] 则会返回前三行的数据。 2.loc是通过标签来选择数据 a.loc['one']则会默认表示选取行 阅读全文
posted @ 2018-06-19 10:00 zhaop 阅读(152) 评论(0) 推荐(0) 编辑
摘要:1、EM算法 2、混合高斯模型 阅读全文
posted @ 2018-06-18 13:59 zhaop 阅读(223) 评论(0) 推荐(0) 编辑
摘要:在特征工程下面,还有许多的子问题,主要包括:Feature Selection(特征选择)、Feature Extraction(特征提取)和Feature construction(特征构造) 特征选择Feature Selection 1、过滤式选择 单纯地一个一个特征地去比较与 类别的关系。然 阅读全文
posted @ 2018-06-12 17:03 zhaop 阅读(194) 评论(0) 推荐(0) 编辑
摘要:k-means k-medoids 一、clustering 中的 loss function 关于聚类的性能评价标准 参考博客 可以为外部指标和内部指标,其中外部指标是指 聚类结果与某个 “参考模型" 进行表示, 内部指标直接考察聚类结果不参考模型 外部指标: 1、Jaccard系数 系属于相同类 阅读全文
posted @ 2018-06-12 13:49 zhaop 阅读(679) 评论(0) 推荐(0) 编辑
摘要:1、preprocessing 阅读全文
posted @ 2018-06-11 23:30 zhaop 阅读(133) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示