摘要:
https://blog.csdn.net/aspenstars/article/details/69605318 Python包含子目录中的模块方法比较简单,关键是能够在sys.path里面找到通向模块文件的路径。下面将具体介绍几种常用情况:(1)主程序与模块程序在同一目录下:如下面程序结构:`- 阅读全文
摘要:
再交过两次作业之后研一的生活就已经彻底结束了,前阵子学校里到处都是拍毕业照的学生,想想再过两年那一群留恋母校的人就是我们了。时光荏苒,岁月如歌,去年此时,我还陶冶在清华里,做着一枚假的清华学子,期待着自己的研究生生活,今天我却要在这里细数这一年做的事情,感慨时光飞逝,痛恨自己无能无力。 人的记忆真的 阅读全文
摘要:
1、怎么证明凸函数, 二阶Hessian矩阵半正定,函数为凸函数 证明参考:https://math.stackexchange.com/questions/946156/proving-convexity-of-a-function-whose-hessian-is-positive-semide 阅读全文
摘要:
总结的很棒! https://xijunlee.github.io/2017/06/03/%E9%9B%86%E6%88%90%E5%AD%A6%E4%B9%A0%E6%80%BB%E7%BB%93/ 1、随机森林 https://www.cnblogs.com/maybe2030/p/458570 阅读全文
摘要:
1、词集模型 将每个词的出现与否作为一个特征,不考虑词频。也就是一个词在文本在文本中出现1次和多次特征处理是一样的。 2、词袋模型 与词集相比,会考虑词频 sklearn中 CountVectorizer与 CountVectorizer: 会以每一个词作为特征,求出每一个词的词频 http://w 阅读全文
摘要:
1、Bike Sharing Demand kaggle: https://www.kaggle.com/c/bike-sharing-demand 目的:根据日期、时间、天气、温度等特征,预测自行车的租借量 处理:1、将日期(含年月日时分秒)提取出年,月, 星期几,以及小时 2、season, w 阅读全文
摘要:
1、选择对象 1.选择特定列和行的数据 a['x'] 那么将会返回columns为x的列,注意这种方式一次只能返回一个列。a.x与a['x']意思一样。 取行数据,通过切片[]来选择 如:a[0:3] 则会返回前三行的数据。 2.loc是通过标签来选择数据 a.loc['one']则会默认表示选取行 阅读全文
摘要:
在特征工程下面,还有许多的子问题,主要包括:Feature Selection(特征选择)、Feature Extraction(特征提取)和Feature construction(特征构造) 特征选择Feature Selection 1、过滤式选择 单纯地一个一个特征地去比较与 类别的关系。然 阅读全文
摘要:
k-means k-medoids 一、clustering 中的 loss function 关于聚类的性能评价标准 参考博客 可以为外部指标和内部指标,其中外部指标是指 聚类结果与某个 “参考模型" 进行表示, 内部指标直接考察聚类结果不参考模型 外部指标: 1、Jaccard系数 系属于相同类 阅读全文