摘要: 最近在做一个CNN的项目,文件夹里有20w张图片要读入并保存到一个data文件(不然每次都读20w文件太麻烦)。 折腾了一个下午,发现了一个极好用的包 h5py:将数据储存在hdf5文件中。 这东西有多好用呢? 速度,内存占用,压缩程度都比cPickle+gzip来的优秀。 相比之下上面两个变逗比了 阅读全文
posted @ 2017-10-01 19:45 liuxingbusi 阅读(2568) 评论(0) 推荐(0) 编辑
摘要: (3)在逻辑回归中的应用。 由于交叉熵是衡量两个分布之间的相似度,在逻辑回归中,首先数据集真实的分布是p,通过逻辑回归模型预测出来的结果对应的分布是q,此时交叉熵在这里就是衡量预测结果q与真实结果p之间的差异程度,称之为交叉熵损失函数。具体如下: 假设,对应两分类的逻辑回归模型logistic re 阅读全文
posted @ 2017-10-01 15:35 liuxingbusi 阅读(409) 评论(0) 推荐(0) 编辑
摘要: range()返回的是range object,而np.nrange()返回的是numpy.ndarray() range尽可用于迭代,而np.nrange作用远不止于此,它是一个序列,可被当做向量使用。 range()不支持步长为小数,np.arange()支持步长为小数 两者都可用于迭代 两者都 阅读全文
posted @ 2017-10-01 14:31 liuxingbusi 阅读(1698) 评论(0) 推荐(0) 编辑
摘要: 简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项。线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算。 使用sklearn.linear_m 阅读全文
posted @ 2017-10-01 00:11 liuxingbusi 阅读(2492) 评论(0) 推荐(0) 编辑