摘要:
最近在做一个CNN的项目,文件夹里有20w张图片要读入并保存到一个data文件(不然每次都读20w文件太麻烦)。 折腾了一个下午,发现了一个极好用的包 h5py:将数据储存在hdf5文件中。 这东西有多好用呢? 速度,内存占用,压缩程度都比cPickle+gzip来的优秀。 相比之下上面两个变逗比了 阅读全文
摘要:
(3)在逻辑回归中的应用。 由于交叉熵是衡量两个分布之间的相似度,在逻辑回归中,首先数据集真实的分布是p,通过逻辑回归模型预测出来的结果对应的分布是q,此时交叉熵在这里就是衡量预测结果q与真实结果p之间的差异程度,称之为交叉熵损失函数。具体如下: 假设,对应两分类的逻辑回归模型logistic re 阅读全文
摘要:
range()返回的是range object,而np.nrange()返回的是numpy.ndarray() range尽可用于迭代,而np.nrange作用远不止于此,它是一个序列,可被当做向量使用。 range()不支持步长为小数,np.arange()支持步长为小数 两者都可用于迭代 两者都 阅读全文
摘要:
简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项。线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算。 使用sklearn.linear_m 阅读全文