静悟生慧

2018年5月21日

摘要：问题的根本：windows读取文件可以用\，但在字符串里面\被作为转义字符使用， python在描述路径时有两种方式： 'd:\\a.txt'，转义的方式 r'd:\a.txt'，声明字符串不需要转义这样就实现了python在windows系统中用\来访问；其实这样比较麻烦的是不是，下面对几种情阅读全文

posted @ 2018-05-21 21:11 静悟生慧阅读(10176) 评论(0) 推荐(0) 编辑

2018年5月17日

算法/数据工程师必备技能

摘要：算法/数据工程师必备技能基础知识线性代数矩阵理论概率论随机过程图论数值分析最优化理论机器学习统计学习方法数据挖掘平台 Linux 语言 Python Linux shell 基础库 numpy pandas sklearn scipy matplotlib or seabor 阅读全文

posted @ 2018-05-17 22:12 静悟生慧阅读(278) 评论(0) 推荐(0) 编辑

2018年5月13日

使用caffe 的 python接口测试数据，选定GPU编号

摘要：这样，就可以在默认显卡被占用（第一块显卡）时，选择其他显卡进行测试了。阅读全文

posted @ 2018-05-13 16:13 静悟生慧阅读(567) 评论(0) 推荐(0) 编辑

2018年5月10日

交叉熵

摘要：交叉熵（Cross-Entropy）交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量？ 2.什么是熵？可以看出，当两种取值的可能性相等时，不确定度最大（此时没有任何先验知识），这个结论可以推广到多种取值的情况。在图中也可以看出，当p=0或1时，阅读全文

posted @ 2018-05-10 16:59 静悟生慧阅读(316) 评论(0) 推荐(0) 编辑

2018年5月8日

GoogLeNet模型的微调

摘要：我从零开始训练了GoogLeNet模型。但它没有给我带来希望的结果。作为替代，我想对我的数据集中的GoogLeNet模型进行微调。有谁知道我应该遵循什么步骤？我从零开始训练了GoogLeNet模型。但它没有给我带来希望的结果。作为替代，我想对我的数据集中的GoogLeNet模型进行微调。阅读全文

posted @ 2018-05-08 16:45 静悟生慧阅读(488) 评论(0) 推荐(0) 编辑

在训练CNN时，loss稳定在log(类别数)

摘要：参见知乎问题！ https://www.zhihu.com/question/275774218 很多框架都会有一个问题，当卷积 weight NaN 之后，卷积的 output 会变成 NaN。然后过了一个 FC，就变成正常的数字了，但是这时候所有 channel 的 output 值相同。建议阅读全文

posted @ 2018-05-08 16:15 静悟生慧阅读(2202) 评论(0) 推荐(0) 编辑

2018年5月6日

caffe 中如何打乱训练数据

摘要：第一：可以选择在将数据转换成lmdb格式时进行打乱；设置参数--shuffle=1；（表示打乱训练数据）默认为0，表示忽略，不打乱。打乱的目的有两个：防止出现过分有规律的数据，导致过拟合或者不收敛。在caffe中可能会使得，在模型进行测试时，每一个测试样本都输出相同的预测概率值。或者，直阅读全文

posted @ 2018-05-06 10:20 静悟生慧阅读(1182) 评论(0) 推荐(0) 编辑

2018年4月23日

numpy, pandas, scikit-learn cheat sheet (速查表)

摘要： 1. scikit-learn cheat sheet 官方链接如下：http://scikit-learn.org/stable/tutorial/machine_learning_map/ Often the hardest part of solving a machine learning 阅读全文

posted @ 2018-04-23 22:05 静悟生慧阅读(1214) 评论(0) 推荐(0) 编辑

2018年4月20日

海量数据处理方法总结

摘要：转：http://www.cnblogs.com/cobbliu/archive/2012/08/24/2654368.html 第一部分、十道海量数据处理面试题 1、海量日志数据，提取出某日访问百度次数最多的那个IP。此题，在我之前的一篇文章：十一、从头到尾彻底解析Hash表算法里头有所提到，当阅读全文

posted @ 2018-04-20 15:24 静悟生慧阅读(354) 评论(0) 推荐(1) 编辑

Python - pandas 数据分析

摘要： pandas: powerful Python data analysis toolkit 官方文档： http://pandas.pydata.org/pandas-docs/stable/ 1. 导入包pandas 2. 获取文件夹下文件名称 3. 读前几行文件(.csv文件) 4. 读取文件和阅读全文

posted @ 2018-04-20 11:20 静悟生慧阅读(273) 评论(0) 推荐(0) 编辑

公告