dwSun

一个很正经的IT工作者
中国非著名人工智能表演艺术家

导航

2019年2月18日 #

将博客搬至CSDN

摘要: 2019 02 18 dwSun博客正式搬家至csdn。 阅读全文

posted @ 2019-02-18 17:09 dwSun 阅读(183) 评论(0) 推荐(0) 编辑

2019年2月17日 #

docker的安装和简单配置

摘要: docker的安装和简单配置 docker是balabalabala...懒得介绍。 国内安装docker很蛋疼,按照官方配置好了软件源之后,几十MB的安装文件下载要半天,没办法,docker默认的软件源是在国外的,速度很慢。幸好国内有docker软件源镜像,注意这里说的是软件源镜像,也就是deb系 阅读全文

posted @ 2019-02-17 15:12 dwSun 阅读(519) 评论(0) 推荐(0) 编辑

conda国内源的设置 by dwSun

摘要: conda国内源的设置 by dwSun anaconda是一个balabalabala... 知道这个软件的人肯定不用介绍,不知道的也不必介绍。 conda是anaconda的包管理器,通过conda可以从软件源中下载用户制定的软件及其依赖软件并在用户的系统上进行安装。 这里要说的是,conda的 阅读全文

posted @ 2019-02-17 11:40 dwSun 阅读(7704) 评论(0) 推荐(0) 编辑

2019年2月13日 #

dwSun带你选Python的编辑器/IDE

摘要: dwSun带你选Python的编辑器/IDE Python 是一门简单易学,同时又十分强大的编程语言。特别是随着人工智能的热潮,Python作为AI开发的首选语言,已经是技术人员的必备技能。 在学习和开发的过程当中,一款趁手的编辑器/IDE犹如神兵利器,必能让使用者效率飞升,事半功倍。 这里列举一些 阅读全文

posted @ 2019-02-13 12:50 dwSun 阅读(489) 评论(0) 推荐(0) 编辑

2019年1月2日 #

ubuntu中文乱码解决

摘要: 首先,安装中文支持包language pack zh hans: 然后,修改/etc/environment(在文件的末尾追加): 再修改/var/lib/locales/supported.d/local(没有这个文件就新建,同样在末尾追加): 最后,执行命令: 对于中文乱码是空格的情况,安装中文 阅读全文

posted @ 2019-01-02 14:14 dwSun 阅读(162) 评论(0) 推荐(0) 编辑

2018年9月18日 #

解决matplotlib中文显示

摘要: 网上搜的很多方法都不是很好用,这里找到了一个比较好用的办法。 首先将win上的中文字体复制到linux目录下面,我这里使用的是simhei.ttf。然后参考如下代码的使用方式: 阅读全文

posted @ 2018-09-18 11:02 dwSun 阅读(360) 评论(0) 推荐(0) 编辑

2018年7月30日 #

1506.01186-Cyclical Learning Rates for Training Neural Networks

摘要: 1506.01186 Cyclical Learning Rates for Training Neural Networks 论文中提出了一种循环调整学习率来训练模型的方式。 如下图: 通过循环的线性调整学习率,论文作者观察到的一种比较典型的曲线如下图: 图中,使用循环调整方式的模型,虽然训练中准 阅读全文

posted @ 2018-07-30 21:13 dwSun 阅读(947) 评论(0) 推荐(0) 编辑

2018年7月11日 #

1503.02531-Distilling the Knowledge in a Neural Network.md

摘要: 原来交叉熵还有一个tempature,这个tempature有如下的定义: $$ q_i=\frac{e^{z_i/T}}{\sum_j{e^{z_j/T}}} $$ 其中T就是tempature,一般这个T取值就是1,如果提高: 也就是 Using a higher value for T pro 阅读全文

posted @ 2018-07-11 23:06 dwSun 阅读(255) 评论(0) 推荐(0) 编辑

2018年7月5日 #

1804.03235-Large scale distributed neural network training through online distillation.md

摘要: 现有分布式模型训练的模式 分布式SGD 并行SGD: 大规模训练中,一次的最长时间取决于最慢的机器 异步SGD: 不同步的数据,有可能导致权重更新向着未知方向 并行多模型 :多个集群训练不同的模型,再组合最终模型,但是会消耗inference运行时 蒸馏:流程复杂 student训练数据集的选择 u 阅读全文

posted @ 2018-07-05 23:40 dwSun 阅读(611) 评论(0) 推荐(0) 编辑

2018年5月24日 #

mysql导入太慢解决方法

摘要: 半调子数据科学家又要折腾数据,拿到数据一看,3.6G的zip文件,解压看看,卧槽12个G的sql文件。好吧,又要折腾sql数据了。第一件事,肯定是搭一个数据库,导入数据咯。 折腾过sql导入的亲们都知道,mysql默认的参数,导入的速度还是很慢的,特别是数据忒多的情况。这次的数据,折腾完了之后,有1 阅读全文

posted @ 2018-05-24 22:11 dwSun 阅读(3655) 评论(0) 推荐(0) 编辑