08 2018 档案

摘要:声明:本文引用自毕业于中国科学院计算技术研究所的刘昕博士 编程语言与DL框架的选择 当然,作为开发者,想要去实现一个模型,绕不开的问题便是: 应该选择什么语言?应该选择什么框架? 对于开发人员而言,语言的选择其实不是问题。但作为入门,最为理所当然的建议则是Python,原因也非常简单:Python最 阅读全文

posted @ 2018-08-27 10:35 Charlie_ODD 阅读(8254) 评论(3) 推荐(1) 编辑

摘要:1- 线性回归 2 - 逻辑回归 3 - 线性判别分析 4 - 决策树 5 - 随机森林算法 6 - SVM 7 - 朴素贝叶斯 8 - K最近邻算法 9 - K均值算法 10-Adaboost 算法 11--马尔可夫 1- 线性回归 预测建模主要关注的是如何最小化模型的误差,或是如何在一个可解释性 阅读全文

posted @ 2018-08-24 17:04 Charlie_ODD 阅读(355) 评论(0) 推荐(0) 编辑

摘要:核心库 1. NumPy (提交数: 15980, 贡献者数: 522) 当开始处理Python中的科学任务,Python的SciPy Stack肯定可以提供帮助,它是专门为Python中科学计算而设计的软件集合(不要混淆SciPy库,它是SciPy Stack的一部分,和SciPy Stack的社 阅读全文

posted @ 2018-08-22 16:24 Charlie_ODD 阅读(544) 评论(0) 推荐(0) 编辑

摘要:一、计算机科学期刊介绍 (1)Journal of the ACM(JACM) 此刊物为ACM的官方学刊,受到最广泛的尊敬。但由于该刊宣称它只刊登那些对计算机科学有长远影响的论文,因此其不可避免地具有理论歧视(theory bias)。事实上确实如此:尽管JACM征稿范围包括了计算机的绝大部分领域, 阅读全文

posted @ 2018-08-22 15:00 Charlie_ODD 阅读(1870) 评论(0) 推荐(0) 编辑

摘要:在我们机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题,但是,一开始我们的模型往往是欠拟合的,也正是因为如此才有了优化的空间,我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了,这个问题也在学术界讨论的比较多。 首先就是我们在进行模型训练 阅读全文

posted @ 2018-08-20 16:37 Charlie_ODD 阅读(705) 评论(0) 推荐(0) 编辑

摘要:学习的种类 1.监督学习 (1)定义:指有求知欲的学生从老师那里获取知识、信息,老师提供对错指示、告知最终答案的学习过程。 在机器学习中,计算机 = 学生,周围的环境 = 老师。 (2)最终目标:根据在学习过程中获得的经验技能,对没学习过的问题也可以做出正确解答,使计算机获得这种泛化能力。 (3)应 阅读全文

posted @ 2018-08-20 10:39 Charlie_ODD 阅读(1831) 评论(0) 推荐(0) 编辑

摘要:27种?!神经网络竟有那么多种?这篇文章将逐一介绍下面这张图片中的27种神经网络类型,并尝试解释如何使用它们。准备好了吗?让我们开始吧! 神经网络的种类越来越多,可以说是在呈指数级地增长。我们需要一个一目了然的图表,在这些新出现的网络构架和方法之间进行导航。 幸运的是,来自Asimov研究所的Fjo 阅读全文

posted @ 2018-08-20 10:30 Charlie_ODD 阅读(2285) 评论(0) 推荐(0) 编辑

摘要:1. 忘了数据规范化 2. 没有检查结果 3. 忘了数据预处理 4. 忘了正则化 5. 设置了过大的批次大小 6. 使用了不适当的学习率 7. 在最后一层使用了错误的激活函数 8. 网络含有不良梯度 9. 没有正确地初始化网络权重 10. 神经网络太深了 11. 隐藏unit的数量不对 12.补充 阅读全文

posted @ 2018-08-19 16:48 Charlie_ODD 阅读(285) 评论(0) 推荐(0) 编辑

摘要:37 Reasons why your Neural Network is not working Neural Network Check List 如何使用这个指南 数据问题 检查输入数据 试一下随机输入 检查数据加载单元 确保输入和输出是一一对应的 输入和输出之间的关系映射的随机性会不会太强了 阅读全文

posted @ 2018-08-18 12:23 Charlie_ODD 阅读(238) 评论(0) 推荐(0) 编辑

摘要:前言: Batch Normalization是深度学习领域在2015年非常热门的一个算法,许多网络应用该方法进行训练,并且取得了非常好的效果。 众所周知,深度学习是应用随机梯度下降法对网络进行训练,尽管随机梯度下降训练神经网络非常有效,但是它有一个缺点,就是需要人为的设定很多参数,比如学习率,权重 阅读全文

posted @ 2018-08-16 15:57 Charlie_ODD 阅读(242) 评论(0) 推荐(0) 编辑

摘要:1. 随机森林优缺点 随机森林(RF)是Bagging的一个扩展变体。RF在以决策树为基分类器进行集成的基础上,进一步在决策树的训练过程中引入了随机属性选择。 Bagging就是对数据集训练多个基分类器,然后将基分类器得到的结果进行投票表决作为最终分类的结果。基分类器在构建过程中需要尽可能保证训练出 阅读全文

posted @ 2018-08-16 15:36 Charlie_ODD 阅读(2662) 评论(0) 推荐(1) 编辑

摘要:通常过拟合由以下三种原因产生: 1. 假设过于复杂;2. 数据存在很多噪音;3. 数据规模太小。 过拟合的解决方法通常有: 1. early stopping;2. 数据集扩增;3. 正则化;4. Dropout。 Early stopping: 对模型的训练过程就是对模型参数的进行学习更新的过程。 阅读全文

posted @ 2018-08-16 15:24 Charlie_ODD 阅读(559) 评论(0) 推荐(1) 编辑

摘要:损失函数 损失函数(loss function)也叫代价函数(cost function)。是神经网络优化的目标函数,神经网络训练或者优化的过程就是最小化损失函数的过程(损失函数值小了,对应预测的结果和真实结果的值就越接近 1、二次代价函数 二次代价函数就是欧式距离的和,在线性回归中用的比较多,但在 阅读全文

posted @ 2018-08-16 14:50 Charlie_ODD 阅读(2856) 评论(1) 推荐(1) 编辑

摘要:1、sigmoid 函数曲线如下: sigmoid激活函数,符合实际,当输入值很小时,输出接近于0;当输入值很大时,输出值接近于1。 sigmod函数曾经是比较流行的,它可以想象成一个神经元的放电率,在中间斜率比较大的地方是神经元的敏感区,在两边斜率很平缓的地方是神经元的抑制区。当然,流行也是曾经流 阅读全文

posted @ 2018-08-16 14:27 Charlie_ODD 阅读(545) 评论(0) 推荐(0) 编辑

摘要:2-1、标量 一个标量就是一个单独的数,一般用小写的的变量名称表示。 2-2、向量 一个向量就是一列数,这些数是有序排列的。用过次序中的索引,我们可以确定每个单独的数。通常会赋予向量粗体的小写名称。当我们需要明确表示向量中的元素时,我们会将元素排列成一个方括号包围的纵柱:我们可以把向量看作空间中的点 阅读全文

posted @ 2018-08-15 15:01 Charlie_ODD 阅读(476) 评论(0) 推荐(0) 编辑

摘要:四、信息论 信息论是应用数学的一个分支,主要研究的是对一个信号能够提供信息的多少进行量化。如果说概率使我们能够做出不确定性的陈述以及在不确定性存在的情况下进行推理,那信息论就是使我们能够量化概率分布中不确定性的总量。 1948年,香农引入信息熵,将其定义为离散随机事件的出现概率。一个系统越是有序,信 阅读全文

posted @ 2018-08-15 14:51 Charlie_ODD 阅读(1798) 评论(0) 推荐(0) 编辑

摘要:3-1、为什么使用概率? 概率论是用于表示不确定性陈述的数学框架,即它是对事物不确定性的度量。 在人工智能领域,我们主要以两种方式来使用概率论。首先,概率法则告诉我们AI系统应该如何推理,所以我们设计一些算法来计算或者近似由概率论导出的表达式。其次,我们可以用概率和统计从理论上分析我们提出的AI系统 阅读全文

posted @ 2018-08-15 14:49 Charlie_ODD 阅读(1188) 评论(0) 推荐(0) 编辑

摘要:1.微积分 2.线性代数 3.概率与统计 4.数值计算 阅读全文

posted @ 2018-08-15 14:46 Charlie_ODD 阅读(269) 评论(0) 推荐(0) 编辑

摘要:1.人工智能入门简介及行业分析 阅读全文

posted @ 2018-08-15 14:42 Charlie_ODD 阅读(142) 评论(0) 推荐(0) 编辑

摘要:1.Tensorflow一些常用基本概念与函数(1) 阅读全文

posted @ 2018-08-15 14:33 Charlie_ODD 阅读(129) 评论(0) 推荐(0) 编辑

摘要:随着2016年Alpha Go在围棋击败李世石,2017年初卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰。人工智能已经不再是在各大公司幕后提供各种智能推荐、语音识别算法的工具,它已经慢慢走向台前进入到平常百姓的 阅读全文

posted @ 2018-08-13 10:23 Charlie_ODD 阅读(236) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示