04 2019 档案
TensorFlow从1到2(十)带注意力机制的神经网络机器翻译
摘要:基本概念 机器翻译和语音识别是最早开展的两项人工智能研究。今天也取得了最显著的商业成果。 早先的机器翻译实际脱胎于电子词典,能力更擅长于词或者短语的翻译。那时候的翻译通常会将一句话打断为一系列的片段,随后通过复杂的程序逻辑对每一个片段进行翻译,最终组合在一起。所得到的翻译结果应当说似是而非,最大的问
阅读全文
TensorFlow从1到2(九)迁移学习
摘要:迁移学习基本概念 迁移学习是这两年比较火的一个话题,主要原因是在当前的机器学习中,样本数据的获取是成本最高的一块。而迁移学习可以有效的把原有的学习经验(对于模型就是模型本身及其训练好的权重值)带入到新的领域,从而不需要过多的样本数据,也能达到大批量数据所达成的效果,进一步节省了学习的计算量和时间。
阅读全文
TensorFlow从1到2(八)过拟合和欠拟合的优化
摘要:"《从锅炉工到AI专家(6)》" 一文中,我们把神经网络模型降维,简单的在二维空间中介绍了过拟合和欠拟合的现象和解决方法。但是因为条件所限,在该文中我们只介绍了理论,并没有实际观察现象和应对。 现在有了TensorFLow 2.0 / Keras的支持,可以非常容易的构建模型。我们可以方便的人工模拟
阅读全文
TensorFlow从1到2(七)线性回归模型预测汽车油耗以及训练过程优化
摘要:线性回归模型 “回归”这个词,既是Regression算法的名称,也代表了不同的计算结果。当然结果也是由算法决定的。 不同于前面讲过的多个分类算法或者逻辑回归,线性回归模型的结果是一个连续的值。 实际上我们第一篇的房价预测就属于线性回归算法,如果把这个模型用于预测,结果是一个连续值而不是有限的分类。
阅读全文
TensorFlow从1到2(六)结构化数据预处理和心脏病预测
摘要:结构化数据的预处理 前面所展示的一些示例已经很让人兴奋。但从总体看,数据类型还是比较单一的,比如图片,比如文本。 这个单一并非指数据的类型单一,而是指数据组成的每一部分,在模型中对于结果预测的影响基本是一致的。 更通俗一点说,比如在手写数字识别的案例中,图片坐标(10,10)的点、(14,14)的点
阅读全文
TensorFlow从1到2(五)图片内容识别和自然语言语义识别
摘要:Keras内置的预定义模型 上一节我们讲过了完整的保存模型及其训练完成的参数。 Keras中使用这种方式,预置了多个著名的成熟神经网络模型。当然,这实际是Keras的功劳,并不适合算在TensorFlow 2.0头上。 当前TensorFlow 2.0 alpha版本捆绑的Keras中包含: den
阅读全文
TensorFlow从1到2(四)时尚单品识别和保存、恢复训练数据
摘要:Fashion Mnist 一个图片识别的延伸案例 在TensorFlow官方新的教程中,第一个例子使用了由MNIST延伸而来的新程序。 这个程序使用一组时尚单品的图片对模型进行训练,比如T恤(T shirt)、长裤(Trouser),训练完成后,对于给定图片,可以识别出单品的名称。 程序同样将所有
阅读全文
TensorFlow从1到2(三)数据预处理和卷积神经网络
摘要:数据集及预处理 从这个例子开始,相当比例的代码都来自于 "官方新版文档" 的示例。开始的几个还好,但随后的程序都将需要大量的算力支持。Google Colab是一个非常棒的云端实验室,提供含有TPU/GPU支持的Python执行环境(需要在Edit→Notebook Settings设置中打开)。速
阅读全文
TensorFlow从1到2(二)续讲从锅炉工到AI专家
摘要:图片样本可视化 "原文第四篇" 中,我们介绍了官方的入门案例MNIST,功能是识别手写的数字0 9。这是一个非常基础的TensorFlow应用,地位相当于通常语言学习的"Hello World!"。 我们先不进入TensorFlow 2.0中的MNIST代码讲解,因为TensorFlow 2.0在K
阅读全文
TensorFlow从1到2(一)续讲从锅炉工到AI专家
摘要:引言 原来引用过一个段子,这里还要再引用一次。是关于苹果的。大意是,苹果发布了新的开发语言Swift,有非常多优秀的特征,于是很多时髦的程序员入坑学习。不料,经过一段头脑体操一般的勤学苦练,发现使用Swift做开发,不仅要学习Swift,还要学习Swift2、Swift3、Swift4... 后来我
阅读全文