2019 年 1月 17 日随笔档案 - zhangqi0828

2019年1月17日

摘要：数据的特征选择数据的特征选择降维本质上是从一个维度空间映射到另一个维度空间，特征的多少别没有减少，当然在映射的过程中特征值也会相应的变化。举个例子，现在的特征是1000维，我们想要把它降到500维。降维的过程就是找个一个从1000维映射到500维的映射关系。原始数据中的1000个特征，每一个都对阅读全文

posted @ 2019-01-17 21:56 zhangqi0828 阅读(168) 评论(0) 推荐(0) 编辑

1.2_数据的特征抽取

摘要：数据的特征抽取数据的特征抽取现实世界中多数特征都不是连续变量，比如分类、文字、图像等，为了对非连续变量做特征表述，需要对这些特征做数学化表述，因此就用到了特征提取. sklearn.feature_extraction提供了特征提取的很多方法分类特征变量提取我们将城市和环境作为字典数据，来进阅读全文

posted @ 2019-01-17 21:55 zhangqi0828 阅读(356) 评论(0) 推荐(0) 编辑

1.3_数据的特征预处理

摘要：数据的特征预处理数据的特征预处理单个特征（1）归一化归一化首先在特征（维度）非常多的时候，可以防止某一维或某几维对数据影响过大，也是为了把不同来源的数据统一到一个参考区间下，这样比较起来才有意义，其次可以程序可以运行更快。例如：一个人的身高和体重两个特征，假如体重50kg，身高175cm, 阅读全文

posted @ 2019-01-17 21:55 zhangqi0828 阅读(284) 评论(0) 推荐(0) 编辑

Sklearn与特征工程

摘要： Scikit-learn与特征工程 Scikit-learn与特征工程 Scikit-learn与特征工程 “数据决定了机器学习的上限，而算法只是尽可能逼近这个上限”，这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据，那么需阅读全文

posted @ 2019-01-17 21:54 zhangqi0828 阅读(250) 评论(0) 推荐(0) 编辑

1.1_数据的来源和类型

摘要：数据的来源与类型数据的来源与类型大部分的数据都来自已有的数据库，如果没有的话也可以交给很多爬虫工程师去采集，来提供。也可以来自平时的记录，反正数据无处不在，大都是可用的。数据的类型按照机器学习的数据分类我们可以将数据分成：标称型：标称型目标变量的结果只在有限目标集中取值，如真与假(标称型目阅读全文

posted @ 2019-01-17 21:54 zhangqi0828 阅读(797) 评论(0) 推荐(0) 编辑

分布式tensorflow

摘要：分布式Tensorflow 分布式Tensorflow Tensorflow的一个特色就是分布式计算。分布式Tensorflow是由高性能的gRPC框架作为底层技术来支持的。这是一个通信框架gRPC(google remote procedure call)，是一个高性能、跨平台的RPC框架。RPC 阅读全文

posted @ 2019-01-17 21:53 zhangqi0828 阅读(301) 评论(0) 推荐(0) 编辑

机器学习概述

摘要：什么是机器学习机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点，再到以“学习”为重点，一条自然、清晰的脉络。机器学习是实现人工智能的一个途径，即以机器学习为手段解决人工智能中的问题。机器学习算法是一类从数据中自动分析获得规律（模型），并利用规律对未知数据进行预测的阅读全文

posted @ 2019-01-17 21:53 zhangqi0828 阅读(284) 评论(0) 推荐(0) 编辑

训练高级会话函数

摘要：训练以及高级会话函数训练以及高级会话函数主训练逻辑我们将在cifar_train.py文件实现主要训练逻辑。在这里我们将使用一个新的会话函数，叫tf.train.MonitoredTrainingSession 优点： 1、它自动的建立events文件、checkpoint文件，以记录重要的信阅读全文

posted @ 2019-01-17 20:51 zhangqi0828 阅读(344) 评论(0) 推荐(0) 编辑

分布式接口

摘要：分布式接口分布式接口创建集群的方法是为每一个任务启动一个服务，这些任务可以分布在不同的机器上，也可以同一台机器上启动多个任务，使用不同的GPU等来运行。每个任务都会创建完成一下工作 1、创建一个tf.train.ClusterSpec，用于对集群中的所有任务进行描述，该描述内容对所有任务应该是相阅读全文

posted @ 2019-01-17 20:51 zhangqi0828 阅读(836) 评论(0) 推荐(0) 编辑

图片信息的读取和写入

摘要：多分类图像识别案例多分类图像识别案例 CIFAR-10 CIFAR-10数据集由10个类别的60000 32x32彩色图像组成，每个类别有6000张图像。有50000个训练图像和10000个测试图像。数据集分为五个训练集和一个测试集，每个集有10000个图像。测试集包含来自每个类的正好1000个随阅读全文

posted @ 2019-01-17 17:07 zhangqi0828 阅读(552) 评论(0) 推荐(0) 编辑

模型接口的建立

摘要：模型接口建立模型接口的建立我们将模型接口都放在cifar_omdel.py文件当中，设计了四个函数，input()作为从cifar_data文件中数据的获取，inference()作为神经网络模型的建立，total_loss()计算模型的损失，train()来通过梯度下降训练减少损失 input 阅读全文

posted @ 2019-01-17 17:07 zhangqi0828 阅读(789) 评论(0) 推荐(0) 编辑

图像识别和卷积神经网路案例的实现

摘要：图像识别卷积网络实现案例 Mnist数据集卷积网络实现前面在MNIST上获得92％的准确性是不好的，对于CNN网络来说，我们同样使用Mnist数据集来做案例，这可以使我们的准确率提升很多。在感受输入通道时不是那么明显，因为是黑白图像的只有一个输入通道。那么在Tensorflow中，神经网络相关的操阅读全文

posted @ 2019-01-17 08:27 zhangqi0828 阅读(762) 评论(0) 推荐(0) 编辑

网络优化改进

摘要：网络优化改进网络优化改进网络优化的方法有很多，在这里我们使用其中一种优化方式。在我们的模型训练时候，会有一个重要的因素需要设定，就是学习率。那么在手动设定学习率的时候不一定准确。这种人为的设定对于模型的输出影响较大。所以在这里引入了一种自动更新学习率的函数。指数衰减学习率exponentia 阅读全文

posted @ 2019-01-17 08:27 zhangqi0828 阅读(234) 评论(0) 推荐(0) 编辑

多类图像识别案例

posted @ 2019-01-17 08:27 zhangqi0828 阅读(1115) 评论(0) 推荐(0) 编辑

卷积神经网络和图像识别

摘要：卷积神经网络与图像识别我们介绍了人工神经网络，以及它的训练和使用。我们用它来识别了手写数字，然而，这种结构的网络对于图像识别任务来说并不是很合适。本文将要介绍一种更适合图像、语音识别任务的神经网络结构——卷积神经网络(Convolutional Neural Network, CNN)。说卷积神经阅读全文

posted @ 2019-01-17 08:26 zhangqi0828 阅读(20190) 评论(0) 推荐(0) 编辑

zhangqi

be a coder

公告