基于TensorFlow的食物图像识别

　　参考https://github.com/sourcedexter/tfClassifier/tree/master/image_classification

　　　　https://download.csdn.net/download/yang_china/11467532?spm=1001.2101.3001.5697

　　主要介绍如何在win10系统中使用TensorFlow环境运行一个最基本的图像分类器。

　　一、基础知识

　　　　1.物体分类的思想

　　　　　　物体分类，也就是训练系统识别各个物体，如猫咪、狗狗、汽车等。TensorFlow是谷歌开发出的人工智能学习系统，相当于我们的运行环境。

　　　　2.神经网络与Inception v3体系结构模型

　　　　　　神经网络示意图如下：

　　　　　　通俗了讲，就是将若干个输入，进行若干次操作（线性或者非线性），最后输出结果。Inception v3模型是谷歌发布的一个深层卷积网络模型。我们使用的retrain_new.py脚本就是使用了Inception v3模型进行一个迁移学习。

　　　　3.训练集、测试集和验证集

　　　　　　训练集用来训练模型，验证集用来验证模型是否进行了过拟合，测试集用来测试模型的准确程度。三种图片集的比例会对准确度产生影响。

　　　　4.学习速率

　　　　　　不同的学习速率会导致不同的结果。如果速率过大，会导致准确率在训练的过程中不断上下跳动，如果速率过小会导致在训练结束前无法到达预期准确度。

　　二、环境搭建

　　　　1.具体环境搭建可以查看之前的文章。

　　　　　　主要逐注意版本对应。

　　　　2.TensorFlow环境搭建（gpu）

　　　　　　（1）直接pip安装。命令：　　　　　　　　　

　　　　　　　　　　pip install tensorflow-gpu

　　　　　　　　　　这样就安装好TensorFlow了，但是我们还需要GPU加速，所以还需要安装cuda和cuDnn（专门为deep learning准备的加速库）。

　　　　　　（2）cuda安装

　　　　　　　　下载完后正常安装就可以了。

　　　　　　（3）cuDnn库下载

　　　　　　　　下载完后解压缩，将三个文件拷贝到相应的文件中即可。一定注意对应覆盖。

　　　　　　（4）测试

　　　　　　　　import tensorflow as tf

　　　　　　　　hello = tf.constant('Hello, TensorFlow!')

　　　　　　　　sess = tf.Session()

　　　　　　　　查看是否输出。

　　　三．基本使用

　　　　1.数据集的收集与创建

　　　　　　我用的是2018全球AI挑战赛的数据集。链接：https://challenger.ai/datasets/lad2018

　　　　2.训练模型

　　　　　　训练模型使用retrain_new.py脚本。在命令行运行，命令格式如下：

　　　　　　python retrain_new.py --model_dir 存放classify_image_graph_def.pb的路径 --image_dir 刚才的创建的DataSet的路径 --output_graph 产生的,pb文件的存放路径 --output_labels 产生的output_labels.txt的存放路径 --how_many_training_steps 训练步数 --　learning_rate 学习速率 --testing_percentage 测试集比例 --validation_percentage 验证集比例

　　　　　　示例命令：

　　　　　　python retrain_new.py --model_dir E:\tfclassifier\image_classification\inception --image_dir E:\tfclassifier\DataSet --output_graph E:\tfclassifier\image_classification\output_dir\output_graph.pb --output_labels 　　　　　　　　　　　　 E:\tfclassifier\image_classification\output_dir\output_labels.txt --how_many_training_steps 500 --learning_rate 0.3 --testing_percentage 10 --validation_percentage 10

　　　　　　说明：　　　　

model_dir参数：指定了model的存放位置，就是我们的inception文件夹
image_dir参数：指定了数据集的位置
output_graph参数：产生的output_graph.pb文件的存放路径（后面要用）
output_labels 参数：产生的output_labels.txt的存放路径（后面要用）
how_many_training_steps参数：训练步数，和学习速率配合调整（我用的500）
learning_rate参数：学习速率，和训练步数配合调整（我用的0.3，常用的有0.001，0.01，0.1，0.3，1，3，可自己调整尝试一下）
testing_percentage参数：测试集比例
validation_percentage参数：验证集比例

　　　　3.测试模型

　　　　　　核心的文件是output_graph.pb文件（我们训练所产生的图，是一个二进制文件）和output_labels.txt文件。

　　　　　　使用retrain_model_classifier.py脚本来测试模型。命令格式如下：

　　　　　　cd E:\tfclassifier\image_classification（进入retrain_model_classifier.py脚本所在的目录）python retrain_model_classifier.py 要识别图片的路径

　　　　　　然后会看到一些版本信息，和输出结果：

　　四．遇到的问题以及解答

　　　　1.版本对应问题

　　　　　　python版本，cuda版本和cuDNN版本都是对应的，如果结果中出现了乱码，很大概率是版本的问题。

　　　　2.带参数的python脚本编写与运行

　　　　　　想让python脚本带参数，可以在python脚本的末尾添加如下格式的代码：

　　　　　　运行时需要在python xxx.py后加上“--image_dir 参数”就可以了。

　　　　3.测试脚本的调整

　　　　　　要不断训练、测试，不断调整参数，直到训练快要结束的时候，验证比例达到稳定，并且在90以上，我们才认为系统较为完善。

posted @ 2021-07-26 15:13 LyAsano 阅读(432) 评论(0) 收藏举报

刷新页面返回顶部

LyAsano

基于TensorFlow的食物图像识别

公告