一个简单粗暴的人脸认证标注工具的实现
小喵的唠叨话:话说最近小喵也要开始写论文了,想了两周还是没有头绪,不知道该写些什么。恰好又被分配了一点标注数据的工作,于是乎想写点代码,休闲一下。结果也就是这篇博客。对了,小喵对GUI编程一窍不通,只知道Windows有MFC,Mac上的不知道。。。恰好听说过QT,而且知道这个界面库是跨平台的,也就选用了这个工具了。
本文系原创,转载请注明出处~
小喵的博客:http://www.miaoerduo.com
博客原文:http://www.miaoerduo.com/qt/一个简单粗暴的人脸认证标注工具的实现.html
那么现在开始和小喵一起瞎猫似的捯饬QT吧~
先看一眼效果图:
是不是乍一看还挺炫酷。功能上也还好,至少简单的标注工作都能完成了。那么让我们来一步一步的完成这个工具吧。
一、功能需求
这个程序主要的功能是完成一个人脸认证的标注工具。
具体来说,就是给定很多对人脸的图片,要标注一下这一对是不是同一个人。同时,每一对的图片的人脸一张是生活照,一张是证件照,需要同时标注出哪张是证件照,那张是生活照。照片都是经过检测和对齐的,这个工具只需要完成简单的显示、标注、保存记录的工作就可以。
当然考虑到有时候需要标注的list可能很大,可以加入跳转的功能。标注结果都保存在内存,用户可以随时更改,点击保存,则写入硬盘。
二、数据结构
那么是不是现在就可以动手写代码了呢?当然不是!
小喵写这个软件一共用了3天的时间,第一天完成了一个超简单demo程序,熟悉了一下QT的事件添加,路径选择和显示图片的几个功能。之后又仔细的思考了一下各种数据的结构,才动手做了这一版工具。没有一个清晰的数据的概念,会造成许多的无用功。所以,大家在写程序的时候,要在准备阶段多花一点时间来思考,毕竟写代码才是最简单的事情不是吗?
- 输入数据格式:因为小喵的工作环境下,大家都对linux有一些了解,所以可以自行生成好图片的路径的list,这里统一要求,list必须是偶数行(2n行),代表n对,相邻的图片为一对。
- 标注数据存储:考虑到我们不仅需要标注是不是一对,还得标注哪张是证件照,所以不妨直接在读数据的时候就分成两份,这样就用两个std::vector<std::string>来存储就行了。
- 标注过程的状态:我们需要知道标注过程中的那些信息呢?主要应该有:总数据量,当前已标注的对数。
- 标注结果:每一对都有一组对应地 结果,考虑到有4中情况:未标注,不确定,不匹配,匹配这四种,我们定义一个枚举的状态表enum AnnoState就好。之后用一个std::vector<enum AnnoState>来存储标注结果。
三、界面制作
GUI程序的界面一直是个很让人头疼的问题,记得在本科学习Java的时候,需要自己手写一个控件,使用new JButton()类似的方式创建按钮,然后添加到主界面上,位置什么的都得调用这个对象来设置,十分的繁琐。那么QT能不能简化这个过程呢?答案是肯定的。
创建项目->选择Application->Qt Widgets Application。然后项目名改成Anno Pro,其他全部默认设置,就创建好了一个项目了。这个初始的项目里面有3个文件夹:头文件,源文件和界面文件,以及一个.pro结尾的项目配置文件。
既然需要编辑界面,我们自然会想查看一下界面文件了,双击MainWindow.ui(我这里全部都是默认的名字)。出现的是一个充满各种控件的可视化界面编辑器。
按照我们之前的界面样式,拖动左边的控件,就可以完成界面的编写了。小喵这里只用到了几种控件:
QPushButton:各种按钮
QLabel:所以显示文字和图像的区域都是这这个控件
QFrame:一个容器,小喵用它只是为了结构上更清晰
QSlider:滑动条,小喵用的是水平滑动条
QStatusBar:状态栏, 这应该是自带的,如果删掉的话,在MainWindow控件点击右键就可以创建了
拖动完成后,双击空间,就可以给空间设置文本,同时注意给每个控件起一个好听的名字(起名字很重要的!《代码大全》中甚至用一章,好几十页的篇幅介绍如何命名)。
至于其他的控件,大家可以自行研究。反正小喵现在的道行应该才是筑基。
那么我们就愉快的完成了界面的编写了~点击左右下的运行图标(三角形的那个),就可以看到自己的运行程序了!
四、数据定义与初始化
我们先前已经分析了我们需要的数据了,这部分开始使用代码的定义这些结构。
打开我们/*唯一的*/头文件mianwindow.h,添加需要的变量,小喵就直接把自己的头文件复制下来了:
1 #ifndef MAINWINDOW_H 2 #define MAINWINDOW_H 3 4 #include <QMainWindow> 5 #include <vector> 6 #include <string> 7 namespace Ui { 8 9 class MainWindow; 10 } 11 12 class MainWindow : public QMainWindow 13 { 14 enum AnnoState { 15 UNKNOWN = 0, // 未标注 16 YES = 1, // 匹配 17 NO = 2, // 不匹配 18 UNSURE = 3 // 不确定 19 }; 20 21 public: 22 explicit MainWindow(QWidget *parent = 0); 23 ~MainWindow(); 24 25 private: 26 Ui::MainWindow *ui; // 自带的,ui界面的接口 27 std::vector<std::string> image_list_1; // 用来存放左边的图片的list 28 std::vector<std::string> image_list_2; // 用来存放右边的图片的list 29 int current_idx; // 当前图片对的id 30 int total_pair_num; // 总共的图片对的数目 31 std::vector< AnnoState > annotation_list; // 标注的结果 32 }; 33 34 #endif // MAINWINDOW_H
可以看出,小喵添加了一个enum的类型,用来表示标注结果的类型。虽然只有4个状态,我们甚至可以直接约定几个int值来表示,但相信我,为这么4个状态定义一个枚举类型是完全有必要的。
之后我们所有的成员变量都是private的。具体含义,注释中也有写明。
下一步就是初始化了。初始化的过程当然得写在构造函数里,这里,小喵在初始化的时候强迫用户选择一个标注的list,如果不这么做,会有很多的意外情况。请原谅小喵的怠惰。。。
1 MainWindow::MainWindow(QWidget *parent) : 2 QMainWindow(parent), 3 ui(new Ui::MainWindow) 4 { 5 ui->setupUi(this); 6 7 // 选择输入文件 8 while (1) { 9 QString file_name = QFileDialog::getOpenFileName(this, "choose a file to annotate", "."); 10 if (file_name.isEmpty()) { 11 int ok = QMessageBox::information(this, "choose a file to annotate", "Don't want to work now?", QMessageBox::Ok | QMessageBox::Cancel); 12 if (ok == QMessageBox::Ok) { 13 exit(0); 14 } 15 continue; 16 } 17 std::ifstream is(file_name.toStdString()); 18 std::string image_name; 19 bool is_odd = true; 20 while (is >> image_name) { 21 if (is_odd) { 22 this->image_list_1.push_back(image_name); 23 } else { 24 this->image_list_2.push_back(image_name); 25 } 26 is_odd = !is_odd; 27 } 28 is.close(); 29 30 if (image_list_1.size() != image_list_2.size()) { 31 QMessageBox::information(this, "choose a file to annotate", "this image list is not even", QMessageBox::Ok); 32 continue; 33 } 34 if (0 == image_list_1.size()) { 35 QMessageBox::information(this, "choose a file to annotate", "this image list is empty", QMessageBox::Ok); 36 continue; 37 } 38 break; 39 } 40 41 assert(image_list_1.size() == image_list_2.size()); 42 // 初始化其他参数 43 this->total_pair_num = image_list_1.size(); 44 this->current_idx = 0; 45 std::vector<AnnoState> annotation_list(this->total_pair_num, AnnoState::UNKNOWN); 46 this->annotation_list.swap(annotation_list); 47 48 display(); 49 }
这里用了两个QT的组件:
QFileDialog:这个组件是一个文件对话框,其中有两个十分有用的函数:getOpenFileName用于选择一个文件,并返回文件名;getSaveFileName用于选择一个文件来保存数据,并返回一个文件名。这两个函数的参数很多,小喵只用到了前面的3个,用到的参数依次是:父组件,标题,初始目录。其他的参数的功能,喵粉可以去官网查一下。
QMessageBox::information,这个函数的功能是显示一个消息窗口。四个参数分别表示:父组件,标题,内容,按钮样式。
相信大家懂一点点C++的知识的话,很容易看懂这段代码。
这里就是使用了一个循环,让用户选择文件,如果选择成功了,则读取数据到我们的list中,最终初始化了其他的参数,在调用display函数来显示。这个display函数是我们自己编写的,后面会说到。另外,assert函数是断言,他保证了断言的数据的合法性,如果不合法,程序会退出。想使用这个函数,需要包含头文件assert.h。
五,添加事件响应
小喵之前了解到,QT使用的是一种信号和槽的事件机制,是一种十分高级的机制。那么有没有什么简单的方法,为我们的每个控件绑定自己的的事件呢?
在界面编辑界面下,右击需要添加事件的空间,然后选择转到槽。这时候会有很多选项,这里直接选择clicked就可以。然后你会发现我们的mainwindow类中,多了一个pivate slot的函数(也就是槽函数)。
我们可以给每一个需要添加事件的函数都用这种方式来绑定事件,最终头文件中会出现这样的声明(函数名称的规则是:on_控件名_信号类型):
1 private slots: 2 void on_pushButton_save_clicked(); 3 void on_pushButton_ok_clicked(); 4 void on_pushButton_no_clicked(); 5 void on_pushButton_unsure_clicked(); 6 void on_pushButton_next_clicked(); 7 void on_pushButton_prev_clicked(); 8 void on_pushButton_switch_clicked(); 9 void on_horizontalSlider_progress_sliderReleased();
在源文件中,也会生成空的函数定义。我们只需要自己完成函数定义就大功告成!
下面给出的是除了save的所有的函数的定义。
主要工作是,给每个事件编写修改数据的代码,而不去负责任何界面相关的部分。各个控件可以通过this->ui来设置和获取。使用Qt Creator的时候,要充分利用智能提示。
1 /** 2 * @brief MainWindow::on_pushButton_ok_clicked 3 * 标注为"匹配" 4 */ 5 void MainWindow::on_pushButton_ok_clicked() 6 { 7 this->annotation_list[this->current_idx] = MainWindow::AnnoState::YES; 8 ++ this->current_idx; 9 display(); 10 } 11 12 /** 13 * @brief MainWindow::on_pushButton_no_clicked 14 * 标注为"不匹配" 15 */ 16 void MainWindow::on_pushButton_no_clicked() 17 { 18 this->annotation_list[this->current_idx] = MainWindow::AnnoState::NO; 19 ++ this->current_idx; 20 display(); 21 } 22 23 /** 24 * @brief MainWindow::on_pushButton_unsure_clicked 25 * 标注为"不确定" 26 */ 27 void MainWindow::on_pushButton_unsure_clicked() 28 { 29 this->annotation_list[this->current_idx] = MainWindow::AnnoState::UNSURE; 30 ++ this->current_idx; 31 display(); 32 } 33 34 /** 35 * @brief MainWindow::on_pushButton_next_clicked 36 * 移动到下一组 37 */ 38 void MainWindow::on_pushButton_next_clicked() 39 { 40 ++ this->current_idx; 41 display(); 42 } 43 44 /** 45 * @brief MainWindow::on_pushButton_prev_clicked 46 * 移动到上一组 47 */ 48 void MainWindow::on_pushButton_prev_clicked() 49 { 50 -- this->current_idx; 51 display(); 52 } 53 54 /** 55 * @brief MainWindow::on_pushButton_switch_clicked 56 * 交换两边的图片 57 */ 58 void MainWindow::on_pushButton_switch_clicked() 59 { 60 std::string tmp = this->image_list_1[this->current_idx]; 61 this->image_list_1[this->current_idx] = this->image_list_2[this->current_idx]; 62 this->image_list_2[this->current_idx] = tmp; 63 display(); 64 } 65 66 /** 67 * @brief MainWindow::on_horizontalSlider_progress_sliderReleased 68 * 拖放进度条,控制进度 69 */ 70 void MainWindow::on_horizontalSlider_progress_sliderReleased() 71 { 72 int pos = this->ui->horizontalSlider_progress->value(); 73 this->current_idx = pos; 74 this->display(); 75 }
至此,我们的大体的功能逻辑就编写完了。
那么怎么让界面上显示我们的系统状态呢?注意到了我们上面的每一个函数都调用了display这个函数了吗?这个函数正式负责绘制界面的功能。
部分主要介绍三个函数:
1 const std::string UNSURE_FILE = ":File/images/unsure.png"; 2 const std::string YES_FILE = ":File/images/yes.gif"; 3 const std::string NO_FILE = ":File/images/no.gif"; 4 const std::string UNKNOWN_FILE = ":File/images/unknown.png"; 5 6 /** 7 * @brief set_image 将图像设置到label上,图像自动根据label的大小来缩放 8 * @param label 9 * @param image 10 */ 11 void set_image(QLabel *label, const QPixmap &image) { 12 float ratio(0.); 13 ratio = 1. * label->width() / image.width(); 14 ratio = fmin( 1. * label->height() / image.height(), ratio ); 15 QPixmap m = image.scaled(static_cast<int>(image.width() * ratio), static_cast<int>(image.height() * ratio)); 16 label->setPixmap(m); 17 } 18 19 void set_image(QLabel *label, const std::string image_path) { 20 QPixmap image(image_path.c_str()); 21 set_image(label, image); 22 } 23 24 /** 25 * @brief MainWindow::display \n 26 * 根据系统中的所有的变量来设置当前界面中的各个部分的内容 27 */ 28 void MainWindow::display() { 29 30 if (this->current_idx >= this->total_pair_num) { 31 QMessageBox::information(this, "annotation over", "Congratulations! You've finished all the job! Please save your work :)", QMessageBox::Ok); 32 this->current_idx = this->total_pair_num - 1; 33 } 34 if (this->current_idx < 0) { 35 QMessageBox::information(this, "annotation warning", "You must start at 0 (not a negative position, I konw you wanna challenge this app) :)", QMessageBox::Ok); 36 this->current_idx = 0; 37 } 38 39 // 进度条 40 this->ui->horizontalSlider_progress->setRange(0, this->total_pair_num - 1); 41 this->ui->horizontalSlider_progress->setValue(this->current_idx); 42 43 // 状态栏 44 this->ui->statusBar->showMessage(QString((std::to_string(this->current_idx + 1) + " / " + std::to_string(this->total_pair_num)).c_str())); 45 46 // 文件名 47 std::string image_name_1 = this->image_list_1[this->current_idx]; 48 std::string image_base_name_1 = image_name_1.substr(image_name_1.find_last_of("/") + 1); 49 std::string image_name_2 = this->image_list_2[this->current_idx]; 50 std::string image_base_name_2 = image_name_2.substr(image_name_2.find_last_of("/") + 1); 51 this->ui->label_image_name_1->setText(image_base_name_1.c_str()); 52 this->ui->label_image_name_2->setText(image_base_name_2.c_str()); 53 54 // 显示图像 55 set_image(this->ui->label_image_view_1, image_name_1); 56 set_image(this->ui->label_image_view_2, image_name_2); 57 58 // 显示标注结果 59 std::string show_image_name = UNKNOWN_FILE; 60 switch (this->annotation_list[this->current_idx]) { 61 case AnnoState::UNKNOWN: 62 show_image_name = UNKNOWN_FILE; 63 break; 64 case AnnoState::YES: 65 show_image_name = YES_FILE; 66 break; 67 case AnnoState::NO: 68 show_image_name = NO_FILE; 69 break; 70 case AnnoState::UNSURE: 71 show_image_name = UNSURE_FILE; 72 break; 73 } 74 set_image(this->ui->label_image_compare_status, show_image_name); 75 76 }
最开始我们定义了4个图片的路径。这可以是绝对路径或者相对路径。我们这里的路径设置的比较奇怪,在下面我们会讲到。
set_image负责将给定的图片绘制到QLabel上,为了显示的好看,图像会按照QLabel的尺寸来动态的缩放。这样就不会出现有个图像太大或太小的情况了。
display则是负责各个区域的绘制。
还差一步是保存结果:
1 /* 2 * @brief MainWindow::on_pushButton_save_clicked \n 3 * 保存结果文件 4 */ 5 void MainWindow::on_pushButton_save_clicked() 6 { 7 QString file_name = QFileDialog::getSaveFileName(this, "choose a file to save", "."); 8 if (file_name.isEmpty()) { 9 QMessageBox::information(this, "choose a file to save", "please enter a legal file name", QMessageBox::Ok); 10 return; 11 } 12 std::ofstream os(file_name.toStdString()); 13 for (int idx = 0; idx < static_cast<int>(this->annotation_list.size()); ++ idx) { 14 os << this->image_list_1[idx] << " " << this->image_list_2[idx] << " " << this->annotation_list[idx] << "\n"; 15 } 16 os.close(); 17 QMessageBox::information(this, "save", "save result success", QMessageBox::Ok); 18 }
六、添加资源
由于我们的程序是需要publish出去的,因此图片文件等资源,必须包含在程序中。那么Qt怎么添加文件资源呢?
在项目视图下,右键项目->添加新文件->Qt->Qt Resource File。就可以创建一个qrc文件了。
我这里给这个文件取名为image。
之后,建议在项目的根目录里面新建一个文件夹,用来存放资源。小喵的结构是这个样子的:
小喵的项目根目录新建了一个文件夹images,并将图像素材放入了这个文件夹。
之后回到QT,📧我们刚建好的image.qrc文件->Open in Editor。
先添加前缀,这里写上/File。之后点击新建的/File目录,再点击添加->添加文件,选择我们的素材文件。最终的效果图如下:
之后,我们就可以在程序中直接访问这些资源了。这也就是我们之前的那四个奇怪的路径的由来了。
七、发布
此时此刻,相信每一个喵粉的程序都能在自己的电脑上愉快的玩耍了。这么有意思的程序,怎么分享给其他人呢?
和Windows上常用的VS类似,Qt Creator的左下角有个发布选项:
选择Release,然后构建整个项目就可以了。之后找到我们的程序,双击就可以运行。
这时候你会愉快的把这个程序发给你的好伙伴,得到的反应一定是:这是啥!我打不开!
为什么呢?
虽然Qt是一个跨平台的界面库,但如果对方的电脑上没有安装Qt,那么就不能运行。不过不用失落,Qt中早已给出一个绝妙的解决办法。
小喵的电脑是Mac的,所以找到的解决方案也是Mac的,Windows和Linux上也有类似的办法,大家可以自行查找。
http://www.cnblogs.com/E7868A/archive/2012/12/02/2798225.html
参考上述博客,我们使用macdeployqt这个工具来处理一下release的程序就搞定。这时候你会发现原本100k的程序变成了22M。但是直接发给别人的时候,是可以直接运行的!
至此,本次的博客结束了。
完整的项目在github上可以下载:
https://github.com/miaoerduo/Anno_pro
转载请注明出处~