mthoutai

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

C/C++ 图像二进制存储与读取


本系列文章由 @yhl_leo 出品,转载请注明出处。
文章链接: http://blog.csdn.net/yhl_leo/article/details/50782792


在深度学习时,制作样本数据集时,须要产生和读取一些二进制图像的数据集,如MNISTCIFAR-10等都提供了适合C语言的二进制版本号。

以CIFAR-10的数据集为例。官网上有两段关键的介绍:

二进制版本号数据集格式为(图像大小为32x32):

<1 x label><3072 x pixel>
...
<1 x label><3072 x pixel>

In other words, the first byte is the label of the first image, which is a number in the range 0-9. The next 3072 bytes are the values of the pixels of the image. The first 1024 bytes are the red channel values, the next 1024 the green, and the final 1024 the blue. The values are stored in row-major order, so the first 32 bytes are the red channel values of the first row of the image.

由此,绘制一个简图:

memory

依据图像大小32x32 = 1024,不难知道。每一个颜色值存储为1 byte,因此,对于单个图像的二进制存储与读取(先无论RGB颜色存储顺序)。找了一张32x32的彩色lena图像。例如以下实现:

#include <iostream>
#include <stdio.h>
#include <stdlib.h>

#include "cv.h"
#include "highgui.h"

using namespace cv;
using namespace std;

void main()
{
    FILE *fpw = fopen( "E:\\patch.bin", "wb" );
    if ( fpw == NULL )
    {
        cout << "Open error!" << endl;
        fclose(fpw);
        return;
    }

    Mat image = imread("E:\\lena32.jpg");
    if ( !image.data || image.channels() != 3 )
    {
        cout << "Image read failed or image channels isn't equal to 3."
            << endl;
        return;
    }

    // write image to binary format file
    int labelw = 1;
    int rows = image.rows;
    int cols = image.cols;

    fwrite( &labelw, sizeof(char), 1, fpw );

    char* dp = (char*)image.data;
    for ( int i=0; i<rows*cols; i++ )
    {
        fwrite( &dp[i*3],   sizeof(char), 1, fpw );
        fwrite( &dp[i*3+1], sizeof(char), 1, fpw );
        fwrite( &dp[i*3+2], sizeof(char), 1, fpw );
    }
    fclose(fpw);

    // read image from binary format file
    FILE *fpr = fopen( "E:\\patch.bin", "rb" );
    if ( fpr == NULL )
    {
        cout << "Open error!" << endl;
        fclose(fpr);
        return;
    }

    int labelr(0);
    fread( &labelr, sizeof(char), 1, fpr );

    cout << "label: " << labelr << endl;

    Mat image2( rows, cols, CV_8UC3, Scalar::all(0) );

    char* pData = (char*)image2.data;
    for ( int i=0; i<rows*cols; i++ )
    {
        fread( &pData[i*3],   sizeof(char), 1, fpr );
        fread( &pData[i*3+1], sizeof(char), 1, fpr );
        fread( &pData[i*3+2], sizeof(char), 1, fpr );
    }
    fclose(fpr);

    imshow("1", image2);
    waitKey(0); 
}

执行结果例如以下:

results

再看图片属性:

attribute

与官网上的大小3073一致,那么这么存取应该没问题。

严格依照官网的RGB通道分别存储,略作改动就能够实现:

/*  for ( int i=0; i<rows*cols; i++ )
    {
        fwrite(&dp[i*3],   sizeof(char), 1, fpw);
        fwrite(&dp[i*3+1], sizeof(char), 1, fpw);
        fwrite(&dp[i*3+2], sizeof(char), 1, fpw);
    }
*/

    for ( int i=0; i<rows*cols; i++ )
        fwrite(&dp[i*3+2],   sizeof(char), 1, fpw); // R

    for ( int i=0; i<rows*cols; i++ )
        fwrite(&dp[i*3+1],   sizeof(char), 1, fpw); // G

    for ( int i=0; i<rows*cols; i++ )
        fwrite(&dp[i*3],   sizeof(char), 1, fpw);  // B

存储和读取多张图片方法相似,这里就不做介绍。

本文已同步于GitHub:yhlleo/image2binarytest

<script type="text/javascript"> $(function () { $('pre.prettyprint code').each(function () { var lines = $(this).text().split('\n').length; var $numbering = $('
    ').addClass('pre-numbering').hide(); $(this).addClass('has-numbering').parent().append($numbering); for (i = 1; i <= lines; i++) { $numbering.append($('
  • ').text(i)); }; $numbering.fadeIn(1700); }); }); </script>
---

相关学习推荐

根据本文内容,精选以下优质课程:

  1. C++实战笔记
    ‍ 罗剑锋 | 高效学习现代C++编程
  2. 机器学习40讲
    ‍ 王天一 | 系统学习机器学习核心算法
  3. 玩转Git三剑客
    ‍ 苏玲 | 高效使用Git进行代码管理

开发资源

posted on 2017-06-27 18:58  mthoutai  阅读(4975)  评论(0)    收藏  举报