MACE(3)-----工程化

作者:十岁的小男孩

QQ:929994365

能下者,上。

前言

  本文是MACE的第三步即MACE环境编译出来的库在Android工程中的使用。在第一篇博文中通过mace官方提供的安卓工程进行调试,本文将其精简,只关心其数据流的逻辑过程。该工程功能是mace的demo物体识别,即传入一张图片,模型识别预测将结果在桌面显示。本人萌新一枚,学习安卓有一月多了,工程漏洞百出,望相互学习。下一篇博文会对mace做一个全面的总结。本部分的学习需要掌握JNI/NDK技术,若有问题浏览前面文章。

  MACE(1)-----环境搭建:https://www.cnblogs.com/missidiot/p/9480033.html

  MACE(2)-----模型编译:https://www.cnblogs.com/missidiot/p/9509831.html

  JNI/NDK:https://www.cnblogs.com/missidiot/p/9716902.html

经过mace环境编译出文件如下:

此处应该有图!!! 

给Android studio配置NDK版本,其版本与编译版本应一致,本文是r-16b。

新建工程,勾选c++支持选项框。

 

其c++标准库选择c++11。

 以上工程构建完毕。

Android studio2.2版本以上采用的是CMake编译,加载库在CMakeLists.txt文件中配置。在MainActivity中加载库,如下:

库的名称自己更改:比如本文改为"mace_jni",相对应的在CMakeLists.txt文件中修改名称和创建对应的cpp文件,即mace_jni.cpp,如下图:

在MainActivity中加载库;

static {
        System.loadLibrary("mace_jni");
    }

在CMakeLists.txt文件中修改;(刚开始文件如下)

cmake_minimum_required(VERSION 3.4.1)

add_library(
             mace_jni

             SHARED

             src/main/cpp/mace_jni.cpp )

find_library(
              log-lib

              log )

target_link_libraries(
                       mace_jni

                       ${log-lib} )

CMakeLists最终文件如下:(加载编译出的a库)

cmake_minimum_required(VERSION 3.4.1)

#set(CMAKE_LIBRARY_OUTPUT_DIRECTORY ${PROJECT_SOURCE_DIR}/../app/libs/${ANDROID_ABI})

# 这块路径有点问题
include_directories(${CMAKE_SOURCE_DIR}/)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/public)

# libmace.a是mace编译生成的,这块以后要改的在这块
set(mace_lib ${CMAKE_SOURCE_DIR}/src/main/cpp/lib/arm64-v8a/libmace.a)
# set(mace_lib ${CMAKE_SOURCE_DIR}/src/main/cpp/lib/armeabi-v7a/libmace.a)

# mobilneet.a也是mace环境编译生成的,后期如果生成的话要改在这里
set(mobilenet_lib ${CMAKE_SOURCE_DIR}/src/main/cpp/model/arm64-v8a/mobilenet.a)
# set(mobilenet_lib ${CMAKE_SOURCE_DIR}/src/main/cpp/model/armeabi-v7a/mobilenet.a)

add_library (mace_lib STATIC IMPORTED)
set_target_properties(mace_lib PROPERTIES IMPORTED_LOCATION ${mace_lib})

add_library (mobilenet_lib STATIC IMPORTED)
set_target_properties(mobilenet_lib PROPERTIES IMPORTED_LOCATION ${mobilenet_lib})


add_library( # Sets the name of the library.
             mace_jni

             SHARED

             src/main/cpp/mace_jni.cpp


             )
find_library(
              log-lib
              log )

target_link_libraries( # Specifies the target library.
                        mace_jni
                        mace_lib
                        mobilenet_lib
                       ${log-lib} )

 

创建mace_jni.cpp文件,实现native方法。

在java包下新建JniUtils.java,将native方法的声明放在其中,当然也将MainActivity中的加载库代码剪切放在JniUtils文件中。并声明三个方法,会自动在mace_jni.cpp下自动被声明。新建方法会显示红色报错,在AS中快捷键是alt+enter创建方法在mace_jni.cpp文件中。

package com.tcl.weilong.mace;

public class JniUtils {
    static {
        System.loadLibrary("mace_jni");
    }

    /**
     * 给模型设置参数
     * @param ompNumThreads
     * @param cpuAffinityPolicy
     * @param gpuPerfHint
     * @param gpuPriorityHint
     * @param kernelPath
     * @return
     */

    public   native int maceMobilenetSetAttrs(int ompNumThreads, int cpuAffinityPolicy, int gpuPerfHint, int gpuPriorityHint, String kernelPath);
    /**
     * 给模型创建运行环境
     * @param model
     * @param device
     * @return
     */
    public  native int maceMobilenetCreateEngine(String model, String device);

    /**
     * 模型具体核心功能,识别图片
     * @param input
     * @return
     */
    public  native float[] maceMobilenetClassify(float[] input);
}

 在mace_jni.cpp文件中自动生成对声明方法的实现声明:

在build.gradle文件中更改为如下代码:

externalNativeBuild {
            cmake {
                cppFlags "-std=c++11 -fopenmp"
                abiFilters "arm64-v8a"
            }
        }

将mace附带的example工程中的lib,model,public三个文件拷贝到cpp文件夹下面并在加载时候修改路径,按如下目录结构。

最为该工程核心的是在java声明的native方法在底层c/c++中具体实现,以下代码是以上三个方法在mace_jni.cpp文件中的具体实现:

#include <jni.h>
#include <algorithm>
#include <functional>
#include <map>
#include <memory>
#include <string>
#include <vector>
#include <numeric>

#include "public/mace.h"
#include "public/mace_runtime.h"
#include "public/mace_engine_factory.h"

namespace {

    struct ModelInfo {
        std::string input_name;
        std::string output_name;
        std::vector<int64_t> input_shape;
        std::vector<int64_t> output_shape;
    };
//有的地方叫.cc也可以叫.cpp其实一个意思,实质为区别c文件的
    struct MaceContext {
        std::shared_ptr<mace::MaceEngine> engine;
        std::shared_ptr<mace::KVStorageFactory> storage_factory;
        std::string model_name;
        mace::DeviceType device_type = mace::DeviceType::CPU;
        //模型的输入输出在这里改
        std::map<std::string, ModelInfo> model_infos = {
                {"mobilenet_v1", {"input", "MobilenetV1/Predictions/Reshape_1",
                                         {1, 224, 224, 3}, {1, 1001}}},
                {"mobilenet_v2", {"input", "MobilenetV2/Predictions/Reshape_1",
                                         {1, 224, 224, 3}, {1, 1001}}}
        };
    };

    mace::DeviceType ParseDeviceType(const std::string &device) {
        if (device.compare("CPU") == 0) {
            return mace::DeviceType::CPU;
        } else if (device.compare("GPU") == 0) {
            return mace::DeviceType::GPU;
        } else if (device.compare("HEXAGON") == 0) {
            return mace::DeviceType::HEXAGON;
        } else {
            return mace::DeviceType::CPU;   //默认是返回CPU
        }
    }

    MaceContext& GetMaceContext() {
        static auto *mace_context = new MaceContext;

        return *mace_context;
    }

}   //namcspace
/**
 * java+包名+类名+函数名
 * Java+com.tcl.weilong.mace+JniUtils+maceMobilenetSetAttrs
 */
extern "C"
jint Java_com_tcl_weilong_mace_JniUtils_maceMobilenetSetAttrs(JNIEnv *env, jobject instance,
                                                         jint ompNumThreads, jint cpuAffinityPolicy,
                                                         jint gpuPerfHint, jint gpuPriorityHint,
                                                         jstring kernelPath_) {
    MaceContext &mace_context = GetMaceContext();
    mace::MaceStatus status;
    // openmp ??
    status = mace::SetOpenMPThreadPolicy(
            ompNumThreads,
            static_cast<mace::CPUAffinityPolicy>(cpuAffinityPolicy));
    //  gpu
    mace::SetGPUHints(
            static_cast<mace::GPUPerfHint>(gpuPerfHint),
            static_cast<mace::GPUPriorityHint>(gpuPriorityHint));
    //  opencl cache
    const char *kernel_path_ptr = env->GetStringUTFChars(kernelPath_, nullptr);
    if (kernel_path_ptr == nullptr) return JNI_ERR;
    const std::string kernel_file_path(kernel_path_ptr);
    mace_context.storage_factory.reset(
            new mace::FileStorageFactory(kernel_file_path));
    mace::SetKVStorageFactory(mace_context.storage_factory);
    env->ReleaseStringUTFChars(kernelPath_, kernel_path_ptr);
    return JNI_OK;
}
extern "C"
jint Java_com_tcl_weilong_mace_JniUtils_maceMobilenetCreateEngine(JNIEnv *env, jobject instance,
                                                             jstring model_, jstring device_) {
    MaceContext &mace_context = GetMaceContext();
    //  parse model name
    const char *model_name_ptr = env->GetStringUTFChars(model_, nullptr);
    if (model_name_ptr == nullptr) return JNI_ERR;
    mace_context.model_name.assign(model_name_ptr);
    env->ReleaseStringUTFChars(model_, model_name_ptr);

    //  load model input and output name
//    auto model_info_iter = mace_context.model_infos.find(mace_context.model_name);
    auto model_info_iter = mace_context.model_infos.find(mace_context.model_name);
    if (model_info_iter == mace_context.model_infos.end()) {

        return JNI_ERR;
    }
    std::vector<std::string> input_names = {model_info_iter->second.input_name};

    std::vector<std::string> output_names = {model_info_iter->second.output_name};

    // get device
    const char *device_ptr = env->GetStringUTFChars(device_, nullptr);
    if (device_ptr == nullptr) return JNI_ERR;
    mace_context.device_type = ParseDeviceType(device_ptr);
    env->ReleaseStringUTFChars(device_, device_ptr);

    mace::MaceStatus create_engine_status =
            CreateMaceEngineFromCode(mace_context.model_name,
                                     std::string(),
                                     input_names,
                                     output_names,
                                     mace_context.device_type,
                                     &mace_context.engine);


    return create_engine_status == mace::MaceStatus::MACE_SUCCESS ?
           JNI_OK : JNI_ERR;
}extern "C"
jfloatArray Java_com_tcl_weilong_mace_JniUtils_maceMobilenetClassify(JNIEnv *env, jobject instance,
                                                         jfloatArray input_) {
    MaceContext &mace_context = GetMaceContext();
    //  prepare input and output
    auto model_info_iter =
            mace_context.model_infos.find(mace_context.model_name);
    if (model_info_iter == mace_context.model_infos.end()) {

        return nullptr;
    }
    const ModelInfo &model_info = model_info_iter->second;
    const std::string &input_name = model_info.input_name;
    const std::string &output_name = model_info.output_name;
    const std::vector<int64_t> &input_shape = model_info.input_shape;
    const std::vector<int64_t> &output_shape = model_info.output_shape;
    const int64_t input_size =
            std::accumulate(input_shape.begin(), input_shape.end(), 1,
                            std::multiplies<int64_t>());
    const int64_t output_size =
            std::accumulate(output_shape.begin(), output_shape.end(), 1,
                            std::multiplies<int64_t>());

    //  load input
    jfloat *input_data_ptr = env->GetFloatArrayElements(input_, nullptr);
    if (input_data_ptr == nullptr) return nullptr;
    jsize length = env->GetArrayLength(input_);
    if (length != input_size) return nullptr;

    std::map<std::string, mace::MaceTensor> inputs;
    std::map<std::string, mace::MaceTensor> outputs;
    // construct input
    auto buffer_in = std::shared_ptr<float>(new float[input_size],
                                            std::default_delete<float[]>());
    std::copy_n(input_data_ptr, input_size, buffer_in.get());
    env->ReleaseFloatArrayElements(input_, input_data_ptr, 0);
    inputs[input_name] = mace::MaceTensor(input_shape, buffer_in);

    // construct output
    auto buffer_out = std::shared_ptr<float>(new float[output_size],
                                             std::default_delete<float[]>());
    outputs[output_name] = mace::MaceTensor(output_shape, buffer_out);

    // run model
    mace_context.engine->Run(inputs, &outputs);

    // transform output
    jfloatArray jOutputData = env->NewFloatArray(output_size);  // allocate
    if (jOutputData == nullptr) return nullptr;
    env->SetFloatArrayRegion(jOutputData, 0, output_size,
                             outputs[output_name].data().get());  // copy

    return jOutputData;
}

  以上步骤将模型底层运行环境准备好了,接下来继续封装为模型准备数据及其数据结果展示表层工作。

建立AppModel.java为模型准备输入数据和接受模型的预测结果数据作为MainActivity和底层native方法的桥梁。

说明:这个文件有四个方法,首先是对模型的设置参数,第二个是对模型创建一个运行环境实在cpu还是在gpu下运行,第三个是对识别功能准备数据将其转换为rgb,第四个是核心功能即物体识别。

package com.tcl.weilong.mace;

import android.graphics.Bitmap;
import android.os.Environment;
import android.util.Log;
import java.io.File;
import java.nio.FloatBuffer;

public class AppModel {
    JniUtils jniUtils = new JniUtils();
    //这些参数的值具体代表什么尚未搞清楚
    int ompNumThreads = 2;  //线程个数
    int cpuAffinityPolicy = 0;  //
    int gpuPerfHint = 3;    //
    int gpuPriorityHint = 3;    //
    String kernelPath = Environment.getExternalStorageDirectory().getAbsolutePath() + File.separator + "mace";  //内核路径

    public static final String[] MODELS = new String[]{"mobilenet_v1", "mobilenet_v2"}; //模型名称,这块不要de
    public static final String[] DEVICES = new String[]{"CPU", "GPU"};  //设备

    String model = MODELS[1]; //mobilenet_v2
    String device = DEVICES[0]; //CPU

    private int[] colorValues; //存储RGB颜色数据
    private FloatBuffer floatBuffer; //输入缓存

    /**
     * 给模型设置属性
     */
    public void maceMobilenetSetAttrs(){
        int attrs;
        attrs = jniUtils.maceMobilenetSetAttrs(ompNumThreads,cpuAffinityPolicy,gpuPerfHint,gpuPriorityHint,kernelPath);
        Log.d("idiot","attrs="+attrs);
    }

    /**
     * 给模型创建运行引擎,cpu或者gpu
     */
    public void maceMobilenetCreateEngine(){
        int engine;
        engine = jniUtils.maceMobilenetCreateEngine(model,device);
        Log.d("idiot","engin="+engine);
    }

    /**
     * 输入数据处理,将照片转换成数组 float[],bitmap是224*224的大小
     * @param bitmap 要处理的原始图片
     * @return 将图片处理后转换成像素点进行返回
     */
    public FloatBuffer dealPic(Bitmap bitmap){
        //这块要创建一个224*224的图片是针对输入原始图片创建的,每一行有224个像素点,共有224行
        colorValues = new int[224 * 224];   //存储像素
        float[] floatValues = new float[224 * 224 * 3]; //RGB像素*3
        floatBuffer = FloatBuffer.wrap(floatValues, 0, 224 * 224 * 3);
        //这个函数要深究,从(0,0)点开始平移,平移尺度是单元尺寸的一个宽度。
        bitmap.getPixels(colorValues, 0, bitmap.getWidth(), 0, 0, bitmap.getWidth(), bitmap.getHeight());
        floatBuffer.rewind();   //??
        //最核心的图像像素点的变化,根本没懂
            for (int i = 0; i < colorValues.length; i++) {
                int value = colorValues[i];
                floatBuffer.put((((value >> 16) & 0xFF) - 128f) / 128f);
                floatBuffer.put((((value >> 8) & 0xFF) - 128f) / 128f);
                floatBuffer.put(((value & 0xFF) - 128f) / 128f);
            }
            return floatBuffer;
    }
    /**
     * 模型的分类函数
     * @param input 缓存的像素点
     * @return  识别结果数据,在类标中匹配识别
     */
    public float[] maceMobilenetClassify(FloatBuffer input){
        float[] result;
        result = jniUtils.maceMobilenetClassify(input.array());
        return result;
    }
}

  以上文件即可实现对模型输入图片的功能,下面的文件是对识别结果进行匹配。创建LableCache.java文件实现:

package com.tcl.weilong.mace;

import android.content.Context;
import android.content.res.AssetManager;
import android.util.Log;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;

public class LabelCache {

    private List<Float> floatList = new ArrayList<>();  //每张识别结果的概率
    private List<String> resultLabel = new ArrayList<>();   //识别结果缓存列表
    private ResultData mResultData; //

    /**
     * 加载类标的资源文件
     * @param context 上下文
     */
    public void readCacheLabelFromLocalFile(Context context) {
        try {
            AssetManager assetManager = context.getAssets();    //获取资源管理器
            //从资源管理器中加载标签文件,所有的结果在文本文件中,识别的结果在label中去匹配
            BufferedReader reader = new BufferedReader(new InputStreamReader(assetManager.open("cacheLabel.txt")));
            String readLine = null;
            while ((readLine = reader.readLine()) != null) {
                Log.d("labelCache", "readLine = " + readLine);
                resultLabel.add(readLine);  //原文是移动识别,这样一张大的图片会识别很多个,将所有识别的都放在该列表里,该最简工程只识别了最小识别单元
            }
            reader.close();
        } catch (Exception e) {
            Log.e("labelCache", "error " + e);
        }
    }

    /**
     *  获取所有识别结果中概率最高的一个值进行返回
     * @param floats 识别结果值: result = appModel.maceMobilenetClassify(input);
     * @return 将识别的结果值存储到data中返回
     */
    public ResultData getResultFirst(float[] floats) {
        floatList.clear();
        for (float f : floats) {
            floatList.add(f);
        }
        float maxResult = Collections.max(floatList);   //在所有识别结果中获取最大的概率即为最终识别结果

        int indexResult = floatList.indexOf(maxResult);
        if (indexResult < resultLabel.size()) {
            String result = resultLabel.get(indexResult);
            if (result != null) {
                if (mResultData == null) {
                    mResultData = new ResultData(result, maxResult);
                } else {
                    mResultData.updateData(result, maxResult);
                }
                return mResultData;
            }
        }
        return null;
    }
}

  所需的资源文件为cacheLabel.txt文件在assets资源文件夹下面。

  

以上工作将识别的结果已经拿到,由于结果包括识别名称,识别的时间和相对应的概率,我们需要data包来封装这些数据,创建ResultData.java文件封装。

package com.tcl.weilong.mace;

public class ResultData {
    public String name; //识别结果内容
    public float probability;   //识别的可能性,概率值
    public long costTime;  // 运行时间

    /**
     * 构造函数,只有名称和识别概率值
     * @param name
     * @param probability
     */
    public ResultData(String name, float probability) {
        this.name = name;
        this.probability = probability;
    }

    /**
     * 构造函数
     * @param name
     */
    public ResultData(String name) {
        this.name = name;
    }

    /**
     * 更新名称和概率值,这个函数原工程中使用用于不断的识别,更新名称显示
     * @param name
     * @param probability
     */
    public void updateData(String name, float probability) {
        this.name = name;
        this.probability = probability;
    }

}

  接下来对拿到的数据进行展示,展示比较简单。其activity.xml文件如下:

<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    android:orientation="vertical"
    android:layout_height="match_parent"
    android:layout_width="match_parent">
    <ImageView
        android:id="@+id/iv"
        android:layout_width="match_parent"
        android:layout_height="400dp"
        android:layout_gravity="center_horizontal" />
    <TextView
        android:layout_width="match_parent"
        android:layout_height="wrap_content"
        android:id="@+id/tv"/>
</LinearLayout>

  最后MainActivity.java文件进行调度:

package com.tcl.weilong.mace;

import android.content.Context;
import android.graphics.Bitmap;
import android.graphics.BitmapFactory;
import android.support.v7.app.AppCompatActivity;
import android.os.Bundle;
import android.util.Log;
import android.widget.ImageView;
import android.widget.TextView;
import android.widget.Toast;
import java.nio.FloatBuffer;

public class MainActivity extends AppCompatActivity {

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        ImageView iv = findViewById(R.id.iv);
        TextView tv =  findViewById(R.id.tv);
        float[] result;
        //获取图片,图片的大小是224 * 224,由于模型的识别输入是该大小,如果是一张大图片就会顺次平移类似于CNN一样
        BitmapFactory.Options options = new BitmapFactory.Options();
        options.inScaled = false;
        Bitmap bitmap = BitmapFactory.decodeResource(getResources(),R.drawable.mouse,options);
        Log.d("idiot","width:"+bitmap.getWidth()+";height:"+bitmap.getHeight());
        iv.setImageBitmap(bitmap);  //只显示了图片,这块没有意义,原意该处为图片的获取及其展示

        LabelCache labelCache = new LabelCache();       //模型结果label
        Context context = getApplicationContext();
        labelCache.readCacheLabelFromLocalFile(context);    //加载label资源文件

        AppModel appModel = new AppModel();
        appModel.maceMobilenetSetAttrs();      //为模型设置环境
        appModel.maceMobilenetCreateEngine();

        FloatBuffer input = appModel.dealPic(bitmap);   //加载输入识别照片,返回缓存的像素点单元
        long start = System.currentTimeMillis();
        result = appModel.maceMobilenetClassify(input); //该工程的核心功能块,识别图片
        long end = System.currentTimeMillis();
        long costTime = end - start;    //识别一张图片的时间
        Toast.makeText(this,"CostTime: "+costTime+" ms",Toast.LENGTH_LONG).show();

        ResultData data;
        data = labelCache.getResultFirst(result);   //将返回的结果对照label处理
        data.costTime = costTime;
        String resultt = data.name  + "\n" + data.probability + "\ncost time(ms): " + data.costTime;
        tv.setText(resultt);    //展示结果
    }

}

注意:

1.传入的图片是224*224大小,这个问题以后会更改。

2.运行的cpu架构是armv-8的,这个问题没有解决。

模拟器运行结果如下:采用的模拟器时间很慢。

真机测试运行时间和内存消耗结果:

CPU:

GPU:

MACE采用GPU加速,时间和硬件消耗缩减一半左右。

 

posted @ 2018-09-28 16:27  weilongyitian  阅读(1855)  评论(1编辑  收藏  举报