文章分类 - 模型部署
摘要:python调用tflite执行推理 tensorflow2.x 参考了tensorflow文档。 文档的不足之处在于,没有强调resize_tensor_input的使用。实际上,在allocate_tensors之前,需要resize以确定输入tensor的shape,保持与输入数据一致。 im
阅读全文
摘要:为什么要转储权重? 转储权重允许我们自行实现模型的推理部分,以便更细粒度地控制推理流程,应用各类推理加速方法,减少推理时间,降低推理的内存占用。对于将模型部署在计算资源有限,又要求高实时性推理的移动或iot设备上至关重要。 从ckpt中转储权重和tensor信息 依赖:tensorflow:2.x
阅读全文