有多少人工,就有多少智能

随笔分类 -  机器视觉(CV)

摘要:设置3D Slicer与NVIDIA Clara分割服务器进行集成可以通过几个步骤实现。以下是一个详细的指南,帮助你搭建并使用自己的分割服务器。 前提条件 3D Slicer:确保你已经安装了最新版本的3D Slicer。 NVIDIA Clara Deploy SDK:你需要安装并配置NVIDIA 阅读全文
posted @ 2024-07-15 20:46 lvdongjie-avatarx 阅读(68) 评论(0) 推荐(0) 编辑
摘要:1. 共同目标 - 深度学习模型部署优化 这三者都是用于优化和部署深度学习模型的工具和框架, 目标是提高模型在服务端的推理性能。 2. 技术侧重点不同 TensorRT侧重于针对Nvidia GPU硬件进行深度学习模型的优化与加速。 OpenVINO则针对Inter CPU和FPGA等硬件进行模拟优 阅读全文
posted @ 2024-07-13 11:18 lvdongjie-avatarx 阅读(157) 评论(0) 推荐(0) 编辑
摘要:paper:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Tensorflow-faster r-cnn github:Tensorflow Faster RCNN for Object 阅读全文
posted @ 2021-05-03 08:44 lvdongjie-avatarx 阅读(363) 评论(0) 推荐(0) 编辑
摘要:RCNN存在的问题: 1、一张图像上有大量的重叠框,所以这些候选框送入神经网络时候,提取特征会有冗余! 2、训练的空间需求大。因为RCNN中,独立的分类器和回归器需要很多的特征作为训练。RCNN中提取候选框,提取特征和分类回归是分开的,可独立。 Fast RCNN 针对上诉问题: Q1:将整张图片归 阅读全文
posted @ 2021-04-13 22:07 lvdongjie-avatarx 阅读(104) 评论(0) 推荐(0) 编辑
摘要:目标检测architecture通常可以分为两个阶段: (1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of 阅读全文
posted @ 2021-04-13 21:32 lvdongjie-avatarx 阅读(711) 评论(0) 推荐(0) 编辑
摘要:SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。在此之前,所有的神经网络都是需要输入固定尺寸的图片,比如224*224(ImageNet 阅读全文
posted @ 2021-04-13 07:14 lvdongjie-avatarx 阅读(484) 评论(0) 推荐(0) 编辑
摘要:基于region proposal的RCNN系列:RCNN、Fast RCNN、Faster RCNN 基于区域划分的YOLO、SSD 基于强化学习的AttentionNet等,还有最新的Mask RCNN。 我们将用一周时间先详细介绍每个模型然后通过Tensorflow跑一遍模型。 说到基于reg 阅读全文
posted @ 2021-04-10 19:04 lvdongjie-avatarx 阅读(81) 评论(0) 推荐(0) 编辑
摘要:先介绍几个物体检测的相关知识 不同于分类问题,物体检测可能会存在多个检测目标,这不仅需要我们判别出各个物体的类别,而且还要准确定位出物体的位置 下面图片上有猫,有狗,还有小黄鸭,这是多物体检测: 1.png 物体检测算法常用到的概念 下面我们讲解一下在物体检测算法中常用到的几个概念:Bbox,IoU 阅读全文
posted @ 2021-04-10 18:54 lvdongjie-avatarx 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-04-07 07:37 lvdongjie-avatarx 阅读(125) 评论(0) 推荐(0) 编辑
摘要:1)RGB颜色空间 RGB(红绿蓝)是依据人眼识别的颜色定义出的空间,可表示大部分颜色。但在科学研究一般不采用RGB颜色空间,因为它的细节难以进行数字化的调整。它将色调,亮度,饱和度三个量放在一起表示,很难分开。它是最通用的面向硬件的彩色模型。该模型用于彩色监视器和一大类彩色视频摄像。 2)CMY/ 阅读全文
posted @ 2021-04-04 09:14 lvdongjie-avatarx 阅读(1036) 评论(0) 推荐(0) 编辑
摘要:“Xavier”初始化方法是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文《Understanding the difficulty of training deep feedforward neural networks》,可惜直到近两年,这个方法才逐渐得到更多人的应用和认可。 为 阅读全文
posted @ 2021-04-01 21:15 lvdongjie-avatarx 阅读(943) 评论(0) 推荐(0) 编辑
摘要:TensorBoard是TensorFlow下的一个可视化的工具,能够帮助我们在训练大规模神经网络过程中出现的复杂且不好理解的运算。 TensorBoard能展示你训练过程中绘制的图像、网络结构等。 1.构建简单的TensorBoard日志输出 import tensorflow as tf inp 阅读全文
posted @ 2021-04-01 21:08 lvdongjie-avatarx 阅读(884) 评论(0) 推荐(0) 编辑
摘要:模型文件的保存 tensorflow将模型保持到本地会生成4个文件: meta文件:保存了网络的图结构,包含变量、op、集合等信息 ckpt文件: 二进制文件,保存了网络中所有权重、偏置等变量数值,分为两个文件,一个是.data-00000-of-00001 文件,一个是 .index 文件 che 阅读全文
posted @ 2021-04-01 21:04 lvdongjie-avatarx 阅读(105) 评论(0) 推荐(0) 编辑
摘要:TFRecord生成 一、为什么使用TFRecord? 正常情况下我们训练文件夹经常会生成 train, test 或者val文件夹,这些文件夹内部往往会存着成千上万的图片或文本等文件,这些文件被散列存着,这样不仅占用磁盘空间,并且再被一个个读取的时候会非常慢,繁琐。占用大量内存空间(有的大型数据不 阅读全文
posted @ 2021-04-01 21:00 lvdongjie-avatarx 阅读(160) 评论(0) 推荐(0) 编辑
摘要:应用场景 假如我们有一系列诉求是把图片识别成一个特定分类、比如 把图片分类成为猫、狗、狼等 把图片分类成为奔驰、宝马、奥迪 ... 几乎很少有人从头训练网络、复用只有训练的网络参数适应新的数据集、参考transfer-learning In practice, very few people tra 阅读全文
posted @ 2021-04-01 20:54 lvdongjie-avatarx 阅读(410) 评论(0) 推荐(0) 编辑
摘要:LeNet-5、AlexNet、ZFNet、VGGNet、GoogleNet、ResNet,ResNeXt,DenseNet,Shake Shake,SeNet,MobileNet,ShuffleNet,DarkNet LeNet:最早用于数字识别的CNN AlexNet:2012年ILSVRC比赛 阅读全文
posted @ 2021-04-01 07:12 lvdongjie-avatarx 阅读(460) 评论(0) 推荐(0) 编辑
摘要:整个优化系列文章列表: Deep Learning 之 最优化方法 Deep Learning 最优化方法之SGD Deep Learning 最优化方法之Momentum(动量) Deep Learning 最优化方法之Nesterov(牛顿动量) Deep Learning 最优化方法之AdaG 阅读全文
posted @ 2021-03-27 15:57 lvdongjie-avatarx 阅读(274) 评论(0) 推荐(0) 编辑
摘要:一、卷积(Convolution) 那么究竟什么是卷积呢?你可能还记得我之前的博客,我们使用了一个小的滤波器(Filter),并在整个图像上滑动这个滤波器。然后,将图像的像素值与滤波器中的像素值相乘。使用深度学习的优雅之处在于我们不必考虑这些滤波器应该是什么样的(神经网络会自动学习并选取最佳的滤波器 阅读全文
posted @ 2021-03-25 20:50 lvdongjie-avatarx 阅读(632) 评论(0) 推荐(0) 编辑