摘要:
在进行图像处理时一点要注意 各个库之间的细微差异,还有要注意图像放缩时插值方法的选择,而且即使是相同的插值方法,各个库的实现也不同,结果也会有些许差异 PIL(RGB) 首先介绍PIL(Python Imaging Library)这个库,这是Python中最基础的图像处理库,主要注意对图片进行处理 阅读全文
摘要:
插值法的第一次都是相同的,计算新图的坐标点对应原图中哪个坐标点来填充,计算公式为: srcX = dstX (srcWidth/dstWidth) srcY = dstY (srcHeight/dstHeight) srcWidth/dstWidth和srcHeight/dstHeight分别表示宽 阅读全文
摘要:
“Two Stream Convolutional Networks for Action Recognition in Videos”(2014NIPS) Two Stream方法最初在这篇文章中被提出,基本原理为对视频序列中每两帧计算密集光流,得到密集光流的序列(即temporal信息)。然后对 阅读全文
摘要:
本文只主要有两个贡献。 ImageNet表明在足够大的数据集上训练网络之后,在其他的数据集甚至其它类型的任务上直接使用pre trained参数初始化能够取得很好的效果。本文探究了在足够大的视频数据集Kinetics上训练了之后在UCF101和HMDB51上能够得到非常好的效果,可以达到在目前最好的 阅读全文
摘要:
"Appearance and Relation Networks for Video Classification,CVPR2018" Two tream网络效果好,但是太耗时;2Dconv+LSTM和其他方式的效果又不太好,主要是因为LSTM只能抓住高层次的模糊信息,不能抓住细粒度的运动信息。3 阅读全文
摘要:
上一个博客中讲解了用python实现一个简单的两层神经网络,我们是把所有的网络层都直接写在了类中。但是作为一个神经网络框架,网络的结构应该是可以由使用者自定义的,这样一来也就不用为每个网络结构都重写所有代码,我们把每一层模块化,在神经网络的类中定义结构时使用这些模块化的层堆叠形成一个完整的神经网络。 阅读全文
摘要:
下面是我从cs231n上整理的神经网络的入门实现,麻雀虽小,五脏俱全,基本上神经网络涉及到的知识点都有在代码中体现。 理论看上千万遍,不如看一遍源码跑一跑。 源码上我已经加了很多注释,结合代码看一遍很容易理解。 最后可视化权重的图: 主文件,用来训练调参 two_layer_net.py 1 # c 阅读全文
摘要:
损失函数在机器学习中的模型非常重要的一部分,它代表了评价模型的好坏程度的标准,最终的优化目标就是通过调整参数去使得损失函数尽可能的小,如果损失函数定义错误或者不符合实际意义的话,训练模型只是在浪费时间。 所以先来了解一下常用的几个损失函数hinge loss(合页损失)、softmax loss、c 阅读全文
摘要:
邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该 阅读全文
摘要:
1 ''' 2 tensorflow 教程 3 mnist样例 4 ''' 5 import tensorflow as tf 6 from tensorflow.examples.tutorials.mnist import input_data 7 8 #参数设置 9 INPUT_NODE=784 10 OUTPUT_NODE=10 11 LAYER1_NODE=500... 阅读全文