摘要:
(本文是根据 "neuralnetworksanddeeplearning" 这本书的第二章 "How the backpropagation algorithm works" 整理而成的读书笔记,根据个人口味做了删减) 在上一章的学习中,我们介绍了神经网络可以用梯度下降法来训练,但梯度的计算方法却 阅读全文
摘要:
(本文是根据 "neuralnetworksanddeeplearning" 这本书的第一章 "Using neural nets to recognize handwritten digits" 整理而成的读书笔记,根据个人口味做了删减) 对于人类来说,识别下面的数字易如反掌,但对计算机而言,却不 阅读全文
摘要:
今天分享的这篇论文是 SIGGRAPH 2015 的入选论文,标题比较长,但它做的事情其实很简单:通过一张图片,找到和这张图片最相似的 3D 形状👇。 论文的思路 一开始看到论文的结果图的时候,觉得这个想法还是很有新意的。由于我刚刚踏入图形学的领域,对这类技术的认识还比较肤浅,就在网上搜了下相关的 阅读全文
摘要:
在上计算机视觉这门课的时候,老师曾经留过一个作业:识别一张 A4 纸上的手写数字。按照传统的做法,这种手写体或者验证码识别的项目,都是按照 定位 + 分割 + 识别 的套路。但凡上网搜一下,就能找到一堆识别的教程,分割的文章次之,而定位的文章就少之又少了。这其中的缘由也很简单:识别目前来说已经不是什 阅读全文
摘要:
与 Selective Search 初次见面是在著名的物体检测论文 「Rich feature hierarchies for accurate object detection and semantic segmentation」,因此,这篇论文算是阅读 R CNN 的准备。 这篇论文的标题虽然 阅读全文
摘要:
Bag of Feature 是一种图像特征提取方法,它借鉴了文本分类的思路(Bag of Words),从图像抽象出很多具有代表性的「关键词」,形成一个字典,再统计每张图片中出现的「关键词」数量,得到图片的特征向量。 Bag of Words 模型 要了解「Bag of Feature」,首先要知 阅读全文
摘要:
TensorFlow 更新频率实在太快,从 1.0 版本正式发布后,很多 API 接口就发生了改变。今天用 TF 训练了一个 CNN 模型,结果在保存模型的时候居然遇到各种问题。Google 搜出来的答案也是莫衷一是,有些回答对 1.0 版本的已经不适用了。后来实在没办法,就翻了墙去官网看了下,结果 阅读全文
摘要:
最近想做一个识别验证码的程序。目标其实很简单,就是识别出某网站验证码的字母和数字。 这种类型的验证码已经被做烂了,相应的破解程序也很多。但我只是想学习消遣一下。 我已经通过爬虫收集了某网站的大量验证码图片,并通过图像处理的方法把字母和数字分割出来(好在这类验证码比较简单,切割工作相对容易)。之后,便 阅读全文
摘要:
今天发现一个用 numpy 随机化数组的技巧。 需求 我有两个数组( ndarray ):train_datasets 和 train_labels。其中,train_datasets 的每一行和 train_labels 是一一对应的。现在我要将数组打乱并用于训练,打乱后要求两者的行与行之间必须保 阅读全文
摘要:
关于决策树,想必大部分人都已经耳熟能详了,这是一种用来预测行为的树状分叉结构。本文主要想总结一下最常用的决策树生成算法: "ID3" , "C4.5" 以及 "CART" 。 构造的原则 熟悉决策树的你一定记得,决策树每个非叶子结点对应的其实是一个属性。比方说,想判断一个男生是不是 gay,我们首先 阅读全文
摘要:
Bagging 和 Boosting 都属于机器学习中的元算法(meta algorithms)。所谓元算法,简单来讲,就是将几个较弱的机器学习算法综合起来,构成一个更强的机器学习模型。这种「三个臭皮匠,赛过诸葛亮」的做法,可以帮助减小方差(over fitting)和偏差(under fittin 阅读全文
摘要:
相比 2D 中的旋转变换,3D 中的旋转变换复杂了很多。关于 2D 空间的旋转,可以看 "这篇文章" 。本文主要粗略地探讨一下 3D 空间中的旋转。 旋转的要素 所谓旋转要素就是说,我们只有知道了这些条件,才知道怎么旋转一个物体。回忆 2D 空间中的旋转,我们需要确定旋转中心、旋转角以及旋转方向才能 阅读全文
摘要:
最近频繁在论文中看到「PCA」的影子,所以今天决定好好把「PCA」的原理和算法过程弄清楚。 「PCA」是什么 PCA,又称主成分分析,英文全称**「Principal Components Analysis」**。维基百科上的解释是:「PCA」是一种分析、简化数据集的技术,经常用于减少数据集的维数, 阅读全文
摘要:
概念 协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 这个解释摘自维基百科,看起来很是抽象,不好理解。其实简单来讲,协方差就是衡量两个变量相关性的变量。当协方差为正时,两个变量呈正相关关系(同增同减);当协方差为负 阅读全文
摘要:
概要 这篇文章中,我们来聊聊 OpenGL 中的坐标系统以及它们之间的转换。 (⚠️阅读本文需要有线性代数基础。) 坐标变换原理 首先,我们需要运用一点线性代数的知识,了解不同坐标系统变换的原理。 由于本文针对的是三维坐标,所以讨论的空间是 $R^3$ 空间。 在标准三维坐标系中,我们通常用一个向量 阅读全文
摘要:
最近在看图像风格化的论文的时候,频繁遇到 Bilateral Filter。google 一波后,发现并不是什么不得了的东西,但它的思想却很有借鉴意义。 简介 Bilateral Filter,中文又称「双边滤波器」。相比以往那些仅仅使用位置信息进行滤波的 filter,Bilateral Filt 阅读全文