06 2016 档案

摘要:1. Longest Substring Without Repeating Characters 思路:需要 hashmap 辅助保存各个字符的位置,且随时更新最新位置 若第 i 个位置的字符 c 出现过,则 dp[i] = min(map.get(c)-i,dp[i+1]+1) 若没出现则 dp 阅读全文
posted @ 2016-06-30 17:02 ooon 阅读(462) 评论(0) 推荐(0) 编辑
摘要:本文将介绍常见的自然语言处理中的特征选择算法,在常见的 NLP 任务中,可以分为有监督与无监督任务,在有监督的任务中,比如文本分类中,常用的特征选择方法有基于阈值的统计方法与空间变换算法(比如 PCA,SVD),本文主要介绍无监督特征选择算法,因为基于阈值的统计方法具有计算复杂度低,速度快的优点,尤 阅读全文
posted @ 2016-06-25 18:32 ooon 阅读(1639) 评论(0) 推荐(0) 编辑
摘要:数据结构的一部分重要内容便是排序算法,对于排序之后的数组可以采用快速的 binary search 算法。排序算法多种多样,按类别有插入类、选择类、交换类,还有一些其他的比如归并等等,对于数据量太多内存无法盛放的情况,则有外部排序。度量各种算法的标准主要有,1)稳定性,2)最好/坏情况下的时间复杂度 阅读全文
posted @ 2016-06-24 13:18 ooon 阅读(481) 评论(1) 推荐(1) 编辑
摘要:之前已经介绍过关于 Recurrent Neural Nnetwork 与 Long Short-Trem Memory 的网络结构与参数求解算法( 递归神经网络(Recurrent Neural Networks,RNN) ,LSTM网络(Long Short-Term Memory )),本文将 阅读全文
posted @ 2016-06-21 15:45 ooon 阅读(12559) 评论(2) 推荐(0) 编辑
摘要:本来来自 :http://blog.csdn.net/u010402786/article/details/51682917 一、书籍 Deep learning (2015) 作者:Bengio 下载地址:http://www.deeplearningbook.org/ 二、理论 1.在神经网络中 阅读全文
posted @ 2016-06-20 21:23 ooon 阅读(5220) 评论(0) 推荐(0) 编辑
摘要:本文基于前两篇 1. 多层感知机及其BP算法(Multi-Layer Perceptron) 与 2. 递归神经网络(Recurrent Neural Networks,RNN) RNN 有一个致命的缺陷,传统的 MLP 也有这个缺陷,看这个缺陷之前,先祭出 RNN 的 反向传导公式与 MLP 的反 阅读全文
posted @ 2016-06-17 16:31 ooon 阅读(23085) 评论(0) 推荐(1) 编辑
摘要:在深度学习领域,传统的多层感知机(MLP)具有出色的表现,取得了许多成功,它曾在许多不同的任务上——包括手写数字识别和目标分类上创造了记录。甚至到了今天,MLP在解决分类任务上始终都比其他方法要略胜一筹。尽管如此,大多数专家还是会达成共识:MLP可以实现的功能仍然相当有限。究其原因,人类的大脑有着惊 阅读全文
posted @ 2016-06-17 16:28 ooon 阅读(31149) 评论(0) 推荐(1) 编辑
摘要:二叉树是面试必考题目,这里总结一些常见的2叉树的题目,树的定义如下: public class TreeNode { int val; TreeNode left; TreeNode right; TreeNode(int x) { val = x; } } 1 统计树的深度 非递归版本可以层次遍历 阅读全文
posted @ 2016-06-13 09:38 ooon 阅读(1128) 评论(0) 推荐(0) 编辑
摘要:学校的网比较特殊(本人比较菜),需要DHCP获得地址,那么有时候IP被占用了,应该如何应对呢? 1)修改/etc/hosts 2) 修改spark-env.sh 里的 Master 地址 ,Master对应spark1 的地址 ,source使其 生效 3)hdfs启动若有问题,则删掉 tmp ,d 阅读全文
posted @ 2016-06-12 21:20 ooon 阅读(393) 评论(0) 推荐(0) 编辑
摘要:Deep Learning 近年来在各个领域都取得了 state-of-the-art 的效果,对于原始未加工且单独不可解释的特征尤为有效,传统的方法依赖手工选取特征,而 Neural Network 可以进行学习,通过层次结构学习到更利于任务的特征。得益于近年来互联网充足的数据,计算机硬件的发展以 阅读全文
posted @ 2016-06-12 13:23 ooon 阅读(43744) 评论(0) 推荐(1) 编辑
摘要:1.输入接受一个数字 n ,求一个队列,该队列由数字[1...n]组成, 且满足不断将队头元素移到队尾,然后输出队头,如此循环,最后的输出是有序的。 思路:用有序的队列存放下标 [0...n-1] ,用下标进行移到队尾,出队的操作,出队的值对应的是 [1....n] ,这就构建了一个下标到数字的映射 阅读全文
posted @ 2016-06-06 17:26 ooon 阅读(584) 评论(0) 推荐(0) 编辑
摘要:今天,也没出去,晚上宿舍没有人,自己思考了下人生,毕设还是大事,觉得现在有必要把LDA从前往后彻彻底底的读一遍了,因为现在的感觉就是什么都知道一点皮毛,但是理解的都不深,LDA好像(恩,相当不好)现在理解的不是很好,涉及的内容挺多,细分的话有: 1)参数估计 MLE MAP 2)Bayes Esti 阅读全文
posted @ 2016-06-05 21:05 ooon 阅读(600) 评论(0) 推荐(0) 编辑
摘要:1、启用LaTeX数学公式支持的操作方法: 进入博客后台,在“选项”中选中“启用数学公式支持”。 启动之后,需要写公式时,插入个界定符: 大功告成,so easy ! 妈妈再也不用担心我的学习! 试验之后才发现,再也看不懂自己写的博客是啥了 :) !还是准备个 latext编辑器玩玩吧,写完在传上来 阅读全文
posted @ 2016-06-04 22:03 ooon 阅读(428) 评论(0) 推荐(0) 编辑
摘要:语言模型简介(Language Model) 简单的说,语言模型 (Language Model) 是用来计算一个句子出现概率的模型,假设句子 ,其中 代表句子中的第 个词语,则语句 W 以该顺序出现的概率可以表示为: 其中 , $p(w_n|w_1^{n-1}) = p(w_n|w_1,w_2,. 阅读全文
posted @ 2016-06-04 08:52 ooon 阅读(7632) 评论(1) 推荐(0) 编辑
摘要:HTTP 报文分为请求报文与响应报文 HTTP 请求报文 请求报文分为 4部分,请求行,请求头部,空行,请求体部,如下图所示: 请求行分为 3 部分,为请求方法 URL 与协议版本,中间以空格隔开。 ① 是请求方法,分为 GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、 阅读全文
posted @ 2016-06-01 09:53 ooon 阅读(297) 评论(0) 推荐(0) 编辑