摘要: PRIORITIZED EXPERIENCE REPLAY ICLR 2016 经验回放使得 online reinforcement learning agent 能够记住并且回放过去的经验。在先前的工作中,从回放记忆中随机的采样 experience transitions。但是,这种方法简单的 阅读全文
posted @ 2016-07-11 14:49 AHU-WangXiao 阅读(6612) 评论(0) 推荐(0) 编辑
摘要: 经典以及最新的半监督方法 (SSL) 代码总结 最近因为做实验需要,收集了一些半监督方法的代码,列出了一个清单: 1. NIPS 2015 Semi-Supervised Learning with Ladder Networks https://github.com/CuriousAI/ladde 阅读全文
posted @ 2016-07-06 23:19 AHU-WangXiao 阅读(1836) 评论(1) 推荐(0) 编辑
摘要: 论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做是一个 黑匣子,只是用来提取特征,而是在大量的图像和 ImageNet 分类任务上关于 CNN 的 f 阅读全文
posted @ 2016-07-04 19:54 AHU-WangXiao 阅读(2520) 评论(2) 推荐(0) 编辑
摘要: RATM: RECURRENT ATTENTIVE TRACKING MODEL ICLR 2016 本文主要内容是 结合 RNN 和 attention model 用来做目标跟踪。 其中模型的组成主要是: 1. an attention model 主要用来从输入图像中提取 patch; 2. 阅读全文
posted @ 2016-07-03 21:59 AHU-WangXiao 阅读(1755) 评论(0) 推荐(0) 编辑
摘要: 初始 DQN 程序 所遇到的问题 最近在看 DQN,但是想试试别人放出来的 code,但是发现,额,各种问题,在此记录,以备不时之需! 问题1. wangxiao@GTX980:~/Documents/DRL/DQN-tensorflow-master$ python main.py --env_n 阅读全文
posted @ 2016-07-03 09:55 AHU-WangXiao 阅读(1623) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-07-01 20:11 AHU-WangXiao 阅读(2) 评论(0) 推荐(0) 编辑
摘要: DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns CVPR 2016 本文提出一种 分割图像 patch 的方法,因为细粒度的分类问题,如:行人动作识别 和 行人属性识别等等。 Appearance Overview 阅读全文
posted @ 2016-06-30 20:40 AHU-WangXiao 阅读(1359) 评论(0) 推荐(0) 编辑
摘要: Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model ICCV 2013 Paper:http://www.escience.cn/system/file?fileId=7224 阅读全文
posted @ 2016-06-29 23:09 AHU-WangXiao 阅读(773) 评论(3) 推荐(0) 编辑
摘要: Ubuntu 14.04 关于 TensorFlow 环境的配置 本教程截图于 TensorFlow 官方文档中文版 https://github.com/jikexueyuanwiki/tensorflow-zh 阅读全文
posted @ 2016-06-28 19:49 AHU-WangXiao 阅读(243) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-27 17:28 AHU-WangXiao 阅读(25) 评论(0) 推荐(0) 编辑
摘要: Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common的,是否对性能有害,以及是否 阅读全文
posted @ 2016-06-27 15:39 AHU-WangXiao 阅读(6747) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-21 21:53 AHU-WangXiao 阅读(62) 评论(0) 推荐(0) 编辑
摘要: Playing Atari with Deep Reinforcement Learning 《Computer Science》, 2013 Abstract: 本文提出了一种深度学习方法,利用强化学习的方法,直接从高维的感知输入中学习控制策略。模型是一个卷积神经网络,利用 Q-learning的 阅读全文
posted @ 2016-06-20 21:57 AHU-WangXiao 阅读(7996) 评论(0) 推荐(1) 编辑
摘要: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 Project page: http://cvlab.postech.ac.kr/research/mdnet/ Paper: http 阅读全文
posted @ 2016-06-19 19:05 AHU-WangXiao 阅读(8609) 评论(0) 推荐(1) 编辑
摘要: Learning to Track: Online Multi-Object Tracking by Decision Making ICCV 2015 本文主要是研究多目标跟踪,而 online 的多目标检测的主要挑战是 如何有效的将当前帧检测出来的目标和之前跟踪出来的目标进行联系。本文将 onl 阅读全文
posted @ 2016-06-18 15:35 AHU-WangXiao 阅读(5026) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-16 11:26 AHU-WangXiao 阅读(9) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-15 15:48 AHU-WangXiao 阅读(10) 评论(0) 推荐(0) 编辑
摘要: Human-level control through deep reinforcement learning Nature 2015 Google DeepMind Abstract RL 理论 在动物行为上,深入到心理和神经科学的角度,关于在一个环境中如何使得 agent 优化他们的控制,提供了 阅读全文
posted @ 2016-06-13 16:00 AHU-WangXiao 阅读(2511) 评论(0) 推荐(2) 编辑
摘要: (译) 强化学习 第一部分:Q-Learning 以及相关探索 Q-Learning review: Q-Learning 的基础要点是:有一个关于环境状态S的表达式,这些状态中可能的动作 a,然后你学习这些状态下他们action的值。直观的讲,这个值,Q,是 状态-动作值(state-action 阅读全文
posted @ 2016-06-10 16:45 AHU-WangXiao 阅读(679) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-07 00:18 AHU-WangXiao 阅读(3) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-06 16:03 AHU-WangXiao 阅读(4) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-06 15:17 AHU-WangXiao 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-06 15:17 AHU-WangXiao 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Multiple Object Recognition With Visual Attention Google DeepMind ICRL 2015 本文提出了一种基于 attention 的用于图像中识别多个物体的模型。该模型是利用RL来训练 Deep RNN,以找到输入图像中最相关的区域。尽管 阅读全文
posted @ 2016-06-05 00:41 AHU-WangXiao 阅读(5817) 评论(0) 推荐(0) 编辑
摘要: Attention For Fine-Grained Categorization Google ICLR 2015 本文说是将Ba et al. 的基于RNN 的attention model 拓展为受限更少,或者说是非受限的视觉场景。这个工作和前者很大程度上的不同在于,用一个更加有效的视觉网络, 阅读全文
posted @ 2016-06-04 23:47 AHU-WangXiao 阅读(1568) 评论(1) 推荐(0) 编辑
摘要: 新手教程之:循环网络和LSTM指南 (A Beginner’s Guide to Recurrent Networks and LSTMs) 本文翻译自:http://deeplearning4j.org/lstm.html 其他相关教程: 1. 深度神经网络简介 http://deeplearni 阅读全文
posted @ 2016-06-03 15:47 AHU-WangXiao 阅读(1026) 评论(0) 推荐(0) 编辑
摘要: 本文转自:http://www.analyticsvidhya.com/blog/2016/06/quick-guide-build-recommendation-engine-python/ Introduction This could help you in building your fir 阅读全文
posted @ 2016-06-02 23:45 AHU-WangXiao 阅读(481) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-02 11:37 AHU-WangXiao 阅读(3) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-06-01 20:54 AHU-WangXiao 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 利用 t-SNE 高维数据的可视化 具体软件和教程见: http://lvdmaaten.github.io/tsne/ 简要介绍下用法: % Load data load ’mnist_train.mat’ ind = randperm(size(train_X, 1)); train_X = t 阅读全文
posted @ 2016-06-01 19:02 AHU-WangXiao 阅读(2710) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-05-31 17:11 AHU-WangXiao 阅读(36) 评论(0) 推荐(0) 编辑
摘要: Bilinear CNN Models for Fine-grained Visual Recognition CVPR 2015 本文提出了一种双线性模型( bilinear models),一种识别结构,该结构由两个特征提取器产生,两个输出是图像每一个位置的外积(outer product),然 阅读全文
posted @ 2016-05-30 01:08 AHU-WangXiao 阅读(6572) 评论(0) 推荐(0) 编辑
摘要: The first time use Lua for programing Wang Xiao 1. 关于 lua 的变量类型: lua 变量的定义与matlab有点不同: local d , f = 5 ,10 --声明局部变量 d,f。 d , f = 5, 10; --声明全局变量 d,f。 阅读全文
posted @ 2016-05-28 20:54 AHU-WangXiao 阅读(288) 评论(0) 推荐(0) 编辑
摘要: Recurrent Models of Visual Attention Google DeepMind 模拟人类看东西的方式,我们并非将目光放在整张图像上,尽管有时候会从总体上对目标进行把握,但是也是将目光按照某种次序(例如,从上倒下,从左到右等等)在图像上进行扫描,然后从一个区域转移到另一个区域 阅读全文
posted @ 2016-05-28 15:06 AHU-WangXiao 阅读(20824) 评论(1) 推荐(1) 编辑
摘要: 解决ssh的"Write failed: Broken pipe"问题 问题场景 服务器环境:阿里云 Linux CentOS 主机 客户端:Mac OSX Terminal 问题现象 用 ssh 命令连接服务器之后,如果一段时间不操作,再次进入 Terminal 时会有一段时间没有响应,然后就出现 阅读全文
posted @ 2016-05-28 13:36 AHU-WangXiao 阅读(666) 评论(0) 推荐(0) 编辑
摘要: Localizing by Describing: Attribute-Guided Attention Localization for Fine-Grained Recognition Baidu Research 本文主要是将part描述利用起来,协助进行part定位,针对每一个定位好的par 阅读全文
posted @ 2016-05-27 21:45 AHU-WangXiao 阅读(800) 评论(0) 推荐(0) 编辑
摘要: 转载自:维基百科 蒙特卡洛方法 https://zh.wikipedia.org/wiki/%E8%92%99%E5%9C%B0%E5%8D%A1%E7%BE%85%E6%96%B9%E6%B3%95 蒙特卡洛方法[编辑] 维基百科,自由的百科全书 蒙特卡洛方法(英语:Monte Carlo met 阅读全文
posted @ 2016-05-27 20:38 AHU-WangXiao 阅读(896) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-05-27 17:54 AHU-WangXiao 阅读(5) 评论(0) 推荐(0) 编辑
摘要: Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grained Recognition 细粒度的识别(Fine-grained recognition)的挑战 阅读全文
posted @ 2016-05-26 20:38 AHU-WangXiao 阅读(4864) 评论(0) 推荐(0) 编辑
摘要: Wide Residual Networks 阅读全文
posted @ 2016-05-25 20:45 AHU-WangXiao 阅读(832) 评论(0) 推荐(0) 编辑