摘要:
研究生二年级实习(2010年5月)开始,一直跟着王益(yiwang)和靳志辉(rickjin)学习LDA,包括对算法的理解、并行化和应用等等。毕业后进入了腾讯公司,也一直在从事相关工作,后边还在yiwang带领下,与孙振龙、严浩等一起实现了一套大规模并行的LDA训练系统——Peacock。受rick... 阅读全文
2015年2月15日
2014年8月28日
摘要:
推荐算法主要分为基于内容的算法和协同过滤. 协同过滤的两种基本方法是基于邻居的方法(基于内容/物品的协同过滤)和隐语义模型. 矩阵分解乃是实现隐语义模型的基石.矩阵分解根据用户对物品的评分, 推断出用户和物品的隐语义向量, 然后根据用户和物品的隐语义向量来进行推荐.推荐系统用到的数据可以有显式评分和... 阅读全文
2014年8月23日
摘要:
本文纯转载; 主要是想系统的跟tornadomeet的顺序走一遍deeplearning;前言: 最近打算稍微系统的学习下deep learing的一些理论知识,打算采用Andrew Ng的网页教程UFLDL Tutorial,据说这个教程写得浅显易懂,也不太长。不过在这这之前还是复习下machi... 阅读全文
2014年8月13日
摘要:
hiredis是redis数据库的C接口,目前只能在linux下使用,几个基本的函数就可以操作redis数据库了。函数原型:redisContext *redisConnect(const char *ip, int port)说明:该函数用来连接redis数据库,参数为数据库的ip地址和端口,一般... 阅读全文
摘要:
大约一年多前,公司同事开始使用Redis,不清楚是配置,还是版本的问题,当时的Redis经常在使用一段时间后,连接爆满且不释放。印象中,Redis 2.4.8以下的版本由于设计上的主从库同步问题,就会导致整个问题,不知是否确为这个Bug所致。但从那以后,我就很少敢去尝试使用Redis。曾想转投Mon... 阅读全文
2014年7月28日
摘要:
尊重原创,注重版权,转贴请注明原文地址:http://www.cnblogs.com/vincent-hv/p/3322966.html1、配置程序使用资源:System.setProperty("spark.executor.memary", "512m")2、创建自己的SparkContext对... 阅读全文
2014年7月18日
摘要:
目录(?)[-]目标编译源码编译链接是否使用SSLautoconf宏跨平台的可移植的代码全局初始化CURL_GLOBAL_WIN32CURL_GLOBAL_SSLlibcurl提供的功能使用easy interface多线程问题什么时候libcurl无法正常工作上传数据到远程站点关于密码HTTP验证... 阅读全文
2014年7月15日
摘要:
Git 基础读完本章你就能上手使用 Git 了。本章将介绍几个最基本的,也是最常用的 Git 命令,以后绝大多数时间里用到的也就是这几个命令。读完本章,你就能初始化一个新的代码仓库,做一些适当配置;开始或停止跟踪某些文件;暂存或提交某些更 新。我们还会展示如何让 Git 忽略某些文件,或是名称符合特... 阅读全文
摘要:
起步本章介绍开始使用 Git 前的相关知识。我们会先了解一些版本控制工具的历史背景,然后试着让 Git 在你的系统上跑起来,直到最后配置好,可以正常开始开发工作。读完本章,你就会明白为什么 Git 会如此流行,为什么你应该立即开始使用它。1.1 关于版本控制什么是版本控制?我真的需要吗?版本控制是一... 阅读全文
摘要:
新博客地址:http://gorthon.sinaapp.com/持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象。通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识。另外,还会让您更深一步地了解Python 的对... 阅读全文