摘要: 觉得还是想有个独立域名~ http://blog.sword865.com/ 阅读全文
posted @ 2016-11-11 14:55 罗刹剑客 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 因子分解机(Factorization Machine, 简称FM)是一种不错的CTR预估模型,也是我们现在在使用的广告点击率预估模型,比起著名的Logistic Regression, FM能够把握一些组合的高阶特征,因此拥有更强的表现力。 在做点击率预估时,我们的特征往往来自于用户(user)、 阅读全文
posted @ 2016-12-08 18:48 罗刹剑客 阅读(3180) 评论(0) 推荐(0) 编辑
摘要: HttpServerModule的请求主要由HttpServer中的HttpServerTransport(默认为NettyHttpServerTransport)类处理。 NettyHttpServerTransport基于netty框架,负责监听并建立连接,信息的处理由内部类HttpChanne 阅读全文
posted @ 2015-07-28 18:46 罗刹剑客 阅读(589) 评论(0) 推荐(0) 编辑
摘要: Tornado是一款轻量级的Web服务器,同时又是一个开发框架。采用单线程非阻塞I/O模型(epoll),主要是为了应对高并发 访问量而被开发出来,尤其适用于comet应用。 Tornado服务器3大核心模块: (1) IOLoop Tornado为了实现高并发和高性能,使用了一个IOLoop来处理 阅读全文
posted @ 2015-02-15 00:10 罗刹剑客 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 最近在做搜索,抽空看一下lucene,资料挺多的,不过大部分都是3.x了……在对着官方文档大概看一下。优化后的lucene索引文件(4.9.0)一、段文件1.段文件:segments_5p和segments.gen。segments.gen保存当前段文件版本信息。segments.gen: GenHeader, Generation, Generation, Footersegments_N(s... 阅读全文
posted @ 2015-02-05 11:00 罗刹剑客 阅读(735) 评论(0) 推荐(0) 编辑
摘要: 一、基于图模型的推荐在不考虑标签时,基于二项图有两种随机游走的图推荐算法:1.probability spreading 随机游走算法,在游走中,每个目标得到权重是基于归属者的边计算出来的。每次传播(item->user->item)后用户Ui的兴趣向量:$$f_j^p=\sum_{l=1}^{... 阅读全文
posted @ 2014-11-17 21:07 罗刹剑客 阅读(4214) 评论(0) 推荐(0) 编辑
摘要: 最近在做CTR,刚好Google在KDD发了一篇文章,讲了他们的一些尝试,总结一下:先是一些公式的符号说明:一、优化算法CTR中经常用Logistic regression进行训练,一个常用的Loss Function为Online gradient descent(OGD)是一个常用的优化方法,但是在加上L1正则化后,这种方法不能产生有效的稀疏模型。相比之下 Regularized Dual Averaging (RDA)拥有更好的稀疏性,但是精度不如OGD好。FTRL-Proximal 方法可以同时得到稀疏性与精确性,不同于OGD的迭代步骤:其中$\eta_t$是一个非增的学习率FTRL- 阅读全文
posted @ 2013-08-04 01:14 罗刹剑客 阅读(8215) 评论(2) 推荐(1) 编辑
摘要: 转一套Deep Learning的文章http://blog.csdn.net/zouxy09/article/details/8775360顺便附上翻译的UFLDLhttp://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B 阅读全文
posted @ 2013-04-27 01:51 罗刹剑客 阅读(712) 评论(0) 推荐(0) 编辑
摘要: 今天收拾资料,发现了以前刚接触粗糙集时写的一个综述,好久没写博客,发上来充数好了一、粗糙集模型[1]粗糙集是Pawlak于上世纪八十年代提出的一种不确定数学模型。该模型以有限集合上的等价关系为基础,定义了上下近似两个基本操作。该模型与它的其他一般化或变种形式有着较为广泛的应用。1.1Pawlak粗糙集模型Pawlak粗糙集模型是以一个有限集合与集合上的一个等价关系为基础的。所谓的二元等价关系是一种满足自反性,对称性和传递性的关系的二元关系。因为这些性质,一个二元等价关系将一个集合分割成一到多个互不相较子集,形成了集合的一个分割,记为U/R,其中的元素与他们的并被称为精确集。在这一基础上,Paw 阅读全文
posted @ 2013-04-26 00:26 罗刹剑客 阅读(3030) 评论(1) 推荐(0) 编辑
摘要: 简单来说,R语言是一种主要用于统计分析、绘图的语言和操作环境。的源代码可自由下载使用,亦有已编译的执行档版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同时有人开发了几种图形用户界面。 为什么我会使用R语言呢?毕竟... 阅读全文
posted @ 2012-06-30 22:33 罗刹剑客 阅读(12832) 评论(0) 推荐(0) 编辑