摘要:
问题描述 ctr的全称是click through rate,就是预估用户的点击率,可以用于推荐系统的ranking阶段。ctr预估可以理解为给用户的特征、item的特征以及context的特征(比如日期,时间等),然后计算出user item pair的点击率。 问题定义 就是计算上面的概率。 模 阅读全文
摘要:
网卡流量监控 ifconfig和/proc/net/dev这俩都记录的是网卡从开机以后累积的网络数据流量 ifstat能打印网卡的每秒的流量信息 问题: 1.UDP单进程的cpu为啥集中在一台机器上? 2.drop和overrun都是哪些原因? 阅读全文
摘要:
runtime.SetFinalizer使用这个函数可以给一个对象设置一个析构函数,如果这个对象没有引用了,那么就会调用这个析构函数,然后会把这个对象给释放掉 阅读全文
摘要:
#define UNUSED(x) ((void)(x))void fun(int noused_arg, int b){ UNUSED(noused_arg); printf("%d\n", b);}上面那个函数因为有一个无用的参数,所以如果没有使用UNUSED那个宏,那么就会产生一个warn... 阅读全文
摘要:
1.sensitivity,也叫recall,true positive rate,含义是预测为正向的case中对的(true positive)和所有事实为正向的case的比例。2.specificity,也叫,true negative rate,含义是预测为负向的case中对的(true ne... 阅读全文
摘要:
在项目中经常会遇到一个需求就是字符串和id的转换,比如标签和标签id。因为在存储系统里面存储字符串会比较浪费内存,而存储id会节省内存和提高效率。问题分解通过字符串获得id通过id获得字符串实现思路通过字符串获得id可以通过MD5等方法,获得一个整数值,然后到系统中去查,如果存在这个id就增加一个质... 阅读全文
摘要:
大尾端就是高位在低地址,小尾端就是低位在低地址。这两个比较容易混,而且工作中经常用不到,而且面试中经常会考到,所以需要想个比较容易记忆的方法。我个人觉着可以有两种比较好的记忆方法:1、我们可以从字面来记忆,大尾端,大就是高位,尾就是低地址,组合起来就是高位在低地址。2、我们可以记忆一个例子,0x12... 阅读全文
摘要:
cost function:\(J(\theta)=\frac{1}{m}\sum_{i=1}^{m}Cost(h_\theta(x^{i}),y^{i})\)\(Cost(h_\theta(x),y)=-ylog(h_{\theta}(x))-(1-y)log(h_{\theta}(x))\)\(... 阅读全文
摘要:
memtable中的bloom filterrocksdb在memtable中添加了prefix bloom filter,就是对key取prefix,然后把这个prefix加入到bloom filter中(为什么要这么做)所以memtable中是一个prefix的bloom filter。leve... 阅读全文
摘要:
前面学习了一下rocksdb,这个db是对leveldb的一个改进,是基于leveldb1.5的版本上的改进,而且leveldb1.5以后也在不断的优化,下面从写入性能对两者进行对比。前言比较的leveldb的版本是1.18,rocksdb的版本是3.10.1.在比较的时候需要将leveldb和ro... 阅读全文