摘要:
点击率预测中还有一个重要的问题,就是探索与利用,它在工程中解决的并不好,我这章把现在论文中的常见的几种方法介绍一下。探索与利用它是所有互联网应用都要面对的一个问题,形式化一些,可以解释为:整体的效果是无法通过采样得到的,因为观察到的数据只是投放过的广告,而很多还没有投放的广告,想得到它们的效果,就很... 阅读全文
摘要:
原文地址:http://blog.csdn.net/abcjennifer/article/details/7716281本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularizati... 阅读全文
摘要:
Scala是数据挖掘算法领域最有力的编程语言之一,语言本身是面向函数,这也符合了数据挖掘算法的常用场景:在原始数据集上应用一系列的变换,语言本身也对集合操作提供了众多强大的函数,本文将以List类型为例子,介绍常见的集合变换操作。一、常用操作符(操作符其实也是函数)++ ++[B](that: Ge... 阅读全文
摘要:
转载请标明出处,原文地址:http://blog.csdn.net/hackbuteer1/article/details/7561235 智能指针(smart pointer)是存储指向动态分配(堆)对象指针的类,用于生存期控制,能够确保自动正确的销毁动态分配的对象,防止内存泄露。它的一... 阅读全文
摘要:
1、Map-Reduce的逻辑过程假设我们需要处理一批有关天气的数据,其格式如下:按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/-0067011990999991950051507+0000+004301199... 阅读全文
摘要:
TF-IDF(termfrequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著... 阅读全文
摘要:
Test_GLCM_Features.m% Timing improvement of % GLCM_Features3.m [non vectorized without ismember] and% GLCM_Features4.m [vectorized without ismember] o... 阅读全文
摘要:
【版权声明】转载请注明出处:http://www.cnblogs.com/TenosDoIt/p/3666585.html以下排序算法的正确性都可以在LeetCode的链表排序这一题检测。本文用到的链表结构如下(排序算法都是传入链表头指针作为参数,返回排序后的头指针)struct ListNode ... 阅读全文
摘要:
链接网址:http://www.cppblog.com/wuxu/ 阅读全文
摘要:
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3415题目大意:给出一个有N个数字(N=j-k)就可以得到以j为终点长度不大于k的和最大的序列了。将原问题转化为这样一个问题后,就可以用单调队列解决了。单调队列即保持队列中的元素单调递增(或递减)的这样一... 阅读全文