02 2014 档案
摘要:shared_ptr 编辑 目录 1简介 2作用 3历史 4概要 5用法 ▪ 删除共享对象 ▪ 标准容器 1简介编辑 shared_ptr是一种智能指针(smart pointer)。 2作用编辑 shared_ptr的...
阅读全文
摘要:摘要:pthread_join使一个线程等待另一个线程束。 代码中如果没有pthread_join主线程会很快结束从而使整个进程结束,从而使创建的线程没有机会开始执行就结束了。加入pthread_join后,主线程会一直等待直到等待的线程结束自己才结束,使创建的线程有机会执行。 函数pth...
阅读全文
摘要:__thread是GCC内置的线程局部存储设施,存取效率可以和全局变量相比。__thread变量每一个线程有一份独立实体,各个线程的值互不干扰。可以用来修饰那些带有全局性且值可能变,但是又不值得用全局变量保护的变量。 __thread使用规则:只能修饰POD类型(类似整...
阅读全文
摘要:一 代理 1 tor http://zh.wikipedia.org/zh/Tor
阅读全文
摘要:摘要 : 简单地比较Redis与Memcached的区别,大多数都会得到以下观点: 1 Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储。 2 Redis支持数据的备份,即master-slave模式的数据备份。 3 Redis支持数据...
阅读全文
摘要:FP树构造 FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个...
阅读全文
摘要:Eclat算法 与fp-growth 和apriori算法不同,Eclat算法加入了倒排的思想,具体就是将事务数据中的项作为key,每个项对应的事务ID作为value。 原输入数据为 tid item 1 A,B 2 B,C 3 A,C 4 A,B,C 转...
阅读全文
摘要:1 Apriori介绍 Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后...
阅读全文
摘要:摘要: Apriori算法是产生k项高频项目组的一般手段。算法概要:首先产生k项高频项目集合Lk,自身链接形成k+1项的项目结合C(k+1),然后剪枝(去掉以前去掉的不满足支持度的高频),生成K=1项高频项目集合L(k+1) 1 早些时候写过关于购物篮分析的文章,其中提到了C5.0和...
阅读全文
摘要:1 同步停止,报错误: Could not find first log file name in binary log index file 数据库主从出错: Slave_IO_Running: No 一方面原因是因为网络通信的问题也有可能是日志读取错误的问题。以下是日...
阅读全文
摘要:关联规则 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 事 故事 在描述有关关联规则的一些细节之前,先来看...
阅读全文
摘要:机器学习与数据挖掘中的十大经典算法 背景: top10算法的前期背景是吴教授在香港做了一个关于数据挖掘top10挑战的一个报告,会后有一名内地的教授提出了一个类似的想法。吴教授觉得非常好,开始着手解决这个事情。找了一系列的大牛(都是数据挖掘的大牛),都觉得想法很好,但是都不愿自己干。原因估...
阅读全文
摘要:摘要:调大uwsgi配置中 listen=1024的数目是提高并发能力最有效的办法。第二种方法是调大processes数目 发现总是超时报警 1 使用ab确定网络具体征况 [bre@dmp-1 ~]$ ab -n 1000 -c 100 http://.com/Mapping.do? ...
阅读全文
摘要:摘要by crazyhacking: 一 搜索引擎的核心问题就是3个:1、建立资料库,通过爬虫系统实现;2、建立一种数据结构,可以根据关键词找到含有这个词的页面。通过索引系统(倒排索引)实现。3排序系统。 pagerank解决了第三个问题;如何对查询结果排序。 二PageRank的思想概...
阅读全文
摘要:浅说机器学习中“迭代法” zouxy09@qq.com http://blog.csdn.net/zouxy09 首先来点八股文(来自百度百科):迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,跟迭代法相对应的是直接法(或者称为一次解法),即一次性解决问题。迭代算法是用...
阅读全文
摘要:在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable)。最大期望经常用在机器学习和计算机视觉的数据聚类(DataClustering)领域。最大期望算法经过两个...
阅读全文
摘要:非专业部分--构建人生 以书籍和网易公开课为主 (1)理财&投资 基金投资相关,好的书籍? (2)哲学总览 《公正》这个看了大半,需要总结归纳。 (必选) 同时结合哲学史,归纳西方哲学的发展概况。(必选) (3)心理学 耶鲁大学公开课:心理学导论(必选) 你的梦应该如何解析?男...
阅读全文
摘要:一 公司工作 完成好自动化营销系统构建,并以此为契机掌握推荐,数据分析,可视化等知识 1 完成统计和可视化。具体参考 cookie mapping项目规划 2 以广告投放为契机,学习数据分析,推荐系统 二 业余掌握 时间主要是周末花费半天或者晚上。所以一个月也就是4个半天,大约2天时间。 一...
阅读全文