06 2014 档案

摘要:http://www.zlovezl.cn/articles/40/简介: Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。具体简介可以参照这... 阅读全文
posted @ 2014-06-25 17:44 Django's blog 阅读(6906) 评论(0) 推荐(1) 编辑
摘要:http://www.infoq.com/cn/articles/apache-kafka?utm_source=infoq&utm_medium=popular_links_homepage简介Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apach... 阅读全文
posted @ 2014-06-25 12:57 Django's blog 阅读(892) 评论(0) 推荐(0) 编辑
摘要:http://www.infoq.com/cn/articles/java-threadPool/1. 引言合理利用线程池能够带来三个好处。第一:降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二:提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行。第三:提高线... 阅读全文
posted @ 2014-06-23 16:31 Django's blog 阅读(319) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/shenlan211314/article/details/61870351)使用ls命令来查看当前ZooKeeper中所包含的内容:[zk: 10.77.20.23:2181(CONNECTED) 1] ls /[zookeeper]2)创建一个新的zno... 阅读全文
posted @ 2014-06-23 15:13 Django's blog 阅读(513) 评论(0) 推荐(0) 编辑
摘要:http://kazoo.readthedocs.org/en/latest/basic_usage.htmlBasic UsageConnection HandlingTo begin using Kazoo, aKazooClientobject must be created and a co... 阅读全文
posted @ 2014-06-23 10:35 Django's blog 阅读(1680) 评论(0) 推荐(0) 编辑
摘要:doc:http://kazoo.readthedocs.org/en/latest/basic_usage.htmleg:from kazoo.client import KazooClientzk = KazooClient()zk.start()#!/bin/env python#Zookee... 阅读全文
posted @ 2014-06-23 10:26 Django's blog 阅读(806) 评论(0) 推荐(0) 编辑
摘要:http://hi.baidu.com/eldersun/item/b9266e019da769f0f45ba6a4python下连接zookeeper使用最多的是python 包装的zookeeper 的c客户端,但是使用c客户端来访问zookeeper不是很方便,特别是如果你有代码洁癖,肯定不能... 阅读全文
posted @ 2014-06-23 10:23 Django's blog 阅读(4645) 评论(0) 推荐(0) 编辑
摘要:JVM底层又是如何实现synchronized的?目前在Java中存在两种锁机制:synchronized和Lock,Lock接口及其实现类是JDK5增加的内容,其作者是大名鼎鼎的并发专家Doug Lea。本文并不比较synchronized与Lock孰优孰劣,只是介绍二者的实现原理。数据同步需要依... 阅读全文
posted @ 2014-06-23 09:48 Django's blog 阅读(843) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/czh0766/article/details/5260360昨天看了算法导论对散列表的介绍,今天看了一下Hashtable, HashMap这两个类的源代码,并参考了网上的一些观点,对它们的实现有了大概的理解。原来hashtable里的key-value还... 阅读全文
posted @ 2014-06-18 23:18 Django's blog 阅读(1203) 评论(0) 推荐(0) 编辑
摘要:http://perhaps.cnblogs.com/archive/2006/01/06/312335.html 昨天看到了叶漂兄的Post:《Hashtable的烦恼!》,文中提出有关Hashtable中键值对(key/value pair)排序的问题。其实所谓键值对的排序问题,实质上就是键(... 阅读全文
posted @ 2014-06-18 16:43 Django's blog 阅读(194) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用... 阅读全文
posted @ 2014-06-18 08:31 Django's blog 阅读(259) 评论(0) 推荐(0) 编辑
摘要:转自: http://www.cnblogs.com/jqyp/archive/2012/03/29/2423112.htmlJava反射机制一、什么是反射机制 简单的来说,反射机制指的是程序在运行时能够获取自身的信息。在java中,只要给定类的名字, 那么就可以通过反射机制来获得类的所有信息。二、... 阅读全文
posted @ 2014-06-17 18:33 Django's blog 阅读(242) 评论(0) 推荐(0) 编辑
摘要:Topic Model的分类和设计原则http://blog.csdn.net/xianlingmao/article/details/7065318topic model的介绍性文章已经很多,在此仅做粗略介绍,本文假设读者已经较为熟悉Topic Medel。Topic Model (LDA)认为一... 阅读全文
posted @ 2014-06-16 22:53 Django's blog 阅读(787) 评论(0) 推荐(0) 编辑
摘要:【2014中国数据库技术大会】内存计算:百分点内存数据库架构演变Posted on2014 年 5 月 5 日byadmin【IT168数据库大会现场报道】2014年4月10日-12日,第五届中国数据库技术大会(DTCC 2014)在北京五洲皇冠国际酒店拉开序幕。在为期三天的会议中,大会将围绕大数据... 阅读全文
posted @ 2014-06-16 22:40 Django's blog 阅读(526) 评论(0) 推荐(0) 编辑
摘要:1、概述Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer)$HADOOP_HOME/bi... 阅读全文
posted @ 2014-06-15 16:38 Django's blog 阅读(426) 评论(0) 推荐(0) 编辑
摘要:转自:使用Python实现Hadoop MapReduce程序英文原文:Writing an Hadoop MapReduce Program in Python根据上面两篇文章,下面是我在自己的ubuntu上的运行过程。文字基本采用博文使用Python实现Hadoop MapReduce程序, 打... 阅读全文
posted @ 2014-06-15 16:35 Django's blog 阅读(1001) 评论(0) 推荐(0) 编辑
摘要:http://agapple.iteye.com/blog/1111377zookeeper学习记录博客分类:distributed背景 前段时间看了S4流计算引擎,里面使用到了zookeeper进行集群管理,所以也就花了点时间研究了下zookeeper,不求看懂所有源码,但求了解其实现机制和原理,... 阅读全文
posted @ 2014-06-10 14:32 Django's blog 阅读(520) 评论(0) 推荐(0) 编辑
摘要:1.g++ test_search.cpp -o test_search.o -g2.gdb ./test_search.o3.l:看代码b 12:设置断点在第12行p var: 看变量n:单步执行r: runc: continue 阅读全文
posted @ 2014-06-09 17:06 Django's blog 阅读(161) 评论(0) 推荐(0) 编辑
摘要:http://www.csdn.net/article/2014-06-05/2820089摘要:MapReduce在实时查询和迭代计算上仍有较大的不足,目前,Spark由于其可伸缩、基于内存计算等特点,且可以直接读写Hadoop上任何格式的数据,逐渐成为大数据处理的新宠,腾讯分享了Spark的原理... 阅读全文
posted @ 2014-06-05 16:05 Django's blog 阅读(401) 评论(0) 推荐(0) 编辑
摘要:http://www.tuicool.com/articles/vUvQVn时间2009-08-30 15:13:22不周山原文http://www.wentrue.net/blog/?p=559不久前,始于2006年的netflix prize名花有主,几年来一直领先的Bellkor队得到了最后的... 阅读全文
posted @ 2014-06-05 15:28 Django's blog 阅读(334) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/dark_scope/article/details/17228643〇.说明 本文的所有代码均可在DML找到,欢迎点星星。一.引入 推荐系统(主要是CF)是我在参加百度的电影推荐算法比赛的时候才临时学的,虽然没拿什么奖,但是知识却是到手了,一... 阅读全文
posted @ 2014-06-05 15:07 Django's blog 阅读(1153) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/guozk/p/3316790.htmlFP-Growth算法 FP-Growth(频繁模式增长)算法是韩家炜老师在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-Tree),但仍保留项集关联信息;该算... 阅读全文
posted @ 2014-06-04 16:21 Django's blog 阅读(1101) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/guozk/p/3498844.htmlSolrCloud阶段总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍SolrCloud的功能使用及相关注意事项在代码文本框中如有显示不全的,请在文本框中按Ctrl+A再复制.版本作者/修改人日期V1... 阅读全文
posted @ 2014-06-04 16:13 Django's blog 阅读(498) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/guozk/p/3498831.htmlSolr调研总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境搭建及调试、两个核心配置文件介绍、中文分词器配置、维护索引、查询索引,高亮显示、拼写... 阅读全文
posted @ 2014-06-04 15:42 Django's blog 阅读(892) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/zouxy09/article/details/17590137机器学习算法与Python实践之(六)二分k均值聚类zouxy09@qq.comhttp://blog.csdn.net/zouxy09 机器学习算法与Python实践这个系列主要是参考《机... 阅读全文
posted @ 2014-06-04 15:23 Django's blog 阅读(941) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/zhangchaoyang/archive/2012/08/28/2660929.html#2956794华夏35度Data Mining,NLP,Search Engine机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数... 阅读全文
posted @ 2014-06-04 14:29 Django's blog 阅读(423) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/easymind223/archive/2012/10/30/2747178.html聚类分析是一种静态数据分析方法,常被用于机器学习,模式识别,数据挖掘等领域。通常认为,聚类是一种无监督式的机器学习方法,它的过程是这样的:在未知样本类别的情况下,通过计... 阅读全文
posted @ 2014-06-04 13:53 Django's blog 阅读(483) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/heqile/archive/2011/11/28/2265713.html看完了《数据结构与算法分析(C++描述)》的4.4节AVL树,做一个总结,整理一下自己实现删除算法的思路.(注:本文中图片均来自《数据结构与算法分析(C++描述)》) AVL(A... 阅读全文
posted @ 2014-06-04 12:01 Django's blog 阅读(554) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/bruce128/article/details/17796705 Solr4.6有从数据库导数据的功能。导入步骤如下: 1.将下载下来的solr4.6的dist文件夹下的solr-dataimporthandler-4.6.0.jar和solr-data... 阅读全文
posted @ 2014-06-04 11:42 Django's blog 阅读(206) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/haidao2009/article/details/8076970红黑树和c++ 虚拟继承内存分布 几乎成了我的死敌,因为完全没用过,所以导致每次看懂了之后都忘了(也许不是真的看懂了,有些关键性的东西没理解透),这次准备把这两个难题(其实也不难)仔细看懂,... 阅读全文
posted @ 2014-06-04 11:39 Django's blog 阅读(404) 评论(1) 推荐(0) 编辑
摘要:http://blog.csdn.net/haidao2009/article/details/7514787菜鸟最近开始学习machine learning。发现adaboost 挺有趣,就把自己的一些思考写下来。主要参考了http://stblog.baidu-tech.com/?p=19,其实... 阅读全文
posted @ 2014-06-04 11:31 Django's blog 阅读(609) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/yangliuy/article/details/7316496课程文本分类project SVM算法入门转自:http://www.blogjava.net/zhenandaci/category/31868.html(一)SVM的简介支持向量机(Supp... 阅读全文
posted @ 2014-06-04 10:09 Django's blog 阅读(319) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示