上一页 1 2 3 4 5 6 7 8 9 ··· 34 下一页

2017年4月13日

(转)最小Hash和局部敏感Hash

摘要: 转自:http://www.07net01.com/2015/08/907327.html 在数据挖掘中,有一个比较基本的问题,就是比较两个集合的相似度。关于这个问题,最笨的方法就是用一个两重循环来遍历这两个集合中的所有元素,进而统计这两个集合中相同元素的个数。但是,当这两个集合里的元素数量非常庞大 阅读全文

posted @ 2017-04-13 17:09 zhouzhou0615 阅读(300) 评论(0) 推荐(0) 编辑

2017年4月11日

(转)java 虚拟机内存划分

摘要: 深入理解java虚拟机(一):java内存区域(内存结构划分)深入理解java虚拟机(二):java内存溢出实战 深入理解java虚拟机(三):String.intern()-字符串常量池深入理解java虚拟机(四):对象存活判定算法和垃圾收集算法深入理解java虚拟机(五):hotspot垃圾收集 阅读全文

posted @ 2017-04-11 17:49 zhouzhou0615 阅读(238) 评论(0) 推荐(0) 编辑

(转)java中新生代和老年代

摘要: 转自:http://blog.csdn.net/lojze_ly/article/details/49456255 聊聊JVM的年轻代 1.为什么会有年轻代 我们先来屡屡,为什么需要把堆分代?不分代不能完成他所做的事情么?其实不分代完全可以,分代的唯一理由就是优化GC性能。你先想想,如果没有分代,那 阅读全文

posted @ 2017-04-11 17:39 zhouzhou0615 阅读(7918) 评论(1) 推荐(0) 编辑

2017年4月6日

(转)git使用规范

摘要: 转自:http://www.ruanyifeng.com/blog/2015/08/git-use-process.html 团队开发中,遵循一个合理、清晰的Git使用流程,是非常重要的。 否则,每个人都提交一堆杂乱无章的commit,项目很快就会变得难以协调和维护。 下面是ThoughtBot 的 阅读全文

posted @ 2017-04-06 15:07 zhouzhou0615 阅读(161) 评论(0) 推荐(0) 编辑

2017年4月5日

(转)git rebase 命令

摘要: 转自:http://blog.csdn.net/hudashi/article/details/7664631/ 原文: http://gitbook.liuhui998.com/4_2.html 一、基本 git rebase用于把一个分支的修改合并到当前分支。 假设你现在基于远程分支"origi 阅读全文

posted @ 2017-04-05 14:14 zhouzhou0615 阅读(177) 评论(0) 推荐(0) 编辑

2017年3月30日

(转)linux 之 grep命令

摘要: 转自:http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2856896.html 简介 grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打 阅读全文

posted @ 2017-03-30 16:44 zhouzhou0615 阅读(196) 评论(0) 推荐(0) 编辑

2016年11月14日

spark 为什么要用broadcast[转]

摘要: 为什么要用broadcast? 21down vote If you have huge array that is accessed from Spark Closures, for example some reference data, this array will be shipped t 阅读全文

posted @ 2016-11-14 20:25 zhouzhou0615 阅读(3616) 评论(0) 推荐(0) 编辑

2016年10月29日

大数据日知录【第八章:分布式文件系统】怎么存储大文件

摘要: GFS: 每一个GFS文件被划分为不同的Chunk,同一个而文件的不同Chunk可能会存储在不同的Chunk服务器上,在每个Chunk服务器上,每一个Chunk会进一步被切分,被切分为Block(文件读取的最小单位)。Chunk是最基本的存储单元,Block是最小的读取单元。 HDFS: NameN 阅读全文

posted @ 2016-10-29 16:11 zhouzhou0615 阅读(201) 评论(0) 推荐(0) 编辑

Palindrome Partitioning II

摘要: Palindrome Partitioning II 问题: Given a string s, partition s such that every substring of the partition is a palindrome. Return the minimum cuts neede 阅读全文

posted @ 2016-10-29 15:38 zhouzhou0615 阅读(179) 评论(0) 推荐(0) 编辑

2016年10月25日

大数据日知录【第六章:分布式通信】进程和进程之间如何通信

摘要: 消息交换: 分布式通信是位于不同机器上进程间通信的粘合剂 若单纯的以JSON或者XML传递信息的话,太多重复传递Schema的过程,通信效率低。 序列化的框架传输效率高 消息队列: 模式:消息队列模式和Pub-Sub模式 Kafka:(至少送达一次,可以读取历史的消息) 消息生产者-->代理服务器< 阅读全文

posted @ 2016-10-25 18:40 zhouzhou0615 阅读(487) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 9 ··· 34 下一页

导航