上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页

2016年10月25日

大数据日知录【第五章:分布式协调系统】笔记--如何当选老大?如何加入组织?如何将组织的意愿传递下去

摘要: Chubby: 保持高可用性和可靠性,不追求读写的高吞吐量,所有的读写请求都有主控服务器完成,其他的备份服务器在内存中维护和主控服务器完全一致的树形结构,此时从属服务器的作用在于系统的整体的可靠性。 Zookeeper: 每一个节点都可以处理读请求,写请求只能由主控服务器处理,此时从属服务器的作用在 阅读全文

posted @ 2016-10-25 16:10 zhouzhou0615 阅读(163) 评论(0) 推荐(0) 编辑

大数据日知录【第四章:集群资源管理与调度】笔记--这些资源怎么调度?

摘要: 面对各种各样的服务需要的计算系统和框架,对于资源而言,常见的资源调度方法时静态划分方法,框架之间各行其是,但是利用效率低。 调度设计的基本问题: 资源具有异质性(有的机器配置高,有的低)所以要分成一个个小粒度的资源 数据局部性(移动计算而不是移动数据) 支持抢占资源 or not 分配资源粒度:全分 阅读全文

posted @ 2016-10-25 11:59 zhouzhou0615 阅读(515) 评论(0) 推荐(0) 编辑

2016年10月19日

大数据日知录【第三章:常用数据结构与算法】笔记

摘要: Bloom Filter 查询一个数据是否存在于一个集合里面,节约空间的同时却又一定的误判率,也无法删除一个元素,于是计数的Bloom Filter便出现了,可以当成一个缓冲将其放入内存,比如如果查询发现查不到,那就是真不存在,如果存在了,那么可以在磁盘上确认一下。 SkipList 替代平衡树的一 阅读全文

posted @ 2016-10-19 20:59 zhouzhou0615 阅读(138) 评论(0) 推荐(0) 编辑

2016年10月18日

大数据日知录【第二章:数据的复制与一致性】笔记

摘要: 基本原则: CAP (Consistency Available Partition Tolerance) 三个条件不可能同时满足(强一致性,可用性,网络分区总会存在,但存在网络分区的条件下让仍然可以用) 在目前的互联网中,P是客观的条件,为了好的用户体验往往A也必须达到,如此只能弱化C 也就是弱一 阅读全文

posted @ 2016-10-18 15:19 zhouzhou0615 阅读(187) 评论(0) 推荐(0) 编辑

大数据日知录【第一章:数据分片与路由】笔记---数据存储的设计原则

摘要: 纵向拓展:增加单机的资源 横向扩展:增加机器数据(主流)--》数据分片保证系统的水平扩展,通过数据复制,保证数据的高可用性 为了满足横向扩展,常用的模型为二级映射,一级映射是key-partition映射 将数据映射到数据分片空间;二级映射是partition-machine映射,将数据分片空间映射 阅读全文

posted @ 2016-10-18 14:29 zhouzhou0615 阅读(140) 评论(0) 推荐(0) 编辑

2016年8月1日

(转)Maven常用命令

摘要: mvn -v 类似于 javac -version 或者 git --version 在linux上使用maven也需要像使用java一样设置环境变量 这是 export M2_HOME = /? export PATH = $PATH:$M2_HOME/bin export MAVEN_OPTS 阅读全文

posted @ 2016-08-01 16:24 zhouzhou0615 阅读(196) 评论(0) 推荐(0) 编辑

(转) maven snapshot和release版本的区别

摘要: 在使用maven过程中,我们在开发阶段经常性的会有很多公共库处于不稳定状态,随时需要修改并发布,可能一天就要发布一次,遇到bug时,甚至一 天要发布N次。我们知道,maven的依赖管理是基于版本管理的,对于发布状态的artifact,如果版本号相同,即使我们内部的镜像服务器上的组件比 本地新,mav 阅读全文

posted @ 2016-08-01 16:16 zhouzhou0615 阅读(5831) 评论(0) 推荐(0) 编辑

2016年7月25日

常见通用框架的理解(Redis,Zookeeper,Thrift)

摘要: redis 主要功能是内存版的Hashta zookeeper 主要功能是分布式中的全局变量。 thrift 跨平台的Client和Server通信架构。 taskengine用于启动定时任务和查看任务日志。 thrift 跨平台的Client和Server通信架构。 taskengine用于启动定 阅读全文

posted @ 2016-07-25 17:59 zhouzhou0615 阅读(2747) 评论(1) 推荐(0) 编辑

2016年3月3日

(转)进程同步之临界区域问题及Peterson算法

摘要: 转自:http://blog.csdn.net/speedme/article/details/17595821 1. 背景 首先,看个例子,进程P1,P2共用一个变量COUNT,初始值为0 因为P1,P2两个进程的执行顺序是随机的,可能顺序执行也可能是并发的,由图可见,不同的执行顺序,COUNT的 阅读全文

posted @ 2016-03-03 11:12 zhouzhou0615 阅读(2386) 评论(0) 推荐(0) 编辑

2015年12月29日

(转)R语言 SVM支持向量机在 R 语言中的实现和使用

摘要: 支持向量机是一个相对较新和较先进的机器学习技术,最初提出是为了解决二类分类问题,现在被广泛用于解决多类非线性分类问题和回归问题。继续阅读本文,你将学习到支持向量机如何工作,以及如何利用R语言实现支持向量机。支持向量机如何工作?简单介绍下支持向量机是做什么的:假设你的数据点分为两类,支持向量机试图寻找... 阅读全文

posted @ 2015-12-29 15:20 zhouzhou0615 阅读(4125) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页

导航