摘要: 简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。 例如: 如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。 采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依 阅读全文
posted @ 2016-08-14 21:24 limeng951 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 1.Linux链接概念 Linux链接分两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接。 【硬连接】 硬连接指通过索引节点来进行连接。在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称 阅读全文
posted @ 2016-08-14 21:03 limeng951 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 数据库事务的隔离级别有4个,由低到高依次为Read uncommitted、Read committed、Repeatable read、Serializable,这四个级别可以逐个解决脏读、不可重复读、幻读这几类问题。 √: 可能出现 ×: 不会出现 脏读 不可重复读 幻读 Read uncomm 阅读全文
posted @ 2016-08-14 20:38 limeng951 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是访问百度的 阅读全文
posted @ 2016-08-14 20:28 limeng951 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 一:Git是什么? Git是目前世界上最先进的分布式版本控制系统。 二:SVN与Git的最主要的区别? SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时候,用的都是自己的电脑,所以首先要从中央服务器哪里得到最新的版本,然后干活, 干完后,需要把自己做完的活推送到中央服务器。集中式 阅读全文
posted @ 2016-08-14 20:23 limeng951 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。索引的实现通常使用B树及其变种B+树。 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。 为表设 阅读全文
posted @ 2016-08-14 20:12 limeng951 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 概念: 反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个服务器。 概述: 通常的代理服务器,只用于代理内部网络对Inter 阅读全文
posted @ 2016-08-14 20:01 limeng951 阅读(1960) 评论(0) 推荐(0) 编辑