摘要:
1. MapReduce 与 HDFS 简介 什么是 Hadoop ? Google 为自己的业务需要提出了编程模型 MapReduce 和分布式文件系统 Google File System,并发布了相关论文(可在 Google Research 的网站上获得:GFS、MapReduce)。Dou 阅读全文
摘要:
1. Kafka 1. 简介 Kafka 是一种分布式的、分区的、多副本的基于发布/订阅的消息系统。它是通过 zookeeper 进行协调,常见可以用于 web/nginx 日志、访问日志、消息服务等。主要应用场景为:日志收集系统和消息系统。 Kafka 的主要设计目标如下: 1. 以时间复杂度为 阅读全文
摘要:
1. 子查询定义 Any sub-query block in a query statement may be called a subquery; however, we use the term subquery for a sub-query block that appears in th 阅读全文
摘要:
1. Mac 上环境安装 安装 Homebrew /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" 修改 Homebrew 配置源(可选) cd "$( 阅读全文
摘要:
Keyboard Shortcuts M x whitespace mode ''' display invisible characters 阅读全文
摘要:
1、如果一个整数能够写成z = ax + by的形式,那么z一定是x, y最大公约数的整数倍。 2、求平方根或者是否为平方数的方法,二分查找法、牛顿法x = (x0 + num / x0) / 2、平方数等于1+3+5+... 3、Ksum问题都是采用递归的方法,用递归函数参数k表示仍需要添加的数目 阅读全文
摘要:
(a + b) % p = (a % p + b % p) % p (a - b) % p = (a % p - b % p) % p (a * b) % p = (a % p * b % p) % p (a / b) % p ≠ (a % p / b % p) % p 除法取模转换为求(a∗(b的 阅读全文
摘要:
Elasticsearch简介 Elasticsearch是一个基于Apache lucene的实时分布式搜索。具有以下优点: 1、实时处理大规模数据。2、全文检索,能够做到结构化检索和聚合分析。3、分布式系统。 这些优点形成了以下的应用场景: 1、站内搜索。2、NoSQL Json文档数据库,读写 阅读全文
摘要:
内存是计算机的主存储器。内存为进程开辟出进程空间,让进程在其中保存数据。我将从内存的物理特性出发,深入到内存管理的细节,特别是了解虚拟内存和内存分页的概念。 内存 简单地说,内存就是一个数据货架。内存有一个最小的存储单位,大多数都是一个字节。内存用内存地址(memory address)来为每个字节 阅读全文
摘要:
操作系统 1、进程有哪几种状态,状态转移图,及导致转换的事件 进程有四种特征:1. 动态性 2. 并发性 3. 独立性 4. 异步性 状态: 1. 就绪态。当进程已经分配到除CPU以外的所有资源,只要获得处理机就可以立即执行。 2. 执行态。当进程已获得处理机,程序在处理机上执行。 3. 阻塞态。正 阅读全文
摘要:
1. 不总是所有题都需要优化算法来解决的,有的题目用 Naive 的方式就能够解决,比如 Brute Force。之前遇到过。 在长时间尝试某种方法失败,或者时间复杂度较高的情况下,要勇于尝试其他的方法。有时你觉得会超时的Naive方法可能就是正解。多次有这样的教训。 2. 如果一个题的题目意思不明 阅读全文
摘要:
645. Set Mismatch The set S originally contains numbers from 1 to n. But unfortunately, due to the data error, one of the numbers in the set got dupli 阅读全文