2019年11月5日

kafka小记

摘要: Kafka小记 基础概念 1. kafka的数据单元被称为消息,消息可以有一个可选的元数据,也就是键,主要作用是为消息选取分区 2. kafka的消息通过主题进行分类,主题可以被分为若干个分区,分区中的消息是有序的(通过offset排列) 3. 生产者是产生数据的客户端,消费者是消费数据的客户端,是 阅读全文

posted @ 2019-11-05 21:36 LeonNew 阅读(134) 评论(0) 推荐(0) 编辑

2019年9月29日

Spark基础

摘要: RDD是只读记录分区的集合 ,只能通过在其他RDD执行确定的转换操作(如map、join和groupBy)或直接读取外部存储而创建,然而这些限制使得实现容错的开销很低。与分布式共享内存系统需要付出高昂代价的检查点和回滚机制不同, RDD通过Lineage来重建丢失的分区 ; 一个RDD包含如何从其他 阅读全文

posted @ 2019-09-29 16:32 LeonNew 阅读(150) 评论(0) 推荐(0) 编辑

2019年8月25日

flink杂记

摘要: flink的特点: 能同时满足高性能、高吞吐、低延时,相比较于storm和spark streaming,storm的吞吐量不如flink,而spark streaming的延时比较高,因为spark streaming进行流式计算的原理就是微批操作,就是要积累一定的时间,虽然可以尽量降低这个时间粒 阅读全文

posted @ 2019-08-25 19:43 LeonNew 阅读(265) 评论(0) 推荐(0) 编辑

2017年3月26日

算法

摘要: 寻找逆序对(归并思想) public int InversePairs(int [] array) { if(array == null || array.length == 0) return 0; int i = 0; int j = array.length 1; int[] copy = n 阅读全文

posted @ 2017-03-26 14:59 LeonNew 阅读(157) 评论(0) 推荐(0) 编辑

2017年3月2日

算法小结

摘要: 基础知识 损失函数:0 1损失函数、平方损失函数、绝对损失函数、对数损失函数: logP(Y|X) 平均损失= 经验风险 当N趋于无穷,经验风险趋于期望风险 经验风险最小化= 极大似然估计 结构风险最小化= 正则化 解决过拟合: 正则化:1、L1范数:各元素绝对值之和;2、L2范数:各元素平方和的1 阅读全文

posted @ 2017-03-02 10:04 LeonNew 阅读(175) 评论(0) 推荐(0) 编辑

2017年2月24日

Java内存模型

摘要: 参考自 "http://www.cnblogs.com/dolphin0520/p/3920373.html" 线程安全 1. 不可变对象一定是线程安全的 2. 绝对线程安全: 不管运行环境如何,调用者都不需要任何额外的同步措施 3. 相对线程安全:对这个对象单独的操作是线程安全的,不需要额外的保障 阅读全文

posted @ 2017-02-24 13:52 LeonNew 阅读(109) 评论(0) 推荐(0) 编辑

2017年2月4日

LeetCode---Backtracking && DP

摘要: 322. Coin Change 思路:动态规划,构造一个数组,存入当前index最少需要多少个coin public int coinChange(int[] coins, int amount) { if(coins == null || coins.length == 0 || amount 阅读全文

posted @ 2017-02-04 12:04 LeonNew 阅读(180) 评论(0) 推荐(0) 编辑

2017年1月26日

LeetCode---Sort && Segment Tree && Greedy

摘要: 307. Range Sum Query Mutable 思路:利用线段树,注意数据结构的设计以及建树过程利用线段树,注意数据结构的设计以及建树过程 public class NumArray { class segmentNode{ int start; int end; segmentNode 阅读全文

posted @ 2017-01-26 11:52 LeonNew 阅读(186) 评论(0) 推荐(0) 编辑

2017年1月16日

LeetCode---Depth-first && Breadth-first

摘要: 417. Pacific Atlantic Water Flow 思路:构造两个二维数组分别存储大西洋和太平洋的结果,先初始化边界,然后从边界出发,深度优先遍历,标记满足条件的所有节点 static int[] dx = new int[]{ 1,0,0,1}; static int[] dy = 阅读全文

posted @ 2017-01-16 11:31 LeonNew 阅读(159) 评论(0) 推荐(0) 编辑

2017年1月10日

LeetCode---Bit Manipulation && Design

摘要: 401. Binary Watch 思路:产生两个list分别代表小时和分钟,然后遍历 public List readBinaryWatch(int num) { List res = new ArrayList(); int[] hour = {8,4,2,1}; int[] minute = 阅读全文

posted @ 2017-01-10 17:16 LeonNew 阅读(150) 评论(0) 推荐(0) 编辑

导航