随笔分类 -  【Study】-- 算法

java算法(4)---静态内部类实现雪花算法
摘要:# 静态内部类单例模式实现雪花算法 在生成表主键ID时,我们可以考虑主键自增 或者 UUID,但它们都有很明显的缺点 主键自增:1、自增ID容易被爬虫遍历数据。2、分表分库会有ID冲突。 UUID: 1、太长,并且有索引碎片,索引多占用空间的问题 2、无序。 雪花算法就很适合在分布式场景下生成唯一I 阅读全文
posted @ 2019-08-18 15:58 雨点的名字 阅读(9601) 评论(5) 推荐(13) 编辑
SpringBoot(18)---通过Lua脚本批量插入数据到Redis布隆过滤器
摘要:通过Lua脚本批量插入数据到布隆过滤器 有关布隆过滤器的原理之前写过一篇博客: 算法(3) 布隆过滤器原理 在实际开发过程中经常会做的一步操作,就是判断当前的key是否存在。 那这篇博客主要分为三部分: 1、几种方式判断当前key是否存在的性能进行比较。 2、Redis实现布隆过滤器并批量插入数据, 阅读全文
posted @ 2019-07-28 16:09 雨点的名字 阅读(4957) 评论(0) 推荐(1) 编辑
算法(3)---布隆过滤器原理
摘要:算法(3) 布隆过滤器原理 开发一个电商项目,因为数据量一直在增加(已达亿级),所以需要重构之前开发好的秒杀功能,为了更好的支持高并发,在验证用户是否重复购买的环节,就考虑用布隆过滤器。 也顺便更加深入的去了解下布隆过滤器的原理,感觉还是蛮有意思的,这一连串的公式不静下心来思考,很容易被绕晕。 ## 阅读全文
posted @ 2019-07-24 20:57 雨点的名字 阅读(21536) 评论(23) 推荐(14) 编辑
算法(2)---算法复杂度理论
摘要:算法(2) 算法复杂度理论 算法复杂度:分为时间复杂度和空间复杂度,一个好的算法应该具体执行时间短,所需空间少的特点。 结论: 复杂度与时间效率的关系 C < log2n < n < n*log2n < n2 < n3 < 2n < 3n < n! (c是一个常量,n是一个变量且比c大) | | | 阅读全文
posted @ 2019-05-14 21:56 雨点的名字 阅读(1238) 评论(1) 推荐(0) 编辑
java算法(1)---余弦相似度计算字符串相似率
摘要:余弦相似度计算字符串相似率 功能需求:最近在做通过爬虫技术去爬取各大相关网站的新闻,储存到公司数据中。这里面就有一个技术点,就是如何保证你已爬取的新闻,再有相似的新闻 或者一样的新闻,那就不存储到数据库中。(因为有网站会去引用其它网站新闻,或者把其它网站新闻拿过来稍微改下内容就发布到自己网站中)。 阅读全文
posted @ 2018-08-15 22:44 雨点的名字 阅读(20720) 评论(5) 推荐(9) 编辑


点击右上角即可分享
微信分享提示