2019 年 8月随笔档案 - 云山之巅

Solr基础理论【倒排索引，模糊查询】

摘要：一.简介现有的许多不同类型的技术系统，如关系型数据库、键值存储、操作磁盘文件的map-reduce【映射-规约】引擎、图数据库等，都是为了帮助用户解决颇具挑战性的数据存储与检索问题而设计的。而搜索引擎，尤其是Solr，致力于解决一类特定的问题：搜索大量非结构化的文本数据，并返回最相关的搜索结果。阅读全文

posted @ 2019-08-28 20:27 云山之巅阅读(1132) 评论(0) 推荐(0) 编辑

Impala快速入门

摘要：一.简介 Cloudera公司推出，提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算，兼顾数据仓库，具有实时、批处理、多并发的优点。是CDH平台首选的PB级大数据实时查询分析引擎。二.优点 1.基于内存计算，能够对PB级别数据进行交互式实时查询、分析阅读全文

posted @ 2019-08-25 16:53 云山之巅阅读(271) 评论(0) 推荐(0) 编辑

Redis特点分析及性能优化

摘要：一.Key 》Redis key值是二进制安全的，这意味着可以可以使用任何二进制序列作为key值。空字符串也是有效的key值。》key取值原则 1.键值不需要太长，消耗内存，且在数据中查找这类键值计算成本较高 2.键值不宜过短，可读性较差，不宜数据分类和扩展》过期 1.Redis中可以给key设阅读全文

posted @ 2019-08-23 11:46 云山之巅阅读(351) 评论(0) 推荐(0) 编辑

电力系统【第八章：电力系统不对称故障的分析与计算】

摘要：一. 对称分量法 1.在电力系统中突然发生不对称短路时，必然会引起基频分量电流的变化，并产生直流的自由分量。除此之外，不对称短路还会产生一系列的谐波。 2.流过三相正序电流，则在元器件上的三相电压为正序电压，而流过负序或零序电流，则在元器件上的电压为负序或零序电压。也就是说，对于三相对称的元器件，各阅读全文

posted @ 2019-08-19 08:34 云山之巅阅读(3160) 评论(0) 推荐(0) 编辑

SparkStreaming之checkpoint检查点

摘要：一.简介流应用程序必须保证7*24全天候运行，因此必须能够适应与程序逻辑无关的故障【例如：系统故障、JVM崩溃等】。为了实现这一点，SparkStreaming需要将足够的信息保存到容错存储系统中，以便它可以从故障中恢复。检查点有两种类型。 1.元数据检查点将定义流式计算的信息保存到容错存储系阅读全文

posted @ 2019-08-15 16:03 云山之巅阅读(1166) 评论(0) 推荐(0) 编辑

Spark排序方式集锦

摘要：一.简介 spark中的排序一般可以使用orderBy或sort算子，可以结合负号、ASC/DESC和col进行简单排序、二次排序等情况二.代码实现三.结果阅读全文

posted @ 2019-08-14 19:36 云山之巅阅读(6733) 评论(0) 推荐(0) 编辑

Redis持久化

摘要：一.RDB 在默认情况下，Redis将数据库快照保存为dump.rdb的二进制文件。方式： 1.阻塞方式客户端中执行save命令 2.非阻塞方式策略 1.自动，按照配置文件中的条件满足就执行bgsave 2.手动，客户端发起save,bgsave命令优点 1.完全备份，不同时间的数据备份可以阅读全文

posted @ 2019-08-11 21:33 云山之巅阅读(135) 评论(0) 推荐(0) 编辑

Spark ML协同过滤推荐算法

摘要：一.简介协同过滤算法【Collaborative Filtering Recommendation】算法是最经典、最常用的推荐算法。该算法通过分析用户兴趣，在用户群中找到指定用户的相似用户，综合这些相似用户对某一信息的评价，形成系统关于该指定用户对此信息的喜好程度预测。二.步骤 1.收集用户偏好阅读全文

posted @ 2019-08-09 17:53 云山之巅阅读(2882) 评论(0) 推荐(0) 编辑

云山之巅

------自学是你超越他人使自己变的重要的一种能力！

08 2019 档案

公告

最新随笔

我的标签

积分与排名

随笔分类 (82)

随笔档案 (315)

相册 (11)

阅读排行榜

评论排行榜

推荐排行榜

最新评论