云山之巅

2019年6月11日

摘要：一.简介 RSA加密算法是一种非对称加密算法。在公开密钥加密和电子商业中RSA被广泛使用。 RSA公开密钥密码体制。所谓公开密钥密码体制就是使用不同的加密密钥与解密密钥，是一种“由已知加密密钥推导出解密密钥在计算上是不可行的”密码体制。在公开密钥密码体制中，加密密钥（即公开密钥）PK是公开信息，而阅读全文

posted @ 2019-06-11 21:03 云山之巅阅读(1990) 评论(0) 推荐(0)

2019年6月9日

Hive性能优化【核心思想、运行模式、并行计算】

摘要：一.核心思想把HQL当做MapReduce程序去优化。注意，以下SQL不会转为MapReduce执行： 1.select仅查询本表字段。 2.where仅对本表字段做条件过滤。二.启动Hive 备注：Hive依赖Zookeeper和HDFS，因此需要先开启！三.Explain Explain 阅读全文

posted @ 2019-06-09 12:59 云山之巅阅读(1099) 评论(0) 推荐(0)

2019年5月30日

Spark实现二次排序

摘要：一.代码实现二.结果阅读全文

posted @ 2019-05-30 08:53 云山之巅阅读(874) 评论(0) 推荐(0)

2019年5月28日

TF-IDF词频逆文档频率算法

摘要：一.简介 1.RF-IDF【term frequency-inverse document frequency】是一种用于检索与探究的常用加权技术。 2.TF-IDF是一种统计方法，用于评估一个词对于一个文件集或一个语料库中的其中一个文件的重要程度。 3.词的重要性随着它在文件中出现的次数的增加而增阅读全文

posted @ 2019-05-28 18:55 云山之巅阅读(3411) 评论(0) 推荐(0)

2019年5月26日

电力系统【第6章：电力系统的无功功率和电压调整】

摘要：一.无功功率负荷和无功功率损耗 1.一般系统负荷的功率因数约为0.6~0.9，当系统频率一定时，负荷功率【包括有功和无功功率】随电压而变化的关系称为负荷的静态电压特性。 2.电力线路的无功功率损耗也可以分为两部分，即并联电纳中的无功功率损耗和串联电抗中的无功功率损耗。 3.电力系统的无功功率电源，除阅读全文

posted @ 2019-05-26 10:06 云山之巅阅读(2112) 评论(0) 推荐(0)

2019年5月24日

PageRank网页价值算法

摘要：一.简介 PageRank是Google提出的算法，用于衡量特定网页相对于其它网页而言的重要程度。是Google创始人拉里.佩奇和谢尔盖.布林于1997年创造的，用于实现将链接价值概念作为排名的重要因素。二.算法原理 1.入链 PageRank让链接来投票，到一个页面的超链接相当于对该网页投一票。阅读全文

posted @ 2019-05-24 20:14 云山之巅阅读(862) 评论(0) 推荐(0)

2019年5月21日

代码实现排列组合【Java】

摘要：一.代码实现二.结果阅读全文

posted @ 2019-05-21 21:35 云山之巅阅读(3408) 评论(0) 推荐(0)

2019年5月18日

MapReduce1.x与MapReduce2.x差异

摘要：一.MapReduce1.x简介 1.图解 2.JobTracker 主节点，单点，负责调度所有的作用和监控整个集群的资源负载。 3.TaskTracker 从节点，自身节点资源管理和JobTracker进行心跳联系，汇报资源和获取task。 4.Client 以作业为单位，规划作业计算分布，提交作阅读全文

posted @ 2019-05-18 11:48 云山之巅阅读(1519) 评论(0) 推荐(1)

2019年5月17日

SparkSQL之dataframe写入mysql报错

摘要：一.异常情况及解决方案在使用Spark SQL的dataframe数据写入到相应的MySQL表中时，报错，错误信息如下：代码的基本形式为: df.write.jdbc(url, result_table, prop) 根据图片中的报错，搜索资料，得知是由于Spark SQL 中的Save Mod 阅读全文

posted @ 2019-05-17 16:36 云山之巅阅读(2240) 评论(0) 推荐(0)

2019年5月15日

Word2Vec算法简介

摘要：一.简介 word2vec是Google在2003年开源的一款将词表征为实数值向量的高效算法，采用的模型有CBOW【Continuous Bag-Of-Words 连续的词袋模型】和Skip-Gram两种。 word2vec通过训练，可以把文本内容的处理简化为k维向量空间中的向量运算，二向量空间上的阅读全文

posted @ 2019-05-15 21:20 云山之巅阅读(859) 评论(0) 推荐(0)

2019年5月14日

Hadoop1.x与Hadoop2.x之间的差异

摘要：一.Hadoop2.x产生背景 1.Hadoop1.x中的HDFS和MapReduce在高可用、扩展性等方面存在问题。 2.HDFS存在的问题 1.NameNode单点故障，难以应用于在线场景。 2.NameNode压力过大，且内存受限，影响扩展性。 3.MapReduce存在的问题 1.JobTr 阅读全文

posted @ 2019-05-14 18:03 云山之巅阅读(821) 评论(0) 推荐(0)

2019年5月12日

电力系统【第5章：电力系统的有功功率和频率调整】

摘要：一.电力系统频率调整频率和电压都是衡量电能质量的重要指标，但系统中对频率恒定的要求比对电压恒定的要求要更为严格。因为系统中的电压等级较多，电压可以分散调整，且调压的方法较多。二系统的频率调整涉及全电力系统的电源和负荷，调频只能集中在多个发电厂进行。电力系统的频率是由发电机转速决定的，而发电机转速阅读全文

posted @ 2019-05-12 21:41 云山之巅阅读(2350) 评论(0) 推荐(0)

Maven整合eclipse

摘要： 1.配置eclipse本地Maven 点击Window-->Perference 选择Maven-->Installations 点击Add添加本地Maven 然后勾选本地Maven，启用点击User Settings设置本地仓库设置 2.创建Maven项目右键选择选择Maven Proj 阅读全文

posted @ 2019-05-12 11:55 云山之巅阅读(133) 评论(0) 推荐(0)

2019年5月11日

SparkStreaming+kafka Receiver模式

摘要： 1.图解 2.过程 1.使用Kafka的High Level Consumer API 实现，消费者不能自己去维护消费者offset，而且kafka也不关心数据是否丢失。 2.当向zookeeper中更新完offset后，Driver如果挂到，Driver下的Executors会被kill掉，会造成阅读全文

posted @ 2019-05-11 11:20 云山之巅阅读(907) 评论(0) 推荐(0)

2019年5月9日

HDFS之安全模式

摘要： 1.namenode启动的时候，首先将映像文件【fsimage】载入内存，并执行编辑日志【edits】中的各项操作。 2.一旦在内存中成功建立文件系统元数据的映射，则创建一个新的fsimage文件【这个操作不需要SecondaryNameNode】和一个空的编辑日志。 3.此刻namenode运行在阅读全文

posted @ 2019-05-09 17:15 云山之巅阅读(377) 评论(0) 推荐(0)

2019年5月8日

Windows下搭建TensorFlow的GPU版本

摘要： 1.下载python3.5.2版本并安装（必须是3.5版本，而且3.5后不带字母的版本） 2.使用下面的地址下载tensorflow的GPU版本 http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 3.以及tensorflow的依赖protubuf，还有阅读全文

posted @ 2019-05-08 15:29 云山之巅阅读(447) 评论(0) 推荐(0)

2019年5月4日

Maven快速入门

摘要： 1.下载Maven包前往官网下载你需要的版本http://maven.apache.org/download.cgi 2.解压配置环境变量在path中添加： 3.验证使用快捷键电脑图标+R，弹出输入cmd，按enter执行，在命令行上输入mvn -v 4.快速入门 1.创建相关目录及创建pom 阅读全文

posted @ 2019-05-04 00:28 云山之巅阅读(161) 评论(0) 推荐(0)

2019年5月3日

电力系统【第四章：复杂电力系统潮流分布的计算机算法】

摘要： 1.运用计算机计算时，一般要完成一下几个步骤： 1.1建立数学模型 1.2确定解算方法 1.3制定程序框图 1.4编制程序 1.5上机调试及运算 2.潮流计算的数学模型数学模型是指反映电力系统中运行状态参数【如电压、电力、功率等】与网络参数之前的关系，反映网络性能的数学方程式。 3.牛顿-拉夫逊法阅读全文

posted @ 2019-05-03 20:10 云山之巅阅读(2698) 评论(1) 推荐(1)

2019年4月18日

HBase单机模式部署

摘要： 1.上传&解压 2.设置环境变量 3.启用&检验 4.编辑hbase-env.sh 备注：分别指定JDK、HBase、Hadoop的路径！ 5.编辑hbase-site.xml 6.启动hbase 1.启动Hadoop 2.启动HBase 3.验证备注：启动之前需先启动Hadoop！ 7.查看We 阅读全文

posted @ 2019-04-18 21:28 云山之巅阅读(2371) 评论(0) 推荐(0)

2019年4月17日

Hive分桶

摘要： 1.简介分桶表是对列值取哈希值的方式将不同数据放到不同文件中进行存储。对于hive中每一个表，分区都可以进一步进行分桶。由列的哈希值除以桶的个数来决定数据划分到哪个桶里。 2.适用场景 1.数据抽样【sampling】 2.map-join 3.开启支持分桶配置;set hive.enforce 阅读全文

posted @ 2019-04-17 21:14 云山之巅阅读(411) 评论(0) 推荐(0)

------自学是你超越他人使自己变的重要的一种能力！

公告