2018 年 12月随笔档案 - 云山之巅

Spark GraphX快速入门

摘要：一.概述 GraphX是Spark用于图形并行计算的新组件。在较高的层次上，GraphX通过引入一个新的Graph抽象来扩展Spark RDD:一个定向的多图，其属性附加到每个定点和边。为了支持图计算，GraphX公开了一组基本的操作符（子图，joinVertices和aggregateMessag 阅读全文

posted @ 2018-12-27 18:19 云山之巅阅读(4109) 评论(0) 推荐(0) 编辑

mysql服务自启【Linux】

摘要：1.复制启动脚本到资源目录 2.增加mysqld服务控制脚本执行权限 3.mysql服务添加到系统服务 4.检测mysqld服务是否生效表明服务已经启动，以后可以使用service命令启动mysql 5.启动，关闭，重启mysql命令启动：service mysqld start 关闭：serv 阅读全文

posted @ 2018-12-26 17:50 云山之巅阅读(229) 评论(0) 推荐(0) 编辑

Centos7安装mysql5.6

摘要：注意：Centos7把mysql数据库换成了Mariadb，因此在安装mysql数据库之前需要先删除Mariadb！ 1.查看Mariadb版本并删除 2.删除/etc下的my.cnf 3.添加mysql用户组和mysql用户 1.检测是否存在mysql用户组和mysql用户 2.没有，则添加备注阅读全文

posted @ 2018-12-26 11:39 云山之巅阅读(4711) 评论(0) 推荐(0) 编辑

Scala路径依赖【内部类】

摘要：结果：阅读全文

posted @ 2018-12-25 14:28 云山之巅阅读(393) 评论(0) 推荐(0) 编辑

spark查看DF的partition数目及每个partition中的数据量【集群模式】

摘要：结果： 100 [Lorg.apache.spark.sql.Row;::::::::61516 [Lorg.apache.spark.sql.Row;::::::::61656 [Lorg.apache.spark.sql.Row;::::::::61991 [Lorg.apache.spark. 阅读全文

posted @ 2018-12-21 15:54 云山之巅阅读(5076) 评论(0) 推荐(0) 编辑

Python自定义异常及抛出异常

摘要：结果：阅读全文

posted @ 2018-12-19 21:21 云山之巅阅读(7016) 评论(0) 推荐(0) 编辑

Spark应用【根据新df更新旧df】

摘要：结果：在非主键字段名称末尾添加S 去掉非主键字段名称末尾添加的S 阅读全文

posted @ 2018-12-19 17:28 云山之巅阅读(575) 评论(0) 推荐(0) 编辑

Linux安装JDK

摘要：需要：JDK1.8 1.使用Xftp上传jdk的免安装包到3台虚拟机的指定目录下： 2.配置JDK环境变量执行命令：vi /etc/profile，在文件末尾追加：然后执行命令：source /etc/profile ，使修改立即生效检查是否配置成功，执行命令：java -version 表示阅读全文

posted @ 2018-12-18 22:02 云山之巅阅读(309) 评论(0) 推荐(0) 编辑

Spark常用算子解析及代码实战

摘要：Spark 一.coalesce 1.简介 coalesce常用来合并分区，第二个参数是合并分区时是否产生shuffle。true为产生shuffle，false为不产生shuffle。默认是false不产生shuffle。如果coalesce设置的分区数比原来的分区数还大的话若设置为false则不阅读全文

posted @ 2018-12-18 17:00 云山之巅阅读(617) 评论(0) 推荐(0) 编辑

Scala链式编程内幕

摘要：1 package big.data.analyse.scala 2 3 /** 4 * 链式编程原理 5 * Created by zhen on 2018/12/16. 6 */ 7 class Computer{def code = this} 8 class PC extends Computer{def portable = this} 9 /** 10... 阅读全文

posted @ 2018-12-16 21:07 云山之巅阅读(319) 评论(0) 推荐(0) 编辑

Centos7开启ssh免密码登录

摘要：1.输入命令：cd .ssh进入rsa公钥私钥目录（清空旧秘钥） 2.在当前目录下执行ssh-keygen -t rsa，三次回车后生成新的公钥(id_rsa.pub)私钥(id_rsa)文件（每个节点都要重新生成） 3.在主节点上执行命令：cat id_rsa.pub >> authorized_ 阅读全文

posted @ 2018-12-15 17:06 云山之巅阅读(2141) 评论(0) 推荐(0) 编辑

基于cifar10实现卷积神经网络图像识别

摘要：过程： Filling queue with 20000 CIFAR images before starting to train. This will take a few minutes. step 0, loss =4.68 (19.0 examples/sec; 6.734 sec/bat 阅读全文

posted @ 2018-12-14 20:38 云山之巅阅读(3370) 评论(0) 推荐(0) 编辑

Spark操作parquet文件

摘要：结果：分析：Spark读取parquet数据默认为目录，因此可以只指定到你要读取的上级目录即可（本地模式除外），当保存为parquet时，会自动拆分，因此只能指定为上级目录。阅读全文

posted @ 2018-12-12 11:32 云山之巅阅读(10106) 评论(0) 推荐(0) 编辑

Centos7关闭防火墙

摘要：1.执行以下命令关闭防火墙服务 2.检测是否正确关闭表示正确关闭！阅读全文

posted @ 2018-12-11 20:59 云山之巅阅读(217) 评论(0) 推荐(0) 编辑

Centos7安装netstat及简单使用

摘要：Centos7默认不安装netstat组件，需要使用时需要自己安装。 1.查看当前机器net-tools包所在位置 2.安装net-tools包 3.使用netstat命令查看端口占用情况 4.查看指定端口阅读全文

posted @ 2018-12-10 10:51 云山之巅阅读(43283) 评论(0) 推荐(3) 编辑

Scala类型限定

摘要：结果：阅读全文

posted @ 2018-12-09 21:17 云山之巅阅读(336) 评论(0) 推荐(0) 编辑

Python单例模式

摘要：结果：阅读全文

posted @ 2018-12-08 19:58 云山之巅阅读(205) 评论(0) 推荐(0) 编辑

Python基于dtw实现股票预测【多线程】

摘要：结果： has running 100 s has running 200 s has running 300 s has running 400 s has running 500 s has running 600 s has running 700 s has running 800 s ha 阅读全文

posted @ 2018-12-07 17:36 云山之巅阅读(3095) 评论(0) 推荐(0) 编辑

基于皮尔逊系数实现股票预测【多线程】

摘要：结果：分析：皮尔逊相关系数（corrcoef）运算速度远超DTW或FASTDTW，但DTW或FASTDTW应用范围更广，适用于等长或变长的比较。阅读全文

posted @ 2018-12-06 21:26 云山之巅阅读(892) 评论(0) 推荐(0) 编辑

Python基于皮尔逊系数实现股票预测

摘要：结果：阅读全文

posted @ 2018-12-03 14:55 云山之巅阅读(2369) 评论(0) 推荐(0) 编辑

Python之__new__方法

摘要：结果：阅读全文

posted @ 2018-12-02 11:23 云山之巅阅读(536) 评论(0) 推荐(0) 编辑

云山之巅

------自学是你超越他人使自己变的重要的一种能力！

12 2018 档案

公告

最新随笔

我的标签

积分与排名

随笔分类 (82)

随笔档案 (315)

相册 (11)

阅读排行榜

评论排行榜

推荐排行榜

最新评论