12 2018 档案

摘要:一.概述 GraphX是Spark用于图形并行计算的新组件。在较高的层次上,GraphX通过引入一个新的Graph抽象来扩展Spark RDD:一个定向的多图,其属性附加到每个定点和边。为了支持图计算,GraphX公开了一组基本的操作符(子图,joinVertices和aggregateMessag 阅读全文
posted @ 2018-12-27 18:19 云山之巅 阅读(4109) 评论(0) 推荐(0) 编辑
摘要:1.复制启动脚本到资源目录 2.增加mysqld服务控制脚本执行权限 3.mysql服务添加到系统服务 4.检测mysqld服务是否生效 表明服务已经启动,以后可以使用service命令启动mysql 5.启动,关闭,重启mysql命令 启动:service mysqld start 关闭:serv 阅读全文
posted @ 2018-12-26 17:50 云山之巅 阅读(229) 评论(0) 推荐(0) 编辑
摘要:注意:Centos7把mysql数据库换成了Mariadb,因此在安装mysql数据库之前需要先删除Mariadb! 1.查看Mariadb版本并删除 2.删除/etc下的my.cnf 3.添加mysql用户组和mysql用户 1.检测是否存在mysql用户组和mysql用户 2.没有,则添加 备注 阅读全文
posted @ 2018-12-26 11:39 云山之巅 阅读(4711) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-25 14:28 云山之巅 阅读(393) 评论(0) 推荐(0) 编辑
摘要:结果: 100 [Lorg.apache.spark.sql.Row;::::::::61516 [Lorg.apache.spark.sql.Row;::::::::61656 [Lorg.apache.spark.sql.Row;::::::::61991 [Lorg.apache.spark. 阅读全文
posted @ 2018-12-21 15:54 云山之巅 阅读(5076) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-19 21:21 云山之巅 阅读(7016) 评论(0) 推荐(0) 编辑
摘要:结果: 在非主键字段名称末尾添加S 去掉非主键字段名称末尾添加的S 阅读全文
posted @ 2018-12-19 17:28 云山之巅 阅读(575) 评论(0) 推荐(0) 编辑
摘要:需要:JDK1.8 1.使用Xftp上传jdk的免安装包到3台虚拟机的指定目录下: 2.配置JDK环境变量 执行命令:vi /etc/profile,在文件末尾追加: 然后执行命令:source /etc/profile ,使修改立即生效 检查是否配置成功,执行命令:java -version 表示 阅读全文
posted @ 2018-12-18 22:02 云山之巅 阅读(309) 评论(0) 推荐(0) 编辑
摘要:Spark 一.coalesce 1.简介 coalesce常用来合并分区,第二个参数是合并分区时是否产生shuffle。true为产生shuffle,false为不产生shuffle。默认是false不产生shuffle。如果coalesce设置的分区数比原来的分区数还大的话若设置为false则不 阅读全文
posted @ 2018-12-18 17:00 云山之巅 阅读(617) 评论(0) 推荐(0) 编辑
摘要:1 package big.data.analyse.scala 2 3 /** 4 * 链式编程原理 5 * Created by zhen on 2018/12/16. 6 */ 7 class Computer{def code = this} 8 class PC extends Computer{def portable = this} 9 /** 10... 阅读全文
posted @ 2018-12-16 21:07 云山之巅 阅读(319) 评论(0) 推荐(0) 编辑
摘要:1.输入命令:cd .ssh进入rsa公钥私钥目录(清空旧秘钥) 2.在当前目录下执行ssh-keygen -t rsa,三次回车后生成新的公钥(id_rsa.pub)私钥(id_rsa)文件(每个节点都要重新生成) 3.在主节点上执行命令:cat id_rsa.pub >> authorized_ 阅读全文
posted @ 2018-12-15 17:06 云山之巅 阅读(2141) 评论(0) 推荐(0) 编辑
摘要:过程: Filling queue with 20000 CIFAR images before starting to train. This will take a few minutes. step 0, loss =4.68 (19.0 examples/sec; 6.734 sec/bat 阅读全文
posted @ 2018-12-14 20:38 云山之巅 阅读(3370) 评论(0) 推荐(0) 编辑
摘要:结果: 分析:Spark读取parquet数据默认为目录,因此可以只指定到你要读取的上级目录即可(本地模式除外),当保存为parquet时,会自动拆分,因此只能指定为上级目录。 阅读全文
posted @ 2018-12-12 11:32 云山之巅 阅读(10106) 评论(0) 推荐(0) 编辑
摘要:1.执行以下命令关闭防火墙服务 2.检测是否正确关闭 表示正确关闭! 阅读全文
posted @ 2018-12-11 20:59 云山之巅 阅读(217) 评论(0) 推荐(0) 编辑
摘要:Centos7默认不安装netstat组件,需要使用时需要自己安装。 1.查看当前机器net-tools包所在位置 2.安装net-tools包 3.使用netstat命令查看端口占用情况 4.查看指定端口 阅读全文
posted @ 2018-12-10 10:51 云山之巅 阅读(43283) 评论(0) 推荐(3) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-09 21:17 云山之巅 阅读(336) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-08 19:58 云山之巅 阅读(205) 评论(0) 推荐(0) 编辑
摘要:结果: has running 100 s has running 200 s has running 300 s has running 400 s has running 500 s has running 600 s has running 700 s has running 800 s ha 阅读全文
posted @ 2018-12-07 17:36 云山之巅 阅读(3095) 评论(0) 推荐(0) 编辑
摘要:结果: 分析: 皮尔逊相关系数(corrcoef)运算速度远超DTW或FASTDTW,但DTW或FASTDTW应用范围更广,适用于等长或变长的比较。 阅读全文
posted @ 2018-12-06 21:26 云山之巅 阅读(892) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-03 14:55 云山之巅 阅读(2369) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-02 11:23 云山之巅 阅读(536) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示