摘要: Spark SQL 的数据源------通用的数据 加载/保存功能 Spark SQL支持通过DataFrame接口在各种数据源上进行操作。DataFrame可以使用关系变换进行操作,也可以用来创建临时视图。将DataFrame 注册为... 阅读全文
posted @ 2017-12-30 11:25 zhou_jun 阅读(902) 评论(0) 推荐(0) 编辑
摘要: 一,环境准备 hadoop 2.8.2 分布式环境(三个节点 安装请参考 hadoop分布式环境安装) hbase 1.2.6 分布式环境(三个节点 ,安装参考hbase分布式环境安装 ) 主节点采用 ubuntu 16.04 桌面版 ,从节... 阅读全文
posted @ 2017-12-27 15:54 zhou_jun 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 聚合内置功能DataFrames提供共同聚合,例如count(),countDistinct(),avg(),max(),min(),等。虽然这些功能是专为DataFrames,spark SQL还拥有类型安全的版本,在其中的一些 scala 和 Java... 阅读全文
posted @ 2017-12-23 16:48 zhou_jun 阅读(785) 评论(0) 推荐(0) 编辑
摘要: 一, 简介 Spark SQL是用于结构化数据处理的Spark模块。与基本的Spark RDD API不同,Spark SQL提供的接口为Spark提供了关于数据结构和正在执行的计算的更多信息。在内部,Spark SQL使用这些额外的信息来执行额外的优化。有几... 阅读全文
posted @ 2017-12-23 15:31 zhou_jun 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 一,环境 1, 主节点一台: ubuntu desktop 16.04 zhoujun 172.16.12.1 从节点(slave)两台:ubuntu server 16.04 ... 阅读全文
posted @ 2017-12-19 19:28 zhou_jun 阅读(317) 评论(0) 推荐(0) 编辑
摘要: 一,环境 主节点一台: ubuntu desktop 16.04 zhoujun 172.16.12.1 从节点(slave)两台:ubuntu server 16.04 hado... 阅读全文
posted @ 2017-12-18 22:33 zhou_jun 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 说明:此版本的QQ基本完美,但是有个缺点就是历史记录有些会显示乱码! 注意:此方法能完美解决这篇文章http://www.cnblogs.com/EasonJim/p/7118693.html的所有问题,且不影响现在系统的任何功能,可以说是相当的完美。经过测试从4.4.0到4.7.0的内核都能完美安 阅读全文
posted @ 2017-12-02 13:23 zhou_jun 阅读(760) 评论(0) 推荐(0) 编辑
摘要: 算法的时间复杂度和空间复杂度-总结 通常,对于一个给定的算法,我们要做 两项分析。第一是从数学上证明算法的正确性,这一步主要用到形式化证明的方法及相关推理模式,如循环不变式、数学归纳法等。而在证明算法是正确的基础上,第二部就是分析算法的时间复杂度。算法的... 阅读全文
posted @ 2017-12-02 09:50 zhou_jun 阅读(796) 评论(0) 推荐(0) 编辑
摘要: 问题:windows下使用VMware或者自己安装的ubuntu系统出现,不能正常进入系统,而是进入一个以initramfs开头的命令行界面! 原因:不正常的关闭系统,导致系统文件损坏,/dev/sda1或其他的系统目录文件丢失或错误 解决办法: 在initramfs>的终端界面输入如下命令修复文件 阅读全文
posted @ 2017-11-10 15:25 zhou_jun 阅读(2879) 评论(0) 推荐(1) 编辑
摘要: 1,mysql加载的jar包未找到! 解决办法: 在mysql 官网下载 mysql-connector-java-5.0.8.tar.gz 的压缩包, 链接:mysql-connector下载 , 下载好后解压,将mysql-connector-java-5.0.8-bin.jar文件移动到 hi 阅读全文
posted @ 2017-10-20 12:04 zhou_jun 阅读(6862) 评论(0) 推荐(0) 编辑