随笔 - 504  文章 - 0  评论 - 25  阅读 - 138万

随笔分类 -  大数据学习

1 2 3 4 5 6 下一页
大数据学习——SparkStreaming整合Kafka完成网站点击流实时统计
摘要:1.安装并配置zk 2.安装并配置Kafka 3.启动zk 4.启动Kafka 5.创建topic 程序代码 记一次遇到的问题 https://www.cnblogs.com/feifeicui/p/11018761.html 阅读全文
posted @ 2019-06-13 19:03 o_0的园子 阅读(533) 评论(0) 推荐(0) 编辑
spark作业
摘要:假定用户有某个周末网民网购停留时间的日志文本,基于某些业务要求,要求开发 Spark应用程序实现如下功能: 1、实时统计连续网购时间超过半个小时的女性网民信息。 2、周末两天的日志文件第一列为姓名,第二列为性别,第三列为本次停留时间,单 位为分钟,分隔符为“,”。 数据: log1.txt:周六网民 阅读全文
posted @ 2019-06-13 16:44 o_0的园子 阅读(783) 评论(0) 推荐(0) 编辑
大数据学习——spark-steaming学习
摘要:官网http://spark.apache.org/docs/latest/streaming-programming-guide.html 1.1. 用Spark Streaming实现实时WordCount 1.安装并启动生成者 首先在一台Linux(ip:192.168.10.101)上用YU 阅读全文
posted @ 2019-06-13 16:34 o_0的园子 阅读(510) 评论(0) 推荐(0) 编辑
大数据学习——sparkSql对接hive
摘要:1. 安装mysql 2. 上传、解压、重命名 2.1. 上传 在随便一台有hadoop环境的机器上上传安装文件 su - hadoop rz –y 2.2. 解压 解压缩:apache-hive-1.0.1-bin.tar.gz tar -zxvf apache-hive-1.0.1-bin.ta 阅读全文
posted @ 2019-06-13 14:05 o_0的园子 阅读(547) 评论(0) 推荐(0) 编辑
大数据学习——sparkSql对接mysql
摘要:1上传jar 2 加载驱动包 3 4 读取数据(注意mysql要启动) 5 往mysql数据库写数据 阅读全文
posted @ 2019-06-13 00:04 o_0的园子 阅读(459) 评论(0) 推荐(0) 编辑
大数据学习——sparkSql
摘要:官网http://spark.apache.org/docs/1.6.2/sql-programming-guide.html DSL风格语法 SQL风格语法 阅读全文
posted @ 2019-06-12 19:45 o_0的园子 阅读(256) 评论(0) 推荐(0) 编辑
大数据学习——spark运营案例
摘要:iplocation需求 在互联网中,我们经常会见到城市热点图这样的报表数据,例如在百度统计中,会统计今年的热门旅游城市、热门报考学校等,会将这样的信息显示在热点图中。 因此,我们需要通过日志信息(运行商或者网站自己生成)和城市ip段信息来判断用户的ip段,统计热点经纬度。 练习数据 链接:http 阅读全文
posted @ 2019-06-12 14:16 o_0的园子 阅读(1226) 评论(1) 推荐(0) 编辑
大数据学习——spark笔记
摘要:变量的定义 方法和函数 逻辑执行语句 集合操作 类(重要) 集合的高级操作(重要) 高级特性 actor 并发编程的接口(非常重要) spark(what、how、why、use、运维<源码的理解>) 课程目标 什么是spark? how1(部署) 启动 运行shell 用api开发spark代码 阅读全文
posted @ 2019-06-11 11:50 o_0的园子 阅读(358) 评论(0) 推荐(0) 编辑
大数据学习——sparkRDD
摘要:https://www.cnblogs.com/qingyunzong/p/8899715.html 练习1:map、filter //通过并行化生成rdd val rdd1 = sc.parallelize(List(5, 6, 4, 7, 3, 8, 2, 9, 1, 10)) //对rdd1里 阅读全文
posted @ 2019-06-11 11:42 o_0的园子 阅读(170) 评论(0) 推荐(0) 编辑
大数据学习——spark学习
摘要:计算圆周率 运行spark-shell的两种方式: 1直接运行spark-shell 单机通过多线程跑任务,只运行一个进程叫submit 2运行spark-shell --master spark://mini1:7077 将任务运行在集群中,运行submit在master上,运行executor在 阅读全文
posted @ 2019-06-10 18:46 o_0的园子 阅读(354) 评论(0) 推荐(0) 编辑
大数据学习——spark安装
摘要:一主多从 1 上传压缩包 2 解压 删除安装包 重命名 3 修改配置文件 4 分发给另外几台机器 5 启动 指定某一台 启动所有 查看进程 http://mini1:8080/ 关闭集群 sbin/stop-all.sh 多主多从 阅读全文
posted @ 2019-06-10 16:30 o_0的园子 阅读(247) 评论(0) 推荐(0) 编辑
大数据学习——akka自定义RPC
摘要:实现 阅读全文
posted @ 2019-06-10 09:39 o_0的园子 阅读(349) 评论(0) 推荐(0) 编辑
大数据学习——akka学习
摘要:架构图 重要类介绍 ActorSystem 在Akka中,ActorSystem是一个重量级的结构,他需要分配多个线程,所以在实际应用中,ActorSystem通常是一个单例对象,我们可以使用这个ActorSystem创建很多Actor。 Actor 在Akka中,Actor负责通信,在Actor中 阅读全文
posted @ 2019-06-04 17:19 o_0的园子 阅读(470) 评论(0) 推荐(0) 编辑
IDEA界面创建Scala的Maven项目
摘要:1. 创建Maven工程,勾选右侧的Create from archetype选项,然后选中下方的scala-archetype-simple选项,如图所示:2. 填写相应的GroupId、ArtifactId内容,一般情况下GroupId是实际的项目名称,ArtifactId对应实际项目的一个模块 阅读全文
posted @ 2019-06-04 15:37 o_0的园子 阅读(1235) 评论(0) 推荐(0) 编辑
大数据学习——actor编程
摘要:1 概念 Scala中的Actor能够实现并行编程的强大功能,它是基于事件模型的并发机制,Scala是运用消息(message)的发送、接收来实现多线程的。使用Scala能够更容易地实现多线程应用的开发。 2 传统java并发编程与scala actor编程的区别 对于Java,我们都知道它的多线程 阅读全文
posted @ 2019-06-04 10:31 o_0的园子 阅读(322) 评论(0) 推荐(0) 编辑
2018年最新Java面试题及答案整理
摘要:转https://blog.csdn.net/qq_41701956/article/details/80250226 https://blog.csdn.net/qq_41701956/article/category/7542407 阅读全文
posted @ 2019-06-04 09:38 o_0的园子 阅读(168) 评论(0) 推荐(0) 编辑
大数据学习——scala类相关操作
摘要:1 类的定义 2构造器 3 单例对象 在Scala中没有静态方法和静态字段,但是可以使用object这个语法结构来达到同样的目的 1.存放工具方法和常量 2.高效共享单个不可变的实例 3.单例模式 4 伴生对象 在Scala的类中,与类名相同的对象叫做伴生对象,类和伴生对象之间可以相互访问私有的方法 阅读全文
posted @ 2019-06-04 09:37 o_0的园子 阅读(174) 评论(0) 推荐(0) 编辑
大数据学习——scala集合练习
摘要:package com /** * Created by ZX on 2016/4/5. */ object ListTest { def main(args: Array[String]) { //创建一个List val lst0 = List(1,7,9,8,0,3,5,4,6,2) //将lst0中每个元素乘以10后生成一个新的集合 val ... 阅读全文
posted @ 2019-06-03 13:39 o_0的园子 阅读(770) 评论(0) 推荐(0) 编辑
大数据学习——scala的wordCount小例子
摘要:val lines=List("hello tom hello jerry","hello tom hello kitty hello china") //方法一: val wc=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).map(t=>(t._1,t._2.size)).toList.sortBy(_._2)... 阅读全文
posted @ 2019-06-02 18:58 o_0的园子 阅读(522) 评论(0) 推荐(0) 编辑
大数据学习——scala数组
摘要:package com import scala.collection.mutable.ArrayBuffer /** * Created by Administrator on 2019/4/8. */ object TestMap { def main(args: Array[String]) { //**定长数组和变长数组********************... 阅读全文
posted @ 2019-05-31 16:35 o_0的园子 阅读(364) 评论(0) 推荐(0) 编辑

1 2 3 4 5 6 下一页
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示