摘要:
广告有效性原理 上图所示有效性模型把广告的信息接收过程分为选择(selection)、解释(interpretation)与态度(attitude)三个大阶段,或者进一步分解为曝光(exposure)、关注(attention)、理解(comprehension)、接受(acceptance)、保持 阅读全文
摘要:
命令 crontab -e 参数: -e 编辑该用户的计时器设置-l 列出该用户的计时器设置-r 删除该用户的计时器设置-u<用户名称> 指定要设定计时器的用户名称 格式: 分钟 小时 日 月 星期 命令 * * * * * * 第1列表示分钟1~59 每分钟用*或者 */1表示第2列表示小时1~2 阅读全文
摘要:
https://blog.csdn.net/yamaxifeng_132/article/details/71105311 主要原因是test.sh是我在windows下编辑然后上传到linux系统里执行的。.sh文件的格式为dos格式,而linux只能执行格式为unix格式的脚本。 阅读全文
摘要:
文本文件 将一个文本文件读取为RDD时,输入的每一行都会成为RDD的一个元素。也可以将多个完整的文本文件一次性读取为一个pairRDD, 其中键是文件名,值是文件内容。 JSON 读取Json最简单的方法是将数据作为文本文件读取,然后使用Json解析器来对RDD中的值进行映射操作。Json的使用需要 阅读全文
摘要:
广播变量用来高效地分发较大的对象,累加器用来对信息进行聚合。 广播变量: 广播变量可以让程序高效地向所有工作节点发送一个较大的只读值,以供一个或多个spark操作使用,在机器学习中非常有用。广播变量是类型为spark.broadcast.Broadcast[T]的一个对象,其中存放着类型为T的值。它 阅读全文
摘要:
Apache Spark是一个分布式计算框架,旨在简化运行于计算机集群上的并行程序的编写。 RDD:弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一个抽象概念,提供了一个高度受限的共享内存模型。一个RDD包含多个分区(Partition)。 DAG:有向 阅读全文
摘要:
思路一: 思路二: output: 1 2 3 4 5 6 7 8 28 29 30 31 32 33 34 9 27 48 49 50 51 52 35 10 26 47 60 61 62 53 36 11 25 46 59 64 63 54 37 12 24 45 58 57 56 55 38 阅读全文
摘要:
1. InputStream、OutputStream 处理字节流的抽象类 InputStream 是字节输入流的所有类的超类,一般我们使用它的子类,如FileInputStream等. OutputStream是字节输出流的所有类的超类,一般我们使用它的子类,如FileOutputStream等. 阅读全文
摘要:
1. Arrays.sort(T[] a)是对数组元素按字典序进行升序排列 output: [1, 2, 4, 5, 7, 9, 12, 21, 54] 2. Arrays.sort(T[] a, Comparator<? Super T> c)用Comparator接口实现自定义排序规则 outp 阅读全文
摘要:
Scanner 一个可以使用正则表达式来分析基本类型和字符串的简单文本扫描器,使用分隔符模式将其输入分解为标记,默认情况下该分隔符模式与空白匹配。然后可以使用不同的next方法将得到的标记转换为不同类型的值。直接把数据写到硬盘。 BufferedReader 从字符输入流中读取文本,缓冲各个字符,从 阅读全文