摘要: Abstratct:描述了当前协同过滤算法两大技术alternating least square(ALS,最小二乘法)和gradient descent(GD)的确定:原文:Existing collaborative filtering techniques are implemented wi 阅读全文
posted @ 2018-10-26 08:36 hotMemo 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 数据仓库 Hive是建立在Hadoop HDFS上的数据仓库基础架构 Hive可以用来进行数据提取转化加载(ETL) Hive定义了见到那的类似SQL查询语言,称为HQL它允许熟悉SQL的用户查询数据 Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的ma 阅读全文
posted @ 2018-08-18 20:32 hotMemo 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 桥接模式就是将抽象部分与它的实现部分分离,使它们都可以独立地变化 Abstraction:抽象部分的接口。通常在这个抽象里面,要维护一个实现部分的对象引用,在抽象对象里面的方法,需要调用实现部分的对象来完成。这个对象里面的方法,通常都是跟具体的业务相关的方法。 RefinedAbstraction: 阅读全文
posted @ 2018-08-18 03:06 hotMemo 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 单例模式 保证一个类仅有一个实例,并提供一个访问它的全局访问点。 读取配置文件的内容:现在要读取配置文件的内容,该如何实现呢? 存在问题: 在系统运行期间,系统中会存在很多个AppConfig的实例对象,这回严重浪费系统资源 把上面的描述进一步抽象一下,问题就出来了:在一个系统运行期间,某个类只需要 阅读全文
posted @ 2018-08-17 17:38 hotMemo 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 一、适配器模式 1.适配器模式的功能: 适配器模式的主要功能时进行转换匹配,目的时复用已有的功能,而不是来实现新的接口。 适配器里面也可以实现功能,称这种适配器为智能适配器 2.Adaptee和Target的关系 适配器中被适配的接口Adaptee和适配成为的接口Target时没有关联的 3.对象组 阅读全文
posted @ 2018-08-17 02:57 hotMemo 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 在spark中运行./spark-shell --master YARN-client --num-executors 3 --executor-memory 1g是碰到如下的问题: biaoshi 表示资源不足,可能是内存不足或者core不足,于是就将1g改为512m,运行成功 以spark-cl 阅读全文
posted @ 2018-08-16 22:56 hotMemo 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 本篇文章围绕下图展开: Hbase应用场景、原理与基本架构: Hbase是构建在HDFS上的分布式列存储系统,Hbase内部管理的文件全部存储在HDFS中; HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储。 Hbase表的特点: 大:一个表可以有数十亿行,上百 阅读全文
posted @ 2018-07-26 19:53 hotMemo 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 注:以下执行命令均在hadoop安装目录的bin目录下。 1、-help[cmd] 显示命令的帮助信息 2、-ls(r) 显示当前目录下的所有文件 -R层层循出文件夹 3、-du(s) 显示目录中所有文件大小,或者当只指定一个文件时,显示此文件的大小 4、-count[-q] 显示当前目录下的所有文 阅读全文
posted @ 2018-07-19 21:13 hotMemo 阅读(263) 评论(0) 推荐(0) 编辑
摘要: MapReduce 数字统计例子WordCount 在单机环境上运行WordCount.java程序 简单配置为:/etc/hosts: Core-site.xml 在这两个配置文件下运行WordCount 程序,出现如下的错误: 错误中有一句:due to :Call From YARN001/1 阅读全文
posted @ 2018-07-19 21:08 hotMemo 阅读(227) 评论(0) 推荐(0) 编辑
摘要: Hadoop 单机配置文件详解Hadoop配置单机需要修改core-site.xml、fairscheduler.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml、yarn-site.xml这几个文件,core-site.xml是全局配置,hdfs-si 阅读全文
posted @ 2018-07-16 16:27 hotMemo 阅读(927) 评论(0) 推荐(0) 编辑