摘要:
一、节点间平衡 1、Apache 开启数据均衡命令: bin/start-balancer.sh –threshold 10 对于参数10,代表的是集群中各个节点的磁盘空间利用率相差不超过10%,可根据实际情况进行调整。 停止数据均衡命令: bin/stop-balancer.sh 2、CDH CD 阅读全文
摘要:
能够看到是正则初始化编译时出现了错误,也就是split方法使用的正则写法出现了错误,因此上网找到了比较详细的写法。 故在使用split进行列转行时应该四个\ 阅读全文
摘要:
1、什么是集群 Redis 集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N。 Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 阅读全文
摘要:
主从复制,就是主机数据更新后根据配置和策略,自动同步到备机的master/slaver机制,Master以写为主,Slave以读为主 用处 读写分离,性能扩展 容灾快速恢复 配从(服务器)不配主(服务器) 拷贝多个redis.conf文件include 开启daemonize yes Pid文件名字 阅读全文
摘要:
Redis 提供了2个不同形式的持久化方式。 RDB (Redis DataBase) AOF (Append Of File) 1、RDB 在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。 备份是如何执行的 Redis会单独创 阅读全文
摘要:
1、基于人口统计学的推荐 用户画像 2、基于内容的推荐 相似度计算 基于内容的推荐算法 基于内容推荐系统的高层次结构 特征工程 数值型特征处理 归一化 离散化 类别型特征处理 时间型特征处理 统计型特征处理 推荐系统常见反馈数据 基于 UGC 的推荐 基于 UGC 简单推荐的问题 TF-IDF TF 阅读全文
摘要:
一、监督学习 1、回归模型 1.1 线性回归模型 求解 最小二乘法 梯度下降法 2、分类模型 2.1 K近邻(KNN) 示例 KNN距离计算 KNN算法 2.2 逻辑斯蒂回归 逻辑斯蒂回归 —— 分类问题 Sigmoid函数(压缩函数) 逻辑斯谛回归损失函数 梯度下降法求解 2..3 决策树 示例 阅读全文
摘要:
1、机器学习概念 1.1 机器学习是什么 1.2 机器学习开端 1.3 机器学习定义 1.4 机器学习过程 1.5 示例 2、机器学习分类 2.1 无监督学习 2.2 监督学习 2.3 监督学习应用 3、监督学习深入介绍 3.1 监督学习三要素 3.2 监督学习实现步骤 3.3 监督学习过程示例 3 阅读全文
摘要:
1、线性代数 1.1 什么是矩阵 1.2 矩阵中基本概念 特殊矩阵 1.3 矩阵的加法 1.4 矩阵的乘法 1.5 矩阵的转置 1.6 矩阵的运算法则 1.7 矩阵的逆 2、微积分 2.1 导数 2.2 偏导数 2.3 方向导数和梯度 2.4 凸函数和凹函数 3、概率统计 3.1 常用统计变量 3. 阅读全文
摘要:
1、目的 推荐系统是信息过载所采用的措施,面对海量的数据信息,从中快速推荐出符合用户特点的物品。解决一些人的“选择恐惧症”;面向没有明确需求的人。 • 解决如何从大量信息中找到自己感兴趣的信息。 • 解决如何让自己生产的信息脱颖而出,受到大众的喜爱 • 让用户更快更好的获取到自己需要的内容 • 让内 阅读全文