摘要:
常用推荐算法分类 实时和离线; 是否个性化推荐;基于统计的推荐; 个性化推荐的原则:如可以基于相似度去划分、基于已有的知识去推荐、基于模型的推荐(去学习这个推荐的模型); 按数据源划分:用户、物品、用户行为数据即它们俩之间的关系; 基于人口统计学的推荐(基于用户)与用户画像 基于内容的推荐(基于物品 阅读全文
摘要:
1. ClickHouse概述 ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告 https://clickhouse.yandex/docs/zh/ 官网:https://clic 阅读全文
摘要:
1. MongoDB简介 • MongoDB是为快速开发互联网Web应用而设计的数据库系统。• MongoDB的设计目标是极简、灵活、作为Web应用栈的一部分。• MongoDB的数据模型是面向文档的,所谓文档是一种类似于JSON的结构,简单理解MongoDB这个数据库中存的是各种各样的JSON。( 阅读全文
摘要:
Phoenix Phoenix是HBase的开源SQL皮肤。可以使用标准JDBC API代替HBase客户端API来创建表,插入数据和查询HBase数据。 1.特点 1) 容易集成:如Spark,Hive,Pig,Flume和Map Reduce。 2) 性能好:直接使用HBase API以及协处理 阅读全文
摘要:
工具下载:https://varaneckas.com/jad/ 以下假设jad.exe在c:\java目录下一、基本用法 Usage:jad [option(s)] 直接输入类文件名,且支持通配符,如下所示。 c:\java\>jad example1.class c:\java\>jad *.c 阅读全文
摘要:
MySQL ---> HDFS; HDFS ----> MySQL
Mongodb --> HDFS; Mongodb --> MySQL; 阅读全文
摘要:
数仓| 离线& 实时 Flume数据采集的搭建及其架构原理 Kafka Hadoop Hive Spark Flink Mysql& Redis Hbase ELK 调度框架 Linux 常用工具 TRANSLATE with x English Arabic Hebrew Polish Bulga 阅读全文
摘要:
hadoop fs -rm -r -skipTrash /flumu //删除跳过垃圾回收站 导入数据到HDFS [kris@hadoop102 ~]$ hadoop fs -mkdir -p /user/hive/warehouse/ods.db/origin_user_behavior/2019 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
1. 概述 https://www.cnblogs.com/onepixel/p/7674659.html https://www.bilibili.com/video/av25136272 https://www.bilibili.com/video/av63851336 1.1 比较类排序 通过 阅读全文