Fork me on GitHub
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 31 下一页
摘要: 常用推荐算法分类 实时和离线; 是否个性化推荐;基于统计的推荐; 个性化推荐的原则:如可以基于相似度去划分、基于已有的知识去推荐、基于模型的推荐(去学习这个推荐的模型); 按数据源划分:用户、物品、用户行为数据即它们俩之间的关系; 基于人口统计学的推荐(基于用户)与用户画像 基于内容的推荐(基于物品 阅读全文
posted @ 2019-09-18 11:43 kris12 阅读(2151) 评论(1) 推荐(0) 编辑
摘要: 1. ClickHouse概述 ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告 https://clickhouse.yandex/docs/zh/ 官网:https://clic 阅读全文
posted @ 2019-08-31 08:09 kris12 阅读(7049) 评论(0) 推荐(0) 编辑
摘要: 1. MongoDB简介 • MongoDB是为快速开发互联网Web应用而设计的数据库系统。• MongoDB的设计目标是极简、灵活、作为Web应用栈的一部分。• MongoDB的数据模型是面向文档的,所谓文档是一种类似于JSON的结构,简单理解MongoDB这个数据库中存的是各种各样的JSON。( 阅读全文
posted @ 2019-08-28 00:04 kris12 阅读(335) 评论(0) 推荐(0) 编辑
摘要: Phoenix Phoenix是HBase的开源SQL皮肤。可以使用标准JDBC API代替HBase客户端API来创建表,插入数据和查询HBase数据。 1.特点 1) 容易集成:如Spark,Hive,Pig,Flume和Map Reduce。 2) 性能好:直接使用HBase API以及协处理 阅读全文
posted @ 2019-08-06 12:47 kris12 阅读(1527) 评论(0) 推荐(0) 编辑
摘要: 工具下载:https://varaneckas.com/jad/ 以下假设jad.exe在c:\java目录下一、基本用法 Usage:jad [option(s)] 直接输入类文件名,且支持通配符,如下所示。 c:\java\>jad example1.class c:\java\>jad *.c 阅读全文
posted @ 2019-07-22 23:59 kris12 阅读(1117) 评论(0) 推荐(0) 编辑
摘要: MySQL ---> HDFS; HDFS ----> MySQL Mongodb --> HDFS; Mongodb --> MySQL; 阅读全文
posted @ 2019-07-15 00:14 kris12 阅读(2475) 评论(0) 推荐(1) 编辑
摘要: 数仓| 离线& 实时 Flume数据采集的搭建及其架构原理 Kafka Hadoop Hive Spark Flink Mysql& Redis Hbase ELK 调度框架 Linux 常用工具 TRANSLATE with x English Arabic Hebrew Polish Bulga 阅读全文
posted @ 2019-06-01 14:14 kris12 阅读(1131) 评论(0) 推荐(0) 编辑
摘要: hadoop fs -rm -r -skipTrash /flumu //删除跳过垃圾回收站 导入数据到HDFS [kris@hadoop102 ~]$ hadoop fs -mkdir -p /user/hive/warehouse/ods.db/origin_user_behavior/2019 阅读全文
posted @ 2019-05-19 00:22 kris12 阅读(473) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2019-05-19 00:00 kris12 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1. 概述 https://www.cnblogs.com/onepixel/p/7674659.html https://www.bilibili.com/video/av25136272 https://www.bilibili.com/video/av63851336 1.1 比较类排序 通过 阅读全文
posted @ 2019-05-14 22:39 kris12 阅读(656) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 31 下一页
levels of contents