摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 apache-hive-3.1.1 一、简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供 阅读全文
posted @ 2019-01-24 16:15 cac2020 阅读(673) 评论(0) 推荐(0) 编辑
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 推荐系统——协同过滤(Collaborative Filtering)算法ItemCF:基于item的协同过滤,通过用户对不同item 阅读全文
posted @ 2019-01-24 10:35 cac2020 阅读(798) 评论(0) 推荐(0) 编辑
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 概念TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常 阅读全文
posted @ 2019-01-24 10:22 cac2020 阅读(1039) 评论(0) 推荐(0) 编辑