摘要:
R语言进行词云统计分析 本文章从爬虫、词频统计、可视化三个方面讲述了R语言的具体应用,欢迎大家共同谈论学习 1、使用 rvest 进行数据的爬取 如果没有,先安装rvest包 install.packages("rvest") library(rvest) url % html_node("arti 阅读全文
摘要:
一直以来都对scala中“= ”的使用比较迷茫,也不知道他表示什么意思。今天就它的使用场景列举如下,希望可以共同探讨。 1. 表示函数的返回类型(Function Type) scala def double(x: Int): Int = x 2 double: (x: Int)Int //定义一个 阅读全文
摘要:
用户画像案例一:汽车精准营销 做汽车精准营销项目已经快一年的时间了,但是说起正真的用户画像,又不知道该如何说起,所以我就开始从数据的处理流程一点点的来引进用户画像的建立。 1、数据的处理流程 我们用到的技术就是用java写mapreduce框架来实现用户上网数据的url的识别,这里识别用的是正则表达 阅读全文
摘要:
Scala基本语法总结 时隔快一年了,又捡起scala,不是想学的有多么的精通,只是想把之前遇到的知识点和实践中遇到的重点进行归纳总结,对以后的面试或许有点帮助吧! 一、scala开发环境的配置 我这里分享一下有道云笔记的地址,有之前学习的时候对scala的安装方法的详细描述,有兴趣的可以看看 "h 阅读全文
摘要:
用户画像 用户画像首先的是商业目的下的用户标签的集合,例如:猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?探讨这些是没有意义的。而探讨是男是女如何影响消费决策,工资多少影响消费能力,有没有谈恋爱会否带来新的营销场景,剁手购物怎么精准推荐,这些才是用户画像背后的逻辑。 1、 阅读全文
摘要:
Cloudera Manager 安装集群遇到的坑 多次安装集群,但每次都不能顺利,都会遇到很多很多的坑,今天就过去踩过的坑简单的总结一下,希望已经踩了的和正在踩的童鞋能够借鉴一下,希望对你们能有所帮助。 一、Mysql的配置 1、卸载原有的mysql 查看目前安装的mysql 卸载自带的mysql 阅读全文