摘要:
在scala中执行如下代码,报 join 错误!! scala> val data = itemTotalTime.join(totalTime, "userId") 错误日志如下: <console>:29: error: overloaded method value join with alt 阅读全文
摘要:
package test /** * scala中的:: , +:, :+, :::, +++, 等操作; */ object listTest { def main(args: Array[String]): Unit = { val list = List(1,2,3) // :: 用于的是向队 阅读全文
摘要:
Hive 的udf使用 1.Hive 的udf使用需用需要的依赖 hadoop-common-2.6.4.jar hive-exec-1.2.1.jar <!--直接添加上面的两个jar包或者在pom中直接引入下面的两个依赖,都行--> <dependency> <groupId>org.apach 阅读全文
摘要:
YARN YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分 阅读全文
摘要:
Create Table 官网说明 Hive建表方式共有三种: 直接建表法 查询建表法 like建表法 首先看官网介绍’[]’ 表示可选,’|’ 表示二选一 1 CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_n 阅读全文
摘要:
说到聚类,应先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。 分类:分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过 阅读全文
摘要:
Anacond的介绍 Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB),如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较 阅读全文
摘要:
今天刚下载了 Anaconda ,然后又基于Anaconda 下载虚拟的python3.7版, 按照里说应该替换一下pyCharm 里面之前关联的物理机真实的python 就可以正常使用了,但是替换完无效,如 numpy 这些包还是报错,具体解决如下: 上面这个图是解决问题之后的模样;解决前要先点击 阅读全文
摘要:
当在windows下面的Anaconda的命令行中运行 conda update --all 时,如果出现Collecting package metadata (current_repodata.json): failed的错误提示, 可以按照下面的方式来解决掉: 把路径“../Anaconda3 阅读全文
摘要:
望图解释报错: 在报 “ModuleNotFoundError: No module named numpy ” 错误的之前,调试conda的时候还报了一个 “import 不是内部或者外部命令” 问题 如上图 我执行完 1 命令之后就误以为是进入了python 环境,其实不然,还需要执行 2 命令 阅读全文