2016年11月4日

摘要: 1,两表连接要注意连接字段类型是否一致; 2,两表字段做比较注意字段单位是否一致,比如用时间作比较的时候,弄清楚到底是“时间戳”还是“时分秒”,否则容易造成空值或结果不正确; 3,数据表随机取数时可以用取模操作来进行,比如数据表中有100万条数据,我们要随机取大约10万条,假设主键时id,我们可以用 阅读全文
posted @ 2016-11-04 14:58 Adam_S 阅读(258) 评论(0) 推荐(0) 编辑

2016年9月26日

摘要: 1. 从官网下载Spark安装包,解压到自己的安装目录下(默认已经安装好JDK,JDK安装可自行查找); spark官网:http://spark.apache.org/downloads.html 2. 进入系统命令行界面,进入安装目录下,如"/安装目录/spark-1.6.0-bin-hadoo 阅读全文
posted @ 2016-09-26 17:00 Adam_S 阅读(4680) 评论(0) 推荐(0) 编辑

导航