2018 年 8月随笔档案 - 最最么么哒

linux定时任务（转）

摘要：转自：https://www.cnblogs.com/intval/p/5763929.html linux 系统则是由 cron (crond) 这个系统服务来控制的。Linux 系统上面原本就有非常多的计划性工作，因此这个系统服务是默认启动的。另外, 由于使用者自己也可以设置计划任务，所以，阅读全文

posted @ 2018-08-28 15:22 最最么么哒阅读(195) 评论(0) 推荐(0) 编辑

shell脚本中大于，大于等于，小于，小于等于、不等于的表示方法

摘要：症状：shell中大于，大于等于，小于等于，lt,gt ,ne,ge,le 很对应。应对方法：大于 -gt (greater than) 小于 -lt (less than) 大于或等于 -ge (greater than or equal) 小于或等于 -le (less than or eq 阅读全文

posted @ 2018-08-28 11:32 最最么么哒阅读(11154) 评论(0) 推荐(0) 编辑

scala中可以执行外部命令Process

摘要：后续用到在总结 Process(s"hadoop fs -rm -r ${path}").!! 阅读全文

posted @ 2018-08-27 18:17 最最么么哒阅读(708) 评论(0) 推荐(0) 编辑

hdfs的文件个数 HDFS Quotas Guide

摘要：HDFS Quotas Guide Overview HDFS允许管理员为多个每个目录设置使用的命名空间和空间的配额。命名空间配额和空间配额独立操作，但是这两种类型的配额的管理和实现非常类似。 Name Quotas 命名空间配额是一个目录树中该目录下的文件和子目录数量的硬限制。如果超出配额，文件和阅读全文

posted @ 2018-08-21 17:26 最最么么哒阅读(1176) 评论(0) 推荐(0) 编辑

hive删除数据（转）

摘要：转自：https://www.cnblogs.com/linn/p/6196293.html 按分区删除: ALTER TABLE test1 DROP PARTITION (dt='2016-04-29'); 删除符合条件的数据: insert overwrite table t_table1 s 阅读全文

posted @ 2018-08-20 10:18 最最么么哒阅读(1080) 评论(0) 推荐(0) 编辑

spark读写Oracle、hive的艰辛之路（一）

摘要：前两天工作需求，要通过给的几个Oracle的视图把数据入到hive库中，很遗憾，使用的华为云平台的集区环境中并没有sqoop1，当然也并没有sqoop2，所以，想到的解决方案是使用spark读取Oracle在写入到hive表中； 1、首先，沟通了一个星期的数据库接口，是的，就是一个星期；拿到的结果为阅读全文

posted @ 2018-08-10 18:32 最最么么哒阅读(884) 评论(0) 推荐(0) 编辑

hive Hive 2.0函数大全(中文版)(转)

摘要：转自：https://www.cnblogs.com/MOBIN/p/5618747.html#1 摘要 Hive内部提供了很多函数给开发者使用，包括数学函数，类型转换函数，条件函数，字符函数，聚合函数，表生成函数等等，这些函数都统称为内置函数。目录数学函数集合函数类型转换函数日期函数条阅读全文

posted @ 2018-08-06 14:59 最最么么哒阅读(2362) 评论(0) 推荐(0) 编辑

spark jdbc(mysql) 读取并发度优化

摘要：转自：https://blog.csdn.net/lsshlsw/article/details/49789373 很多人在spark中使用默认提供的jdbc方法时，在数据库数据较大时经常发现任务 hang 住，其实是单线程任务过重导致，这时候需要提高读取的并发度。下文以 mysql 为例进行说明阅读全文

posted @ 2018-08-02 23:58 最最么么哒阅读(3813) 评论(0) 推荐(1) 编辑

08 2018 档案

公告