2019 年 12月 31 日随笔档案 - 曲水修竹

2019年12月31日

摘要：数据倾斜产生的原因数据倾斜就是分布式计算过程中，数据分配不均匀，导致最终任务花费的时间很长或失败。不管是hive还是spark，数据倾斜基本都发生在执行join count distinct、group by等会触发Shuffle操作时，如果key值分布过于集中，相同key的值就会被拉到一个节点阅读全文

posted @ 2019-12-31 13:33 曲水修竹阅读(206) 评论(0) 推荐(0) 编辑

word HTML文件与Markdwon互相转换的几种方式

摘要： Tip：word文件与Markdwon转换往往是可逆的。无论使用哪种方式，要想完美转换，必须要预先处理掉markdown与word不兼容的格式，如word文件对象，带边框的代码块等等方法一：借助pandoc 或者结合Writage pandoc： Windows/Mac安装下载地址https:/ 阅读全文

posted @ 2019-12-31 13:32 曲水修竹阅读(447) 评论(0) 推荐(0) 编辑

曲水修竹

公告