摘要: 在Hive中使用INSERT OVERWRITE时, 数据会先被写入到数据文件夹的临时文件内,类似于 .hive-staging_hive_ 开头的文件 然后删除所有原文件,将临时文件重命名为”原文件“ 参考资料 what-is-the-behaviour-of-select-during-an-i 阅读全文
posted @ 2019-03-02 23:12 LestatZ 阅读(941) 评论(0) 推荐(0) 编辑
摘要: 文章目录前言准备工作创建一个新的Scrapy项目定义一个爬虫Spider导出抓取数据保存数据到数据库(MongoDB)前言之前用python写了一个简单的爬虫项目用来抓取上海链家上的一些房价信息,整理了下代码,特此记录准备工作安装Scrapy创建一个新的Sc... 阅读全文
posted @ 2019-03-02 12:06 LestatZ 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 文章目录前言词汇表前言看书整理的时候遇到一些词汇不知道怎么翻译成中文好,于是整理了一些词汇解释的笔记,整理成如下词汇表词汇表angle brackets 尖括号 iterate over 迭代 array buffers 数组缓冲 i... 阅读全文
posted @ 2019-03-02 10:07 LestatZ 阅读(215) 评论(0) 推荐(0) 编辑