会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
One-Way
爱一人,攀一山,追一梦
博客园
首页
博问
闪存
新随笔
订阅
管理
上一页
1
2
3
4
5
6
···
12
下一页
2017年9月25日
Linux java 命令行编译 jar包
摘要: Java 命令行编译成class,然后在打包成jar文件。 编译成class 可以通过javac 命令查看帮助 -classpath 指定依赖的class,:进行分隔 -d 生成的class存放的目录 打包成jar 将class目录下的内容全部打包,并且将自己写的MANIFEST.MF文件打包,以便
阅读全文
posted @ 2017-09-25 16:05 单行道|
阅读(4712)
评论(0)
推荐(0)
编辑
2017年9月21日
Mapreduce打印调试输出
摘要: Mapreduce打印调试内容: 一、启动JobHistoryServer 通过jps查看JobHistoryServer进程存在,启动成功。 在8088端口,查看作业,点击History: 点击logs: 提示: 接下来修改配置 二、修改yarn配置文件 yarn-site.xml 重启hadoo
阅读全文
posted @ 2017-09-21 23:37 单行道|
阅读(778)
评论(0)
推荐(0)
编辑
2017年9月19日
Hive 表分区
摘要: Hive表的分区就是一个目录,分区字段不和表的字段重复 创建分区表: 加载数据到hive分区表中 方法一:通过load方式加载 方法二:insert select 方式 方法三:可通过手动上传文件到分区目录,进行加载 虽然方法三手动上传文件到分区目录,但是查询表的时候是查询不到数据的,需要更新元数据
阅读全文
posted @ 2017-09-19 11:13 单行道|
阅读(19060)
评论(0)
推荐(2)
编辑
2017年9月18日
Hive 数据的导入导出
摘要: 数据的导入: 通过文件导入,使用load命令 一、导入本地文件: 二、导入hdfs文件: 差别主要在 local 参数, overwrite 参数会删除之前的数据,然后再进行插入。 通过过已有的表数据进行导入,使用insert命令: 注意,这里的数据导入,是在已经存在表结构的前提下进行的。 数据导出
阅读全文
posted @ 2017-09-18 17:17 单行道|
阅读(307)
评论(0)
推荐(0)
编辑
Hive 创建表
摘要: 创建表的三种方式: 方式一:新建表结构 方式二:复用已有的表结构 方式三:拷贝表结构和表数据 内部表:managed_table外部表:external_table 内部表被删除时,hdfs上的数据,和元数据(mysql)上的数据都被删除。 外部表被删除时,hdfs上的数据还在,只删除元数据(mys
阅读全文
posted @ 2017-09-18 16:53 单行道|
阅读(701)
评论(0)
推荐(0)
编辑
Hive 实现 wordcount
摘要: 创建表: 执行查询SQL:
阅读全文
posted @ 2017-09-18 16:27 单行道|
阅读(357)
评论(0)
推荐(0)
编辑
CDH hive-1.1.0-cdh5.10.0 安装
摘要: 又重新安装Hive,记录一下吧: hadoop早已经装上了。 cdh5的hive下载地址: http://archive.cloudera.com/cdh5/cdh/5/ 下载文件:hive-1.1.0-cdh5.10.0.tar.gz 操作系统版本:CentOS CentOS Linux rele
阅读全文
posted @ 2017-09-18 15:49 单行道|
阅读(2030)
评论(0)
推荐(0)
编辑
2017年9月15日
Linux shell ftp命令下载文件 根据文件日期
摘要: 需求:ftp获取远程数据的文件,根据文件的创建时间点下载文件。 可以自行扩展根据文件的大小等其他需求。 知识点总结: 1、获取文件的时间: 时间内容: Sep 8 16:03 2、时间格式转换 转换结果: 201709081603 3、指定文件名,正则匹配 注意awk里面模式变量用' '括起来,.*
阅读全文
posted @ 2017-09-15 15:19 单行道|
阅读(5253)
评论(0)
推荐(0)
编辑
2017年8月28日
Matplotlib 简单图例
摘要: 图例参考:http://matplotlib.org/gallery.html API参考:http://matplotlib.org/api/pyplot_summary.html
阅读全文
posted @ 2017-08-28 12:50 单行道|
阅读(420)
评论(0)
推荐(0)
编辑
2017年8月25日
GitHub Git 简单操作
摘要: 一、使用git更新GitHub 准备:本地已经安装好git 登录GitHub,选择好仓库,点击 Clone or download 拷贝地址 这里的地址为:https://github.com/edward0130/Coursera-ML.git 本地在要存放仓库的文件目录上点击右键: 进入bash
阅读全文
posted @ 2017-08-25 12:27 单行道|
阅读(391)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
···
12
下一页