会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
爱知菜的技术博客
博客园
首页
新随笔
联系
订阅
管理
2018年5月31日
Hive 使用 Python 的UDF 对大量日志进行分词统计
摘要: Hive命令行中可以使用 add file /path/python/script.py 来添加脚本 Hive会把查询结果输入到标准输入, 在map阶段Python从标准输入中读取, 逐行处理, 返回结果 比如 select TRANSFORM(col1, col2) using 'python s
阅读全文
posted @ 2018-05-31 19:10 爱知菜
阅读(15)
评论(0)
推荐(0)
编辑
公告