摘要: 在用PySpark操作HBase时默认是scan操作,通常情况下我们希望加上rowkey指定范围,即只获取一部分数据参加运算。翻遍了spark的python相关文档,搜遍了google和stackoverflow也没有具体的解决方案。既然java和scala都支持,python肯定也支持的。翻了一下... 阅读全文
posted @ 2015-05-13 12:48 errdev 阅读(4387) 评论(1) 推荐(0) 编辑