spark离线分析--本地Spark1.6版本读写hive表
1. 搭建好hive环境,并将hive-site.xml文件放到本地工程的resources目录下
2. java测试代码
public class SparkHiveTest{ public static void main(String[] args){ JavaSparkContext javaSparkContext = null; try { SparkContext sparkConf =new SparkConf().setAppName("SparkHiveTest").setMaster("local[*]"); javaSparkContext = new JavaSparkContext(sparkConf ); HiveContext hiveContext = new HiveContext(javaSparkContext ) //查询attack_count表数据,表结构 content ,ctime, content是json字符串,ctime是分区格式,yyyyMMdd string sql ="select * from test.attack_count order by ctime desc" DataFrame result = hiveContext .sql(sql); List<Row> collectAsList = result.coalesec(10).collectAsList(); result.registerTempTable("AttackCount"); String curDate = DateUtil.toString(new Date(), "yyyyMMdd"); hiveContext.sql("insert into table test.attack_count partition(ctime='"+curDate+"') select content from AttackCount limit 1"); }catch(Exception e){ }finally{ if(javaSparkContext!=null) { javaSparkContext.stop(); } } }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)