Spark之SparkSql
-- Spark SQL 以编程方式指定模式 val sqlContext = new org.apache.spark.sql.SQLContext(sc) val employee = sc.textFile("/root/wangbin/employee.txt") 1201,satish,25 1202,krishna,28 1203,amith,39 1204,javed,23 1205,prudvi,23 val schemaString = "id,name,age" import org.apache.spark.sql.Row; import org.apache.spark.sql.types.{StructType, StructField, StringType}; val schema = StructType(schemaString.split(",").map(fieldName => StructField(fieldName, StringType, true))) val rowRDD = employee.map(_.split(",")).map(e => Row(e(0), e(1), e(2))) -- 通过使用roRDDdata和模式(SCHEMA)变量创建DataFrame。 val employeeDF = sqlContext.createDataFrame(rowRDD, schema) -- 使用以下命令将数据帧存储到名为employee的表中。 employeeDF.registerTempTable("employee2") -- 使用以下语句从employee表中选择所有记录。 val allrecords = sqlContext.sql("SELECT * FROM employee2") -- 查看所有记录数据帧的结果数据 allrecords.show() +----+-------+---+ | id| name|age| +----+-------+---+ |1201| satish| 25| |1202|krishna| 28| |1203| amith| 39| |1204| javed| 23| |1205| prudvi| 23| +----+-------+---+
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南