使用PyCharm开发pyspark应用程序

  既然要开发pyspark应用程序,那么,首选的IDE当然就是PyCharm了,因为PyCharm是一款专门开发Python的IDE。

  在这里,主要说明一下使用PyCharm开发pyspark程序的几个配置:

  (1)除了设置基本的python interceptor之外,还要设置PYTHONPATH和SPARK_HOME这两个环境变量,而这两个环境变量是在PyCharm里的Edit Configurations里设置的:

 

 

  (2)添加两个zip包(pyspark.zip、py4j-0.10.6-src.zip)

 这两个zip包其实是spark所包含的python里的包,请看:

 具体代码如下:

复制代码
from pyspark import SparkConf,SparkContext

conf = SparkConf().setMaster("local[2]").setAppName("spark0301")
sc = SparkContext(conf=conf)

data = [1,2,3,4,5]
distData = sc.parallelize(data)
print(distData.collect())

sc.stop()
复制代码

 

posted @   田攀攀的博客  阅读(449)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
点击右上角即可分享
微信分享提示