随笔- 102 文章- 0 评论- 20 阅读- 26万

【Spark机器学习速成宝典】基础篇01Windows下spark开发环境搭建（Python版）

# -*-coding=utf-8 -*-  
from operator import add
import random
from pyspark import SparkConf, SparkContext
sc = SparkContext('local')


NUM_SAMPLES = 100000

def inside(p):
    x, y = random.random(), random.random()
    return x*x + y*y < 1

count = sc.parallelize(xrange(0, NUM_SAMPLES)) \
             .filter(inside).count()
print "Pi is roughly %f" % (4.0 * count / NUM_SAMPLES)

'''运行结果：
Pi is roughly 3.140160
'''

posted @ 2017-12-01 16:12 黎明程序员阅读(1207) 评论(0) 编辑收藏举报

努力加载评论中...

刷新页面返回顶部

黎明程序员

【Spark机器学习速成宝典】基础篇01Windows下spark开发环境搭建（Python版）

目录

安装jdk

安装eclipse

安装PyDev插件

配置Spark

配置Hadoop

Python代码

公告