摘要:
1 Map side tuning参数1.1 MapTask运行内部原理当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂,并且利用到了内存buffer来进行已经产生的部分结果的缓存,并在内存buffer中进行一些预排序来优化整个map的性能。如上图所示,每一个map都会对应存在一个内存buffer(MapOutputBuffer,即上图的buffer in memory),map会将已经产生的部分结果先写入到该buffer中,这个buffer默认是100MB大小,但是这个大小是可以根据job提交时的参数设定来调整的,该参数即为:io. 阅读全文
随笔档案-2013年09月
Logistic回归
2013-09-15 20:45 by Polarisary, 452 阅读, 收藏,
摘要:
一.环境配置需要安装python的数据计算的库numpy和Matplotlib画出图形sudo apt-get install python-numpysudo apt-get install python-matplotlib为了方便还安装了ipythonsudo apt-get install ipython二.编辑test.py 1 from numpy import * 2 3 def loadDataSet(): 4 dataMat = []; labelMat = [] 5 fr = open('testSet.txt') 6 for line in fr... 阅读全文
浙公网安备 33010602011771号