摘要: 以前在进行搜索引擎rank-svm排序模型训练时,直接使用python读取的HDFS日志文件、统计计算等预处理操作再进行svm模型,最终产生出训练模型。现在回想一下,数据预处理这一块完全可以使用spark进行,而且看起来更“正规一点”和高大上,并借机接触一下大数据。pyspark的安装折腾了一上午, 阅读全文
posted @ 2018-04-05 11:46 南宫轩诺 阅读(945) 评论(0) 推荐(0) 编辑
摘要: 这篇文章主要介绍了python sort、sorted高级排序技巧,本文讲解了基础排序、升序和降序、排序的稳定性和复杂排序、cmp函数排序法等内容,需要的朋友可以参考下 Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的 阅读全文
posted @ 2018-04-05 08:19 南宫轩诺 阅读(422) 评论(0) 推荐(0) 编辑