摘要: 可迭代对象并不是迭代器,只是支持迭代。可被for循环遍历的对象,比如list,dict ,tuple ,string都是可迭代对象 那既然支持迭代,那要如何用迭代替换for循环呢? 内置函数 iter 帮到您 在可迭代对象外面套一个iter(),即可成为迭代器 再利用next()来获取迭代器中下一个 阅读全文
posted @ 2019-01-24 10:09 彩色条纹小斑马 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 当你突然看到别人的代码中出现了一个好像见过但又没用过的关键词 比如 yield ,你是否会觉得这段代码真是高大上呢? 或许只有我这种小白才会这样子觉得,就在刚刚,我就看见了别人的代码中的yield,觉得新奇的同时,又感叹自己太无知,但毕竟我也不是那种规规矩矩学写代码的人,遇上不懂的,咱就学咯。 于是 阅读全文
posted @ 2019-01-23 15:05 彩色条纹小斑马 阅读(446) 评论(0) 推荐(0) 编辑
摘要: *args 和 **kwargs 可以将不定数量的参数传递给函数 *args 和 **kwargs,前者适用于 传入非键值对的可变数量的参数列表,后者适用于 传入不定长度的键值对, 作为参数传递给函数 **kwargs 就是在*args 的基础上,添加了变量名以及转变了格式 如下所示: 先定义一个函 阅读全文
posted @ 2019-01-22 10:35 彩色条纹小斑马 阅读(2417) 评论(0) 推荐(1) 编辑
摘要: 小编最近在进行utf-8转码的时候,遇到一个问题: 当其他编码中含有斜杆,如: 当取出该字符串时,会自动把斜杆转换成双斜杠 导致转码报错: 这时候可以在转码的时候加上,即可转换成功了 unicode-escape是对unicode编码的字节流,两个字节两个字节转义,并对每两个字节一起以16进制输出 阅读全文
posted @ 2019-01-02 11:05 彩色条纹小斑马 阅读(2763) 评论(1) 推荐(0) 编辑
摘要: 小编最近入坑风控,在工作中需要对数据进行等频率切分,也就是将数据划分成几段,在每段中,数据的出现频率,出现次数是大致相同的,让数据集在每段上呈现出分布均匀的趋势。 小编先是想到df.describe 出来的结果是: 描述结果分别就是 计数,均值,标准差,最小,四分位数,最大值 我要的是十分位,那就要 阅读全文
posted @ 2018-11-30 10:56 彩色条纹小斑马 阅读(2913) 评论(0) 推荐(1) 编辑
摘要: python中有MySQLdb、pymysql,psycopg2(连接postgresql)等数据库模块,本文用pymysql模块连接mysql数据库,并且读取数据库表 看过其他博文的介绍,把程序和数据库比作两个目的地,将游标比喻成运输货车 很是形象生动! 我用的是Anaconda的编辑器spyde 阅读全文
posted @ 2018-11-16 11:07 彩色条纹小斑马 阅读(3663) 评论(0) 推荐(0) 编辑
摘要: 当我们训练一个分类模型,总要有一些指标来衡量这个模型的优劣。一般可以用如题的指标来对预测数据做评估,同时对模型进行评估。 首先先理解一下混淆矩阵,混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。 准确率:分类器正确分类的样本数与总样本数之比。即预测 == 实际的,即斜 阅读全文
posted @ 2018-03-20 10:27 彩色条纹小斑马 阅读(2636) 评论(0) 推荐(1) 编辑
摘要: scala 隐式转换 (暗自转换类型) 参考文档 https://www.cnblogs.com/MOBIN/p/5351900.html 关键字 implicit 使用方法: 1.变量标记为implicit 1 implicit val p = "mobin" 2.方法、方法的参数列表标记为imp 阅读全文
posted @ 2018-03-05 14:40 彩色条纹小斑马 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 在2.0版本之前,使用Spark必须先创建SparkConf和SparkContext,不过在Spark2.0中只要创建一个SparkSession就够了,SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中。 在与spark2.0交互之前必须 阅读全文
posted @ 2017-06-18 14:36 彩色条纹小斑马 阅读(1023) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2017-06-18 14:07 彩色条纹小斑马 阅读(0) 评论(0) 推荐(0) 编辑