摘要: 首先是isnull函数。这个函数主要是用在sql语句中的where条件语句里,用来看某个字段是为空(null),要注意的是空字符串是不属于null的。 比如:select * from student where isnull(gender) ifnull函数呢?又是什么意思? ifnull主要是用 阅读全文
posted @ 2020-05-20 10:40 詹岩鹏 阅读(4332) 评论(0) 推荐(0) 编辑
摘要: 类型转换postgres=# select round(1::numeric/4::numeric,2); round 0.25 阅读全文
posted @ 2019-10-29 11:36 詹岩鹏 阅读(496) 评论(0) 推荐(0) 编辑
摘要: import numpy as np >>> list1 = [[4,3,2],[2,1,4]] >>> array=np.array(list1) >>> array array([[4, 3, 2], [2, 1, 4]]) >>> array.sort(axis=1) >>> array array([[2, 3, 4], [1, 2, 4]]) # a... 阅读全文
posted @ 2019-04-10 11:18 詹岩鹏 阅读(348) 评论(0) 推荐(0) 编辑
摘要: numpy.random.RandomState()指定种子值(指定种子值是为了使同样的条件下每次产生的随机数一样,避免程序调试时由随机数不同而引起的问题) 如不设置种子值时,np.random.randint(100)可能产生0-100内的任意整数,且每次重新运行产生的数字都会在0-100 之间变动 而设置种子值后,np.random.RandomState(0).randint(100)可... 阅读全文
posted @ 2019-04-10 10:48 詹岩鹏 阅读(308) 评论(0) 推荐(0) 编辑
摘要: sys:1: DtypeWarning: Columns (2,4,5) have mixed types. Specify dtype option on import or set low_memory=False 阅读全文
posted @ 2019-03-19 15:54 詹岩鹏 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 在用SMOTE算法模块进行过采样(oversampling)时,pandas导入训练集合特征和label。 from imblearn.over_sampling import SMOTE # 导入SMOTE算法模块 # 处理不平衡数据 sm = SMOTE(random_state=122) # 处理过采样的方法 X, y = sm.fit_sample(X, y) /Users... 阅读全文
posted @ 2019-03-19 13:51 詹岩鹏 阅读(3162) 评论(0) 推荐(0) 编辑
摘要: 出现: /Users/wangchuang/anaconda3/lib/python3.6/site-packages/sklearn/utils/validation.py:547: DataConversionWarning: A column-vector y was passed when 阅读全文
posted @ 2019-03-18 16:58 詹岩鹏 阅读(3014) 评论(0) 推荐(0) 编辑
摘要: random.uniform()函数 def uniform(low=0.0, high=1.0, size=None) 产生的数据为均匀分布,数据值区间为[low,high),size为其产生数据的尺寸。 low:float,可选,默认值0; high:float,可选,默认1;官网上写的是必填,实测可以省略; size:int,或者int元祖,可选。如果为(m, n, k)的形式,返回m*m... 阅读全文
posted @ 2019-03-08 14:15 詹岩鹏 阅读(273) 评论(0) 推荐(0) 编辑
摘要: import numpy as np 方法一 def Distance(vec1,vec2): dist = np.sqrt(np.sum(np.square(vec1 - vec2))) return dist 方法二 def distEclud(vecl1,vecl2): dist = np.sqrt(np.sum(np.power(vecl1 - vecl2,2))... 阅读全文
posted @ 2019-03-08 10:41 詹岩鹏 阅读(408) 评论(0) 推荐(0) 编辑
摘要: 模型调参 第一步是要找准目标:我们要做什么?一般来说,这个目标是提升 某个模型评估指标,比如对于随机森林来说,我们想要提升的是模型在未知数据上的准确率(由score或 oob_score_来衡量)。找准了这个目标,我们就需要思考:模型在未知数据上的准确率受什么因素影响?在机器学 习中,我们用来衡量模型在未知数据上的准确率的指标,叫做泛化误差(Genelization error) 泛化误差 ... 阅读全文
posted @ 2019-03-06 15:29 詹岩鹏 阅读(472) 评论(0) 推荐(0) 编辑