詹岩鹏 - 博客园

2020年5月20日

摘要：首先是isnull函数。这个函数主要是用在sql语句中的where条件语句里，用来看某个字段是为空（null），要注意的是空字符串是不属于null的。比如：select * from student where isnull(gender) ifnull函数呢？又是什么意思？ ifnull主要是用阅读全文

posted @ 2020-05-20 10:40 詹岩鹏阅读(4587) 评论(0) 推荐(0)

2019年10月29日

postgreSQL除法保留小数

摘要：类型转换postgres=# select round(1::numeric/4::numeric,2); round 0.25 阅读全文

posted @ 2019-10-29 11:36 詹岩鹏阅读(534) 评论(0) 推荐(0)

2019年4月10日

numpy.sort

摘要： import numpy as np >>> list1 = [[4,3,2],[2,1,4]] >>> array=np.array(list1) >>> array array([[4, 3, 2], [2, 1, 4]]) >>> array.sort(axis=1) >>> array array([[2, 3, 4], [1, 2, 4]]) # a... 阅读全文

posted @ 2019-04-10 11:18 詹岩鹏阅读(364) 评论(0) 推荐(0)

numpy.random

摘要： numpy.random.RandomState()指定种子值（指定种子值是为了使同样的条件下每次产生的随机数一样，避免程序调试时由随机数不同而引起的问题）如不设置种子值时,np.random.randint(100)可能产生0-100内的任意整数，且每次重新运行产生的数字都会在0-100 之间变动而设置种子值后,np.random.RandomState(0).randint(100)可... 阅读全文

posted @ 2019-04-10 10:48 詹岩鹏阅读(330) 评论(0) 推荐(0)

2019年3月19日

报错错误问题解决

摘要： sys:1: DtypeWarning: Columns (2,4,5) have mixed types. Specify dtype option on import or set low_memory=False 阅读全文

posted @ 2019-03-19 15:54 詹岩鹏阅读(235) 评论(0) 推荐(0)

DataConversionWarning: A column-vector y was passed when a 1d array was expected. 问题解决和数据平衡问题

摘要：在用SMOTE算法模块进行过采样（oversampling）时，pandas导入训练集合特征和label。 from imblearn.over_sampling import SMOTE # 导入SMOTE算法模块 # 处理不平衡数据 sm = SMOTE(random_state=122) # 处理过采样的方法 X, y = sm.fit_sample(X, y) /Users... 阅读全文

posted @ 2019-03-19 13:51 詹岩鹏阅读(3248) 评论(0) 推荐(0)

2019年3月18日

Y出现ravel的问题解决

摘要：出现： /Users/wangchuang/anaconda3/lib/python3.6/site-packages/sklearn/utils/validation.py:547: DataConversionWarning: A column-vector y was passed when 阅读全文

posted @ 2019-03-18 16:58 詹岩鹏阅读(3080) 评论(0) 推荐(0)

2019年3月8日

k-mean(随机数质心生成）

摘要： random.uniform()函数 def uniform(low=0.0, high=1.0, size=None) 产生的数据为均匀分布，数据值区间为[low,high)，size为其产生数据的尺寸。 low：float，可选，默认值0； high：float，可选，默认1；官网上写的是必填，实测可以省略； size：int，或者int元祖，可选。如果为（m, n, k）的形式，返回m*m... 阅读全文

posted @ 2019-03-08 14:15 詹岩鹏阅读(290) 评论(0) 推荐(0)

k-mean(欧氏距离计算）

摘要： import numpy as np 方法一 def Distance(vec1,vec2): dist = np.sqrt(np.sum(np.square(vec1 - vec2))) return dist 方法二 def distEclud(vecl1,vecl2): dist = np.sqrt(np.sum(np.power(vecl1 - vecl2,2))... 阅读全文

posted @ 2019-03-08 10:41 詹岩鹏阅读(447) 评论(0) 推荐(0)

2019年3月6日

随机森林--调参

摘要：模型调参第一步是要找准目标：我们要做什么？一般来说，这个目标是提升某个模型评估指标，比如对于随机森林来说，我们想要提升的是模型在未知数据上的准确率（由score或 oob_score_来衡量）。找准了这个目标，我们就需要思考：模型在未知数据上的准确率受什么因素影响？在机器学习中，我们用来衡量模型在未知数据上的准确率的指标，叫做泛化误差（Genelization error）泛化误差 ... 阅读全文

posted @ 2019-03-06 15:29 詹岩鹏阅读(534) 评论(0) 推荐(0)

公告