摘要: 如安装xgboot: 搜xgboot pypi官网,找到对应的版本,如本机py3.7 win64下载到随意目录,复制路径 打开pycharm中的terminal终端输入pip install 粘粘下载路径(注意:手打D,复制有编码错误) 阅读全文
posted @ 2020-08-17 16:58 柒久酒 阅读(686) 评论(0) 推荐(0) 编辑
摘要: get_dummies()——根据原数据进行转换,添加原数据中缺省的变量 阅读全文
posted @ 2020-08-10 13:44 柒久酒 阅读(2306) 评论(0) 推荐(0) 编辑
摘要: isna()和 isnull()区别: isnan判断是否nan(not a number),一般是数值字段的null isnull()主要是判断字符型是否有值, 可以判断所有的空值,但是python的数值字段比如int float 为空的时候默认是Nan 阅读全文
posted @ 2020-08-10 13:38 柒久酒 阅读(6579) 评论(0) 推荐(0) 编辑
摘要: drop()——删除dataframe中的指定行列 drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise'): labels:一个字符或者数值,加上axis ,表示带l 阅读全文
posted @ 2020-08-10 08:51 柒久酒 阅读(4257) 评论(0) 推荐(1) 编辑
摘要: pop()——删除列表中元素,默认为最后一位 数据平滑处理 -- log1p( ) 和 exmp1( ) 1. 数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化,使其更加服从高斯分布,此步处理可能会使我们后续的分类结果得到一个好的结果。 2. 平滑问题很容易处理掉,导致模型的结果达不到 阅读全文
posted @ 2020-08-07 14:45 柒久酒 阅读(193) 评论(0) 推荐(0) 编辑
摘要: set_index() DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) keys单个或多个(Multiindex)列名 drop default True,将作为行索引 阅读全文
posted @ 2020-08-05 14:59 柒久酒 阅读(276) 评论(0) 推荐(0) 编辑
摘要: merge 使用merge合并时,两个数据集的合并条件是类型须一致。默认是内连接,也可以按照需求选择outer,left,right等外连接方式 concat 合并两个数据集,可在行或者列上合并(用axis调节,默认axis=0),示例如下: join 索引上的合并,是增加列而不是增加行,当合并的数 阅读全文
posted @ 2020-08-05 14:50 柒久酒 阅读(238) 评论(0) 推荐(0) 编辑
摘要: python merge()——类似于sql中的join()函数 merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False 阅读全文
posted @ 2020-08-05 14:43 柒久酒 阅读(2205) 评论(0) 推荐(0) 编辑
摘要: set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。 lambda()作为一个表达式,定义了一个匿名函数。 lambda 并不会带来程序运行效率的提高,只会使代码更简洁。 如果可以使用for...in...if来完成的,坚决不用lambda。 如果使 阅读全文
posted @ 2020-08-05 14:26 柒久酒 阅读(320) 评论(0) 推荐(0) 编辑
摘要: import numpy as np x = np.array([[1,2,5],[2,3,5],[3,4,5],[2,3,6]]) #输出数组的行和列数 print x.shape #结果: (4, 3) #只输出行数 print x.shape[0] #结果: 4 #只输出列数 print x. 阅读全文
posted @ 2020-08-05 13:57 柒久酒 阅读(240) 评论(0) 推荐(0) 编辑