柒久酒 - 博客园

2020年8月17日

摘要：如安装xgboot：搜xgboot pypi官网，找到对应的版本，如本机py3.7 win64下载到随意目录，复制路径打开pycharm中的terminal终端输入pip install 粘粘下载路径（注意：手打D，复制有编码错误）阅读全文

posted @ 2020-08-17 16:58 柒久酒阅读(696) 评论(0) 推荐(0) 编辑

2020年8月10日

python get_dummies（）

摘要： get_dummies（）——根据原数据进行转换，添加原数据中缺省的变量阅读全文

posted @ 2020-08-10 13:44 柒久酒阅读(2331) 评论(0) 推荐(0) 编辑

python isna()和 isnull()

摘要： isna()和 isnull()区别： isnan判断是否nan（not a number），一般是数值字段的null isnull()主要是判断字符型是否有值，可以判断所有的空值，但是python的数值字段比如int float 为空的时候默认是Nan 阅读全文

posted @ 2020-08-10 13:38 柒久酒阅读(6620) 评论(0) 推荐(0) 编辑

python drop()

摘要： drop()——删除dataframe中的指定行列 drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise'): labels：一个字符或者数值，加上axis ，表示带l 阅读全文

posted @ 2020-08-10 08:51 柒久酒阅读(4293) 评论(0) 推荐(1) 编辑

2020年8月7日

pop（）；log1p（）

摘要： pop（）——删除列表中元素，默认为最后一位数据平滑处理 -- log1p( ) 和 exmp1( ) 1. 数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化，使其更加服从高斯分布，此步处理可能会使我们后续的分类结果得到一个好的结果。 2. 平滑问题很容易处理掉，导致模型的结果达不到阅读全文

posted @ 2020-08-07 14:45 柒久酒阅读(199) 评论(0) 推荐(0) 编辑

2020年8月5日

set_index和reset_index

摘要： set_index() DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) keys单个或多个（Multiindex）列名 drop default True，将作为行索引阅读全文

posted @ 2020-08-05 14:59 柒久酒阅读(279) 评论(0) 推荐(0) 编辑

python merge；join；concat区别

摘要： merge 使用merge合并时，两个数据集的合并条件是类型须一致。默认是内连接，也可以按照需求选择outer，left，right等外连接方式 concat 合并两个数据集，可在行或者列上合并（用axis调节，默认axis=0)，示例如下： join 索引上的合并,是增加列而不是增加行，当合并的数阅读全文

posted @ 2020-08-05 14:50 柒久酒阅读(244) 评论(0) 推荐(0) 编辑

python merge()

摘要： python merge()——类似于sql中的join()函数 merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False 阅读全文

posted @ 2020-08-05 14:43 柒久酒阅读(2235) 评论(0) 推荐(0) 编辑

python set();lambda();zip();groupby(

摘要： set() 函数创建一个无序不重复元素集，可进行关系测试，删除重复数据，还可以计算交集、差集、并集等。 lambda()作为一个表达式，定义了一个匿名函数。 lambda 并不会带来程序运行效率的提高，只会使代码更简洁。如果可以使用for...in...if来完成的，坚决不用lambda。如果使阅读全文

posted @ 2020-08-05 14:26 柒久酒阅读(323) 评论(0) 推荐(0) 编辑

python shape

摘要： import numpy as np x = np.array([[1,2,5],[2,3,5],[3,4,5],[2,3,6]]) #输出数组的行和列数 print x.shape #结果： (4, 3) #只输出行数 print x.shape[0] #结果： 4 #只输出列数 print x. 阅读全文

posted @ 2020-08-05 13:57 柒久酒阅读(242) 评论(0) 推荐(0) 编辑

公告