摘要: re.sub(pattern, repl, string, count=0, flags=0) 参数: pattern : 正则中的模式字符串。 repl : 替换后的字符串,也可为一个函数。 string : 要被查找替换的原始字符串。 count : 模式匹配后替换的最大次数,默认 0 表示替换 阅读全文
posted @ 2021-04-22 09:44 柒久酒 阅读(98) 评论(0) 推荐(0) 编辑
摘要: pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True) 参数含义: 阅读全文
posted @ 2021-04-22 09:27 柒久酒 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-11 09:36 柒久酒 阅读(66) 评论(0) 推荐(0) 编辑
摘要: sklearn.preprocessing.Normalizer(norm=’l2’, copy=True) norm:可以为l1、l2或max,默认为l2 若为l1时,样本各个特征值除以各个特征值的绝对值之和 若为l2时,样本各个特征值除以各个特征值的平方之和 若为max时,样本各个特征值除以样本 阅读全文
posted @ 2020-10-23 14:46 柒久酒 阅读(556) 评论(0) 推荐(0) 编辑
摘要: make_blobs——为聚类产生数据集,产生一个数据集和相应的标签 n_samples:表示数据样本点个数,默认值100 n_features:表示数据的维度,默认值是2 centers:产生数据的中心点,默认值3 cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0 cen 阅读全文
posted @ 2020-10-23 14:23 柒久酒 阅读(282) 评论(0) 推荐(0) 编辑
摘要: subplot(nrows,ncols,plot_number)——将figure分成nrows*ncols的子图表示 nrows:子图的行数 ncols:子图的列数 plot_number:索引值,表示把图放在第plot_number个位置上 阅读全文
posted @ 2020-09-25 13:40 柒久酒 阅读(855) 评论(0) 推荐(0) 编辑
摘要: sort 和sorted的区别: sort用于列表 sorted用于所有可迭代的对象进行排序操作 sorted(iterable,key =None,reverse=False) iterable--可迭代对象 key--用于比较的元素,只有一个参数,具体的函数的参数是取自于可迭代对象中,指定可迭代 阅读全文
posted @ 2020-09-14 13:56 柒久酒 阅读(159) 评论(0) 推荐(0) 编辑
摘要: dataframe是一张二维表,行(索引),列(标签) loc通过列名值进行截取,而iloc通过索引截取 import numpy as np import pandas as pd test_array=np.arange(16).reshape(4,4)#四行四列数值到16的数组 test1=p 阅读全文
posted @ 2020-08-28 09:51 柒久酒 阅读(1429) 评论(0) 推荐(0) 编辑
摘要: 熵: “形容一个系统的混乱程度”。系统的不确定性越高,熵就越大。 假设集合中的变量X={X1,X2,...Xn} 其对应在集合中的概率为P={p1,p2,...pn} 则熵表示为: 举例: 举一个的例子:对游戏活跃用户进行分层,分为高活跃、中活跃、低活跃,游戏A按照这个方式划分,用户比例分别为20% 阅读全文
posted @ 2020-08-25 13:59 柒久酒 阅读(206) 评论(0) 推荐(0) 编辑
摘要: list.append(object) 向列表中添加一个对象objectlist.extend(sequence) 把一个序列seq的内容添加到列表中 music_media = ['compact disc', '8-track tape', 'long playing record'] new_ 阅读全文
posted @ 2020-08-24 16:44 柒久酒 阅读(185) 评论(0) 推荐(0) 编辑