随笔档案「2021年9月」 - 祥瑞哈哈哈

java求俩个时间间隔的天数

摘要：package zxd0001;import java.util.Scanner;public class A001 { public static class Date{ public int year,month,day,sum,i1,i2,i3,flag; public Date() {} p 阅读全文

posted @ 2021-09-30 21:19 祥瑞哈哈哈阅读(309) 评论(0) 推荐(0)

Syntax error, insert "}" to complete ClassBody

摘要：Java需要在最后边多加上一个花括号}。阅读全文

posted @ 2021-09-30 12:27 祥瑞哈哈哈阅读(267) 评论(0) 推荐(0)

numpy =和copy的区别

摘要：在numpy中申请一个数组后 w=np.array([1,2,3]) w1=w w和w1是共享内存的，所以当w中的内容发生变化会影响w1中的内容如果采用w1=np.copy(w) 则w1和w不是共享内存。阅读全文

posted @ 2021-09-28 13:11 祥瑞哈哈哈阅读(99) 评论(0) 推荐(0)

离散傅里叶变换后得到虚部和实部的值，求复数的模。

摘要：频域是频率和振幅的坐标轴。实部和虚部的平方和开根号为模。 abs(w) w为复数，abs求实部和虚部的模。 w=np.array([[1+1j,2+1j,3+1j,4+1j],[5+1j,6+1j,7+1j,8+1j]]) print(abs(w)) [[1.41421356 2.23606798 阅读全文

posted @ 2021-09-26 21:37 祥瑞哈哈哈阅读(672) 评论(0) 推荐(0)

plt.plot处理复数数据

摘要：w1=np.array([1+1j,2+1j,3+1j])//是复数数组 plt.plot(w1) plt.show() 首先0对应1，1对应2，2对应3。即画图的时候只画实部。阅读全文

posted @ 2021-09-26 21:21 祥瑞哈哈哈阅读(231) 评论(0) 推荐(0)

numpy实现向量差的绝对值之和，以及向量的模

摘要：俩向量余弦值 cos[i]=np.dot(train[i],train[10])/np.linalg.norm(train[i])/np.linalg.norm(train[10])。 np.dot是让俩个向量做点积。 np.linalg.norm是向量的模。 leng[i]=np.abs(trai 阅读全文

posted @ 2021-09-25 11:32 祥瑞哈哈哈阅读(604) 评论(0) 推荐(0)

sklearn查看

摘要：点击source即可查看源码阅读全文

posted @ 2021-09-23 21:13 祥瑞哈哈哈阅读(57) 评论(0) 推荐(0)

python将俩个数组连接并写入excel文件

摘要：w1=[]//列表 w1.append(np.concatenate((test[i],test_lable[i])))//向w1列表中插入test和test_lable连接后的数组。 w1=pd.DataFrame(w1)//转化为DataFrame的形式 w1.to_excel('data5.x 阅读全文

posted @ 2021-09-23 13:17 祥瑞哈哈哈阅读(411) 评论(0) 推荐(0)

anaconda下载失败的解决办法

摘要：换源比如清华源等。 pip install sklearn -i https://pypi.tuna.tsinghua.edu.cn/simple 阅读全文

posted @ 2021-09-20 20:35 祥瑞哈哈哈阅读(834) 评论(0) 推荐(0)

pandas分组后求和。

摘要：train2=pd.read_excel('data1.xlsx',sheet_name='进项1') train2=train2.groupby(['企业代号']).sum()//按企业号分组后求和。阅读全文

posted @ 2021-09-20 19:56 祥瑞哈哈哈阅读(941) 评论(0) 推荐(0)

pandas删除满足条件的行

摘要：图片删除作废发票及其所在行。 train2=pd.read_excel('1.xlsx',sheet_name='4')//读取内容 print(train2)//输出企业代号金额税额价税合计发票状态0 E1 9401.71 1598.29 11000 有效发票1 E1 8170.94 阅读全文

posted @ 2021-09-19 12:30 祥瑞哈哈哈阅读(4622) 评论(0) 推荐(0)

对满足条件的行的值进行修改

摘要：图片想把税额的负数变为正数可用函数 train2=pd.read_excel('1.xlsx',sheet_name='4')//train2是读取数据 train2.loc[(train2.税额<0) , '税额'] = -train2.税额//进修修改值 print(train2)//输出阅读全文

posted @ 2021-09-19 12:18 祥瑞哈哈哈阅读(53) 评论(0) 推荐(0)

python对满足条件的行进行修改，按值分组并在分组后进行计数。

摘要：train2=pd.read_excel('1.xlsx',sheet_name='2')//利用相对路径读取文件，sheet_name为excel中的表名。 train2.loc[(train2.金额<0) , '发票状态'] = '负数发票'//train2.金额<0是判定行中该属性是否满足条件阅读全文

posted @ 2021-09-19 11:34 祥瑞哈哈哈阅读(491) 评论(0) 推荐(0)

python画标签

摘要：plt.plot(w2,train2[0,:],label='A') plt.plot(w2,train2[1,:],label='B') plt.plot(w2,train2[2,:],label='C') plt.legend() plt.show() label表示你想用的标记名称。 plt. 阅读全文

posted @ 2021-09-17 07:53 祥瑞哈哈哈阅读(108) 评论(0) 推荐(0)

pandas删除不满足条件的数据

摘要：train=pd.read_excel('./13.xlsx',sheet_name='gonghuo') train=train.drop(train[train['sum']<500].index) train.to_excel('data.xlsx',encoding='utf-8') pri 阅读全文

posted @ 2021-09-10 20:01 祥瑞哈哈哈阅读(242) 评论(0) 推荐(0)

pd.get_dummies

摘要：是将类别转化成编码。即 col a b c 会变为 col1 col2 col3 1 0 0 0 1 0 0 0 1 数据: 代码: train=pd.read_csv('./1.csv') train = pd.get_dummies(train, columns=['y'], drop_fir 阅读全文

posted @ 2021-09-09 12:26 祥瑞哈哈哈阅读(450) 评论(0) 推荐(0)

pandas 用map将不同类别替换为整数

摘要：数据集: 代码: train=pd.read_csv('./1.csv') train['y']=train['y'].map({'A':1,'B':2,'C':3,'D':4,'E':5})//将ABCDE字符进行替换。 print(train) 输出: map相当于替换将指定字符映射为指定数字，阅读全文

posted @ 2021-09-09 08:20 祥瑞哈哈哈阅读(185) 评论(0) 推荐(0)

pandas sample用法

摘要：该函数是从该列中随机抽取数据不排列。数据集代码: train=pd.read_csv('./1.csv') print(train['q'].sample(1)) 输出: 2 3Name: q, dtype: int64 2是索引号 3是值。多抽取几个样本后 train=pd.read_csv 阅读全文

posted @ 2021-09-09 08:04 祥瑞哈哈哈阅读(297) 评论(0) 推荐(0)

pandas replace有时替换失败

摘要：失败的原因基本是数据格式不对 inplace的参数：数据集: 代码: train=pd.read_csv('./1.csv')//读取数据集 train['y'].replace(to_replace='12 years',value='1yj',inplace=True)//对y列的12 yea 阅读全文

posted @ 2021-09-09 07:55 祥瑞哈哈哈阅读(546) 评论(0) 推荐(0)

Python 用空格分割字符串，并将首位变为整形数。

摘要：代码: k='22 years' print(k.split()) 输出为: 将字符串通过空格分成多个字符串。 print(k.split()[0])//选取列表字符串的第一个值 print(type(k.split()[0]))//输出该字符串类型 print(np.int8(k.split()[ 阅读全文

posted @ 2021-09-08 21:48 祥瑞哈哈哈阅读(512) 评论(0) 推荐(0)

value_count().sort_index()

摘要：数据集: train=pd.read_csv('./1.csv')//读取内容 print(train['q'].value_counts(dropna=False))//dropna参数代表是否要舍弃Nan，False表示不舍弃输出值: 输出时将该列相同值出现的次数进行统计，按出现的次数由高到低阅读全文

posted @ 2021-09-08 21:35 祥瑞哈哈哈阅读(649) 评论(0) 推荐(0)

循环读取俩个数据集

摘要：数据集: 代码：查看其输出: 第一次输出: 第二次输出: 阅读全文

posted @ 2021-09-08 21:23 祥瑞哈哈哈阅读(55) 评论(0) 推荐(0)

处理数据中的缺失值

摘要：数据集: train=pd.read_csv('./1.csv')//用代码读取数据 print(train)//并对其输出输出结果: id sd q0 NaN 7.0 1.01 NaN NaN NaN2 NaN 4.0 7.03 4.0 NaN 6.04 NaN 6.0 11.05 2.0 Na 阅读全文

posted @ 2021-09-08 20:43 祥瑞哈哈哈阅读(496) 评论(0) 推荐(0)

pandas查看每列的数据类型

摘要：数据集: 代码: train=pd.read_csv('./1.csv') print(train.info()) 输出: id一列均为整数所以它的类型为int64 w一列均为字符所以它的类型为object e一列含有整数和字符类型为object f一列含有整数和浮点数类型为float k一列含有浮阅读全文

posted @ 2021-09-08 17:50 祥瑞哈哈哈阅读(5498) 评论(0) 推荐(0)

pd.pivot_table

摘要：pd.pivot_table 绘制二维表格。数据: 代码: train=pd.read_csv('./1.csv') pivot=pd.pivot_table(train, index=['id'], columns=['sd'], values=['q'], aggfunc=np.sum)//I 阅读全文

posted @ 2021-09-08 13:55 祥瑞哈哈哈阅读(351) 评论(0) 推荐(0)

pandas datatime-datatime会得到什么结果

摘要：数据集:在电脑中/和-区别不大 train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d') startdate =pd.to_datetime('2007-06-01',format='% 阅读全文

posted @ 2021-09-08 13:34 祥瑞哈哈哈阅读(52) 评论(0) 推荐(0)

pd.to_datetime用法

摘要：数据：代码： train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d')//format是输入数据的格式 print(train) 阅读全文

posted @ 2021-09-08 13:29 祥瑞哈哈哈阅读(2602) 评论(0) 推荐(0)

sns.countplot用法

摘要：该函数的作用是画表达一个值数目的直方图。数据展示: train=pd.read_csv('./1.csv')//读取csv文件 plt.figure(figsize=(16,8))//创建大画布 plt.subplot(131)//将大画布分为1一行3列取第一个画布 sns.countplot(x 阅读全文

posted @ 2021-09-08 12:47 祥瑞哈哈哈阅读(1545) 评论(0) 推荐(0)

用group时count和sum

摘要：count和sum的区别 count是计数。 sum是求数值总和。数据集: print(train.groupby(['q'])['sd'].count())//根据q的值进行分组，相同q值放一起，不同q值放不同的地方输出：如图可知统计了q中不同值sd非空的数量。如果改一下数据即count统阅读全文

posted @ 2021-09-08 12:25 祥瑞哈哈哈阅读(415) 评论(0) 推荐(0)

plot参数

摘要：fig, ((ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 6)) data_train.loc[data_train['isDefault'] == 1] \ ['loanAmnt'].apply(np.log) \ .plot(kind='hist', 阅读全文

posted @ 2021-09-08 11:11 祥瑞哈哈哈阅读(389) 评论(0) 推荐(0)

pandas选出满足列条件的行再观察他们的指定列

摘要：数据: 代码: train=pd.read_csv('./1.csv')//读取csv文件 print(train.loc[train['sd']==1])//选出train中满足列'sd'所对应值为1的行数。输出: 在excel中的表格行数仍在系统中保留。 print(train.loc[tra 阅读全文

posted @ 2021-09-08 08:20 祥瑞哈哈哈阅读(179) 评论(0) 推荐(0)

plt.subplots

摘要：该函数返回的是子画布的对象。代码: fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 8))//fig是整体画布，ax1到ax4是子画布对象。 train_loan_fr.groupby('grade')['grade' 阅读全文

posted @ 2021-09-08 08:08 祥瑞哈哈哈阅读(838) 评论(0) 推荐(0)

Series类型变量可以调用plot直接画图。

摘要：Series类型变量可以调用plot直接画图。 ‘barh’ : horizontal bar plot//水平直方图。阅读全文

posted @ 2021-09-08 08:05 祥瑞哈哈哈阅读(118) 评论(0) 推荐(0)

dataframe.groupby('string')['string'].count()

摘要：dataframe.groupby('string')['string'].count()该函数是按'string'的值进行分类，最后计算同类的数目。阅读全文

posted @ 2021-09-08 07:59 祥瑞哈哈哈阅读(125) 评论(0) 推荐(0)

plt.subplot()

摘要：plt.subplot(2,2），figsize=(15,8))15，8是原画布的宽和高。 2,2是将原画布按比利划分为俩行俩列的画布。 figsize是原画布。阅读全文

posted @ 2021-09-07 21:29 祥瑞哈哈哈阅读(332) 评论(0) 推荐(0)

pandas根据列的指定内容选择出行

摘要：数据集: train=pd.read_csv('./1.csv')//利用相对路径读取文件内容。 print(train['id']==1)//满足条件的行为True，不满足条件的行为False。输出为: 0 False1 False2 True3 True print(train.loc[tra 阅读全文

posted @ 2021-09-07 21:15 祥瑞哈哈哈阅读(162) 评论(0) 推荐(0)

画直方图

摘要：plt.figure(figsize=(16,16))//开创画布。 sns.barplot(variable,variable1) variable为列名 variable1为列名加量为竖直图如果variable1为列名。 variable为列名加量值即: 阅读全文

posted @ 2021-09-07 20:53 祥瑞哈哈哈阅读(46) 评论(0) 推荐(0)

plt.subplot()在不同的图像上画图

摘要：用 plt.subplot(121)将原始画布进行划分空间，划分后调用 sub_plot_1 = sns.distplot(train['sd'])即可在此画布进行画图。展示结果: 在该语句之后在加入一条语句: sub_plot_1 = sns.distplot(train['sd']) 展示结果阅读全文

posted @ 2021-09-07 19:54 祥瑞哈哈哈阅读(695) 评论(0) 推荐(0)

plt.figure

摘要：plt.figure(figsize=(16,12)) 创建一个新画布,figsize为画布的大小。显示情况: plt.suptitle(fontsize=15) 向图片中加入副标题。fontsize表示字体大小。加入语句后页面情况: plt.subplot(221)将界面分为俩行俩列。当前位置阅读全文

posted @ 2021-09-07 17:35 祥瑞哈哈哈阅读(350) 评论(0) 推荐(0)

seaborn.FaceGrid.map(sns.distplot,"string")

摘要：seaborn.FaceGrid.map(sns.displot,"string")。后边的字符串为坐标的名称。 sns.displot是在map空白图上，绘制直方图与核函数，核函数是概率密度函数。“string”是直方图x轴的字符。阅读全文

posted @ 2021-09-07 16:57 祥瑞哈哈哈阅读(169) 评论(0) 推荐(0)

sns.FacetGrid

摘要：sns.FacetGrid作用是画坐标轴。原csv文件的数据 train=pd.read_csv('./1.csv')//读取csv文件中的内容 f=pd.melt(train)//将train中的列名变为Variable，原先的列名变为Variable的值。 f的内容: variable val 阅读全文

posted @ 2021-09-07 13:20 祥瑞哈哈哈阅读(436) 评论(0) 推荐(0)

pd.melt解释

摘要：数据集: 代码: train=pd.read_csv('./1.csv') print(pd.melt(train)) 输出: variable value0 id 0.01 id NaN2 id 1.03 id 1.04 sd 1.05 sd 1.06 sd 1.07 sd 1.0 print(p 阅读全文

posted @ 2021-09-07 13:06 祥瑞哈哈哈阅读(279) 评论(0) 推荐(0)

pandas读取csv文件时何时出现Nan值

摘要：所要读取表格内的数据: 代码: train=pd.read_csv('./1.csv') print(train) 结果: id sd0 0.0 11 NaN 12 1.0 13 1.0 1 由输出可知当代码为空白时输出为Nan。当读取文件只有一列内容时，空白格会被自动删除不算作一行。阅读全文

posted @ 2021-09-07 08:05 祥瑞哈哈哈阅读(1134) 评论(0) 推荐(0)

离散型变量和连续型变量的区别

摘要：离散型变量的值可以列举出来。连续型变量的值不能列举。阅读全文

posted @ 2021-09-06 20:08 祥瑞哈哈哈阅读(1711) 评论(0) 推荐(0)

pandas查看表格中所有的数据类型

摘要：data.info()显示该表格中的所有数据类型。输出情况: 输出每个列所对应的数据类型。最后输出表格中所有的数据类型。阅读全文

posted @ 2021-09-06 19:44 祥瑞哈哈哈阅读(541) 评论(0) 推荐(0)

python filter用法

摘要：filter是将一个序列进行过滤，返回迭代器的对象，去除不满足条件的序列。链接:https://www.runoob.com/python3/python3-func-filter.html filter(function,data) function作为条件选择函数。阅读全文

posted @ 2021-09-06 19:36 祥瑞哈哈哈阅读(1483) 评论(0) 推荐(0)

pandas选取指定数据类型的列

摘要：data.select_dtypes(include=['object']) 选择列表中列满足此数据类型的列，并将列名和列下的所有数值进行输出。将include改为exclude变为将除该类型以外的列进行输出。 data.select_dtypes(include=['object']).colm 阅读全文

posted @ 2021-09-06 19:23 祥瑞哈哈哈阅读(1053) 评论(0) 推荐(0)

python 用if选择满足指定条件的列

摘要：[col for col in data.columns if data_train[col].nunique() <= 1] 判断data.columns的列中，if该列满足条件，则将col加入列表中。阅读全文

posted @ 2021-09-06 18:12 祥瑞哈哈哈阅读(497) 评论(0) 推荐(0)

plot和plot.bar的区别

摘要：plot是根据索引画折线图。 plot.bar是根据索引画直方图。阅读全文

posted @ 2021-09-06 18:02 祥瑞哈哈哈阅读(348) 评论(0) 推荐(0)

pandas中的series和字典的区别

摘要：series类似python中的字典。字典:{'id': 0, 'loanAmnt': 0, 'term': 0, 'interestRate': 0, 'installment': 0, 'grade': 0} series: id 0loanAmnt 0term 0interestRate 0 阅读全文

posted @ 2021-09-06 16:25 祥瑞哈哈哈阅读(484) 评论(0) 推荐(0)

pandas在dataframe的头部插入尾部的数据

摘要：利用俩个函数。 data.head(n)输出头部前n行的数据。 data.tail(n)输出末尾的n行数据。 data.head(n).append(data.tail(n)) 在头部前n行中插入尾部后n行的数据。阅读全文

posted @ 2021-09-05 21:03 祥瑞哈哈哈阅读(305) 评论(0) 推荐(0)

pandas统计含有缺失值的列数

摘要：data.isnull().any().sum() data.isnull() 是判断dataframe中的数据是否为Nan，是Nan则为true否则为False。 any是将列合并，此时一个数值表示一个列的情况，如果一整列都没有Nan则为False，否则为True。 sum是将列作和得出含有Nan 阅读全文

posted @ 2021-09-05 20:58 祥瑞哈哈哈阅读(494) 评论(0) 推荐(0)

python printf(f'')

摘要：f''。在这俩个单引号里，可以用{}包住表达式这样就可以输出表达式的值。阅读全文

posted @ 2021-09-05 20:44 祥瑞哈哈哈阅读(972) 评论(0) 推荐(0)

pandas实现分段读取csv文件

摘要：在调用pd.read_csv时，对chunksize进行赋值，返回的是多个pandas.core.frame.DataFrame组成的类。 chunker = pd.read_csv("./train.csv",chunksize=5) for item in chunker: print(item 阅读全文

posted @ 2021-09-05 19:47 祥瑞哈哈哈阅读(493) 评论(0) 推荐(0)

目标和意图的区别

摘要：目标是需求。意图是实现手段。阅读全文

posted @ 2021-09-02 15:58 祥瑞哈哈哈阅读(425) 评论(0) 推荐(0)

速率、带宽、吞吐量

摘要：速率:网络额定的传输速度bit/s。带宽:网络的实际的传输速度bit/s。吞吐量:一段时间的传输量。吞吐量和带宽的关系好比路程和速度。阅读全文

posted @ 2021-09-02 15:32 祥瑞哈哈哈阅读(702) 评论(0) 推荐(0)

事件的定义

摘要：事件是样本空间的子集。阅读全文

posted @ 2021-09-02 08:57 祥瑞哈哈哈阅读(108) 评论(0) 推荐(0)

协方差定义

摘要：判断俩个变量是否呈正相关和负相关。 cov（x，y）=E（（x-x平均）*（y-y平均））正相关即x和y同时高于平均值占总数情况较大。负相关即x和y同时在其平均值俩端占总数情况较大。如果协方差为0表示俩哥随机变量无关。类似于同步程度。阅读全文

posted @ 2021-09-01 19:54 祥瑞哈哈哈阅读(401) 评论(0) 推荐(0)

祥瑞哈哈哈

09 2021 档案

公告