09 2021 档案

摘要:package zxd0001;import java.util.Scanner;public class A001 { public static class Date{ public int year,month,day,sum,i1,i2,i3,flag; public Date() {} p 阅读全文
posted @ 2021-09-30 21:19 祥瑞哈哈哈 阅读(289) 评论(0) 推荐(0) 编辑
摘要:Java需要在最后边多加上一个花括号}。 阅读全文
posted @ 2021-09-30 12:27 祥瑞哈哈哈 阅读(255) 评论(0) 推荐(0) 编辑
摘要:在numpy中申请一个数组后 w=np.array([1,2,3]) w1=w w和w1是共享内存的,所以当w中的内容发生变化会影响w1中的内容 如果采用w1=np.copy(w) 则w1和w不是共享内存。 阅读全文
posted @ 2021-09-28 13:11 祥瑞哈哈哈 阅读(88) 评论(0) 推荐(0) 编辑
摘要:频域是频率和振幅的坐标轴。 实部和虚部的平方和开根号为模。 abs(w) w为复数,abs求实部和虚部的模。 w=np.array([[1+1j,2+1j,3+1j,4+1j],[5+1j,6+1j,7+1j,8+1j]]) print(abs(w)) [[1.41421356 2.23606798 阅读全文
posted @ 2021-09-26 21:37 祥瑞哈哈哈 阅读(637) 评论(0) 推荐(0) 编辑
摘要:w1=np.array([1+1j,2+1j,3+1j])//是复数数组 plt.plot(w1) plt.show() 首先0对应1,1对应2,2对应3。 即画图的时候只画实部。 阅读全文
posted @ 2021-09-26 21:21 祥瑞哈哈哈 阅读(209) 评论(0) 推荐(0) 编辑
摘要:俩向量余弦值 cos[i]=np.dot(train[i],train[10])/np.linalg.norm(train[i])/np.linalg.norm(train[10])。 np.dot是让俩个向量做点积。 np.linalg.norm是向量的模。 leng[i]=np.abs(trai 阅读全文
posted @ 2021-09-25 11:32 祥瑞哈哈哈 阅读(568) 评论(0) 推荐(0) 编辑
摘要:点击source即可查看源码 阅读全文
posted @ 2021-09-23 21:13 祥瑞哈哈哈 阅读(50) 评论(0) 推荐(0) 编辑
摘要:w1=[]//列表 w1.append(np.concatenate((test[i],test_lable[i])))//向w1列表中插入test和test_lable连接后的数组。 w1=pd.DataFrame(w1)//转化为DataFrame的形式 w1.to_excel('data5.x 阅读全文
posted @ 2021-09-23 13:17 祥瑞哈哈哈 阅读(380) 评论(0) 推荐(0) 编辑
摘要:换源比如清华源等。 pip install sklearn -i https://pypi.tuna.tsinghua.edu.cn/simple 阅读全文
posted @ 2021-09-20 20:35 祥瑞哈哈哈 阅读(812) 评论(0) 推荐(0) 编辑
摘要:train2=pd.read_excel('data1.xlsx',sheet_name='进项1') train2=train2.groupby(['企业代号']).sum()//按企业号分组后求和。 阅读全文
posted @ 2021-09-20 19:56 祥瑞哈哈哈 阅读(930) 评论(0) 推荐(0) 编辑
摘要:图片 删除作废发票及其所在行。 train2=pd.read_excel('1.xlsx',sheet_name='4')//读取内容 print(train2)//输出 企业代号 金额 税额 价税合计 发票状态0 E1 9401.71 1598.29 11000 有效发票1 E1 8170.94 阅读全文
posted @ 2021-09-19 12:30 祥瑞哈哈哈 阅读(4529) 评论(0) 推荐(0) 编辑
摘要:图片 想把税额的负数变为正数可用函数 train2=pd.read_excel('1.xlsx',sheet_name='4')//train2是读取数据 train2.loc[(train2.税额<0) , '税额'] = -train2.税额//进修修改值 print(train2)//输出 阅读全文
posted @ 2021-09-19 12:18 祥瑞哈哈哈 阅读(39) 评论(0) 推荐(0) 编辑
摘要:train2=pd.read_excel('1.xlsx',sheet_name='2')//利用相对路径读取文件,sheet_name为excel中的表名。 train2.loc[(train2.金额<0) , '发票状态'] = '负数发票'//train2.金额<0是判定行中该属性是否满足条件 阅读全文
posted @ 2021-09-19 11:34 祥瑞哈哈哈 阅读(479) 评论(0) 推荐(0) 编辑
摘要:plt.plot(w2,train2[0,:],label='A') plt.plot(w2,train2[1,:],label='B') plt.plot(w2,train2[2,:],label='C') plt.legend() plt.show() label表示你想用的标记名称。 plt. 阅读全文
posted @ 2021-09-17 07:53 祥瑞哈哈哈 阅读(89) 评论(0) 推荐(0) 编辑
摘要:train=pd.read_excel('./13.xlsx',sheet_name='gonghuo') train=train.drop(train[train['sum']<500].index) train.to_excel('data.xlsx',encoding='utf-8') pri 阅读全文
posted @ 2021-09-10 20:01 祥瑞哈哈哈 阅读(232) 评论(0) 推荐(0) 编辑
摘要:是将类别转化成编码。 即 col a b c 会变为 col1 col2 col3 1 0 0 0 1 0 0 0 1 数据: 代码: train=pd.read_csv('./1.csv') train = pd.get_dummies(train, columns=['y'], drop_fir 阅读全文
posted @ 2021-09-09 12:26 祥瑞哈哈哈 阅读(431) 评论(0) 推荐(0) 编辑
摘要:数据集: 代码: train=pd.read_csv('./1.csv') train['y']=train['y'].map({'A':1,'B':2,'C':3,'D':4,'E':5})//将ABCDE字符进行替换。 print(train) 输出: map相当于替换将指定字符映射为指定数字, 阅读全文
posted @ 2021-09-09 08:20 祥瑞哈哈哈 阅读(170) 评论(0) 推荐(0) 编辑
摘要:该函数是从该列中随机抽取数据不排列。 数据集 代码: train=pd.read_csv('./1.csv') print(train['q'].sample(1)) 输出: 2 3Name: q, dtype: int64 2是索引号 3是值。 多抽取几个样本后 train=pd.read_csv 阅读全文
posted @ 2021-09-09 08:04 祥瑞哈哈哈 阅读(274) 评论(0) 推荐(0) 编辑
摘要:失败的原因基本是数据格式不对 inplace的参数: 数据集: 代码: train=pd.read_csv('./1.csv')//读取数据集 train['y'].replace(to_replace='12 years',value='1yj',inplace=True)//对y列的12 yea 阅读全文
posted @ 2021-09-09 07:55 祥瑞哈哈哈 阅读(508) 评论(0) 推荐(0) 编辑
摘要:代码: k='22 years' print(k.split()) 输出为: 将字符串通过空格分成多个字符串。 print(k.split()[0])//选取列表字符串的第一个值 print(type(k.split()[0]))//输出该字符串类型 print(np.int8(k.split()[ 阅读全文
posted @ 2021-09-08 21:48 祥瑞哈哈哈 阅读(495) 评论(0) 推荐(0) 编辑
摘要:数据集: train=pd.read_csv('./1.csv')//读取内容 print(train['q'].value_counts(dropna=False))//dropna参数代表是否要舍弃Nan,False表示不舍弃 输出值: 输出时将该列相同值出现的次数进行统计,按出现的次数由高到低 阅读全文
posted @ 2021-09-08 21:35 祥瑞哈哈哈 阅读(614) 评论(0) 推荐(0) 编辑
摘要:数据集: 代码: 查看其输出: 第一次输出: 第二次输出: 阅读全文
posted @ 2021-09-08 21:23 祥瑞哈哈哈 阅读(44) 评论(0) 推荐(0) 编辑
摘要:数据集: train=pd.read_csv('./1.csv')//用代码读取数据 print(train)//并对其输出 输出结果: id sd q0 NaN 7.0 1.01 NaN NaN NaN2 NaN 4.0 7.03 4.0 NaN 6.04 NaN 6.0 11.05 2.0 Na 阅读全文
posted @ 2021-09-08 20:43 祥瑞哈哈哈 阅读(423) 评论(0) 推荐(0) 编辑
摘要:数据集: 代码: train=pd.read_csv('./1.csv') print(train.info()) 输出: id一列均为整数所以它的类型为int64 w一列均为字符所以它的类型为object e一列含有整数和字符类型为object f一列含有整数和浮点数类型为float k一列含有浮 阅读全文
posted @ 2021-09-08 17:50 祥瑞哈哈哈 阅读(5384) 评论(0) 推荐(0) 编辑
摘要:pd.pivot_table 绘制二维表格。 数据: 代码: train=pd.read_csv('./1.csv') pivot=pd.pivot_table(train, index=['id'], columns=['sd'], values=['q'], aggfunc=np.sum)//I 阅读全文
posted @ 2021-09-08 13:55 祥瑞哈哈哈 阅读(296) 评论(0) 推荐(0) 编辑
摘要:数据集:在电脑中/和-区别不大 train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d') startdate =pd.to_datetime('2007-06-01',format='% 阅读全文
posted @ 2021-09-08 13:34 祥瑞哈哈哈 阅读(39) 评论(0) 推荐(0) 编辑
摘要:数据: 代码: train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d')//format是输入数据的格式 print(train) 阅读全文
posted @ 2021-09-08 13:29 祥瑞哈哈哈 阅读(2548) 评论(0) 推荐(0) 编辑
摘要:该函数的作用是画表达一个值数目的直方图。 数据展示: train=pd.read_csv('./1.csv')//读取csv文件 plt.figure(figsize=(16,8))//创建大画布 plt.subplot(131)//将大画布分为1一行3列取第一个画布 sns.countplot(x 阅读全文
posted @ 2021-09-08 12:47 祥瑞哈哈哈 阅读(1479) 评论(0) 推荐(0) 编辑
摘要:count和sum的区别 count是计数。 sum是求数值总和。 数据集: print(train.groupby(['q'])['sd'].count())//根据q的值进行分组,相同q值放一起,不同q值放不同的地方 输出:如图可知统计了q中不同值sd非空的数量。 如果改一下数据 即count统 阅读全文
posted @ 2021-09-08 12:25 祥瑞哈哈哈 阅读(365) 评论(0) 推荐(0) 编辑
摘要:fig, ((ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 6)) data_train.loc[data_train['isDefault'] == 1] \ ['loanAmnt'].apply(np.log) \ .plot(kind='hist', 阅读全文
posted @ 2021-09-08 11:11 祥瑞哈哈哈 阅读(337) 评论(0) 推荐(0) 编辑
摘要:数据: 代码: train=pd.read_csv('./1.csv')//读取csv文件 print(train.loc[train['sd']==1])//选出train中满足列'sd'所对应值为1的行数。 输出: 在excel中的表格行数仍在系统中保留。 print(train.loc[tra 阅读全文
posted @ 2021-09-08 08:20 祥瑞哈哈哈 阅读(166) 评论(0) 推荐(0) 编辑
摘要:该函数返回的是子画布的对象。 代码: fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 8))//fig是整体画布,ax1到ax4是子画布对象。 train_loan_fr.groupby('grade')['grade' 阅读全文
posted @ 2021-09-08 08:08 祥瑞哈哈哈 阅读(822) 评论(0) 推荐(0) 编辑
摘要:Series类型变量可以调用plot直接画图。 ‘barh’ : horizontal bar plot//水平直方图。 阅读全文
posted @ 2021-09-08 08:05 祥瑞哈哈哈 阅读(109) 评论(0) 推荐(0) 编辑
摘要:dataframe.groupby('string')['string'].count()该函数是按'string'的值进行分类,最后计算同类的数目。 阅读全文
posted @ 2021-09-08 07:59 祥瑞哈哈哈 阅读(104) 评论(0) 推荐(0) 编辑
摘要:plt.subplot(2,2),figsize=(15,8))15,8是原画布的宽和高。 2,2是将原画布按比利划分为俩行俩列的画布。 figsize是原画布。 阅读全文
posted @ 2021-09-07 21:29 祥瑞哈哈哈 阅读(322) 评论(0) 推荐(0) 编辑
摘要:数据集: train=pd.read_csv('./1.csv')//利用相对路径读取文件内容。 print(train['id']==1)//满足条件的行为True,不满足条件的行为False。 输出为: 0 False1 False2 True3 True print(train.loc[tra 阅读全文
posted @ 2021-09-07 21:15 祥瑞哈哈哈 阅读(151) 评论(0) 推荐(0) 编辑
摘要:plt.figure(figsize=(16,16))//开创画布。 sns.barplot(variable,variable1) variable为列名 variable1为列名加量 为竖直图 如果variable1为列名。 variable为列名加量值即: 阅读全文
posted @ 2021-09-07 20:53 祥瑞哈哈哈 阅读(31) 评论(0) 推荐(0) 编辑
摘要:用 plt.subplot(121)将原始画布进行划分空间,划分后调用 sub_plot_1 = sns.distplot(train['sd'])即可在此画布进行画图。 展示结果: 在该语句之后在加入一条语句: sub_plot_1 = sns.distplot(train['sd']) 展示结果 阅读全文
posted @ 2021-09-07 19:54 祥瑞哈哈哈 阅读(667) 评论(0) 推荐(0) 编辑
摘要:plt.figure(figsize=(16,12)) 创建一个新画布,figsize为画布的大小。 显示情况: plt.suptitle(fontsize=15) 向图片中加入副标题。fontsize表示字体大小。 加入语句后页面情况: plt.subplot(221)将界面分为俩行俩列。当前位置 阅读全文
posted @ 2021-09-07 17:35 祥瑞哈哈哈 阅读(329) 评论(0) 推荐(0) 编辑
摘要:seaborn.FaceGrid.map(sns.displot,"string")。后边的字符串为坐标的名称。 sns.displot是在map空白图上,绘制直方图与核函数,核函数是概率密度函数。“string”是直方图x轴的字符。 阅读全文
posted @ 2021-09-07 16:57 祥瑞哈哈哈 阅读(143) 评论(0) 推荐(0) 编辑
摘要:sns.FacetGrid作用是画坐标轴。 原csv文件的数据 train=pd.read_csv('./1.csv')//读取csv文件中的内容 f=pd.melt(train)//将train中的列名变为Variable,原先的列名变为Variable的值。 f的内容: variable val 阅读全文
posted @ 2021-09-07 13:20 祥瑞哈哈哈 阅读(426) 评论(0) 推荐(0) 编辑
摘要:数据集: 代码: train=pd.read_csv('./1.csv') print(pd.melt(train)) 输出: variable value0 id 0.01 id NaN2 id 1.03 id 1.04 sd 1.05 sd 1.06 sd 1.07 sd 1.0 print(p 阅读全文
posted @ 2021-09-07 13:06 祥瑞哈哈哈 阅读(253) 评论(0) 推荐(0) 编辑
摘要:所要读取表格内的数据: 代码: train=pd.read_csv('./1.csv') print(train) 结果: id sd0 0.0 11 NaN 12 1.0 13 1.0 1 由输出可知当代码为空白时输出为Nan。 当读取文件只有一列内容时,空白格会被自动删除不算作一行。 阅读全文
posted @ 2021-09-07 08:05 祥瑞哈哈哈 阅读(1102) 评论(0) 推荐(0) 编辑
摘要:离散型变量的值可以列举出来。 连续型变量的值不能列举。 阅读全文
posted @ 2021-09-06 20:08 祥瑞哈哈哈 阅读(1660) 评论(0) 推荐(0) 编辑
摘要:data.info()显示该表格中的所有数据类型。 输出情况: 输出每个列所对应的数据类型。 最后输出表格中所有的数据类型。 阅读全文
posted @ 2021-09-06 19:44 祥瑞哈哈哈 阅读(483) 评论(0) 推荐(0) 编辑
摘要:filter是将一个序列进行过滤,返回迭代器的对象,去除不满足条件的序列。 链接:https://www.runoob.com/python3/python3-func-filter.html filter(function,data) function作为条件选择函数。 阅读全文
posted @ 2021-09-06 19:36 祥瑞哈哈哈 阅读(1420) 评论(0) 推荐(0) 编辑
摘要:data.select_dtypes(include=['object']) 选择列表中列满足此数据类型的列,并将列名和列下的所有数值进行输出。 将include改为exclude变为将除该类型以外的列进行输出。 data.select_dtypes(include=['object']).colm 阅读全文
posted @ 2021-09-06 19:23 祥瑞哈哈哈 阅读(1030) 评论(0) 推荐(0) 编辑
摘要:[col for col in data.columns if data_train[col].nunique() <= 1] 判断data.columns的列中,if该列满足条件,则将col加入列表中。 阅读全文
posted @ 2021-09-06 18:12 祥瑞哈哈哈 阅读(478) 评论(0) 推荐(0) 编辑
摘要:plot是根据索引画折线图。 plot.bar是根据索引画直方图。 阅读全文
posted @ 2021-09-06 18:02 祥瑞哈哈哈 阅读(317) 评论(0) 推荐(0) 编辑
摘要:series类似python中的字典。 字典:{'id': 0, 'loanAmnt': 0, 'term': 0, 'interestRate': 0, 'installment': 0, 'grade': 0} series: id 0loanAmnt 0term 0interestRate 0 阅读全文
posted @ 2021-09-06 16:25 祥瑞哈哈哈 阅读(450) 评论(0) 推荐(0) 编辑
摘要:利用俩个函数。 data.head(n)输出头部前n行的数据。 data.tail(n)输出末尾的n行数据。 data.head(n).append(data.tail(n)) 在头部前n行中插入尾部后n行的数据。 阅读全文
posted @ 2021-09-05 21:03 祥瑞哈哈哈 阅读(280) 评论(0) 推荐(0) 编辑
摘要:data.isnull().any().sum() data.isnull() 是判断dataframe中的数据是否为Nan,是Nan则为true否则为False。 any是将列合并,此时一个数值表示一个列的情况,如果一整列都没有Nan则为False,否则为True。 sum是将列作和得出含有Nan 阅读全文
posted @ 2021-09-05 20:58 祥瑞哈哈哈 阅读(468) 评论(0) 推荐(0) 编辑
摘要:f''。在这俩个单引号里,可以用{}包住表达式这样就可以输出表达式的值。 阅读全文
posted @ 2021-09-05 20:44 祥瑞哈哈哈 阅读(945) 评论(0) 推荐(0) 编辑
摘要:在调用pd.read_csv时,对chunksize进行赋值,返回的是多个pandas.core.frame.DataFrame组成的类。 chunker = pd.read_csv("./train.csv",chunksize=5) for item in chunker: print(item 阅读全文
posted @ 2021-09-05 19:47 祥瑞哈哈哈 阅读(462) 评论(0) 推荐(0) 编辑
摘要:目标是需求。 意图是实现手段。 阅读全文
posted @ 2021-09-02 15:58 祥瑞哈哈哈 阅读(410) 评论(0) 推荐(0) 编辑
摘要:速率:网络额定的传输速度bit/s。 带宽:网络的实际的传输速度bit/s。 吞吐量:一段时间的传输量。 吞吐量和带宽的关系好比路程和速度。 阅读全文
posted @ 2021-09-02 15:32 祥瑞哈哈哈 阅读(666) 评论(0) 推荐(0) 编辑
摘要:事件是样本空间的子集。 阅读全文
posted @ 2021-09-02 08:57 祥瑞哈哈哈 阅读(102) 评论(0) 推荐(0) 编辑
摘要:判断俩个变量是否呈正相关和负相关。 cov(x,y)=E((x-x平均)*(y-y平均)) 正相关即x和y同时高于平均值占总数情况较大。 负相关即x和y同时在其平均值俩端占总数情况较大。 如果协方差为0表示俩哥随机变量无关。 类似于同步程度。 阅读全文
posted @ 2021-09-01 19:54 祥瑞哈哈哈 阅读(379) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示