01 2024 档案

摘要:matlab安装:1下载https://pan.baidu.com/s/1aLUosEgDOTBvZ1W9t_vd5A?pwd=6789,并解压缩2.用360软件管家安装 daemontools lite3.打开软件快速装载,setup.iso4.打开相应的虚拟光驱,用管理员身份运行 setup.e 阅读全文
posted @ 2024-01-31 08:18 myrj 阅读(72) 评论(0) 推荐(0) 编辑
摘要:% 设置要处理的CSV文件路径 file_path = 'your/csv/files/*.csv'; % 通配符表示所有CSV文件 % 获取所有CSV文件名 file_names = dir(fullfile(pwd,'*.csv')); num_files = length(file_names 阅读全文
posted @ 2024-01-31 07:22 myrj 阅读(124) 评论(0) 推荐(0) 编辑
摘要:公式写法一: =RIGHT("0000"&C2,5) 用4个0连接C列的数字,然后用right函数从右边开始提取5位,这样就实现了补全5位数。 公式写法二: =TEXT(C2,"00000") 使用Text函数的作用就是将C2单元格的数字,变成5位的文本型数字字符。 阅读全文
posted @ 2024-01-28 10:59 myrj 阅读(280) 评论(0) 推荐(0) 编辑
摘要:文本连接 方法s.str.cat()具有文本连接的功能,可以将序列连接成一个文本或者将两个文本序列连接在一起。 # 文本序列 s = pd.Series(['x', 'y', 'z'], dtype="string") # 默认无符号连接 s.str.cat() # 'xyz' # 用逗号连接 s. 阅读全文
posted @ 2024-01-28 08:25 myrj 阅读(38) 评论(0) 推荐(0) 编辑
摘要:文本替换 在进行数据处理时我们可以使用替换功能剔除我们不想要的内容,换成想要的内容。这在数据处理中经常使用,因为经过人工整理的数据往往不理想,需要进行替换操作。我们使用.str.replace()方法来完成这一 操作。例如,对于以下一些金额数据,我们想去除货币符号,为后续转换为数字类型做准备,因为非 阅读全文
posted @ 2024-01-28 08:23 myrj 阅读(155) 评论(0) 推荐(0) 编辑
摘要:文本分隔 对文本的分隔和替换是最常用的文本处理方式。对文本分隔后会生成一个列表,我们对列表进行切片操作,可以找到我们想要的内容。分隔后还可以将分隔内容展开,形成单独的行。下例以下划线对内容进行了分隔,分隔后每个内容都成为一个列表。分隔对空值不起作用。 # 构造数据 s = pd.Series(['天 阅读全文
posted @ 2024-01-28 08:20 myrj 阅读(153) 评论(0) 推荐(0) 编辑
摘要:s = pd.Series(['lower', 'CAPITALS', 'this is a sentence', 'SwApCaSe']) s.str.lower() # 转为小写 s.str.upper() # 转为大写 s.str.title() # 标题格式,每个单词大写 s.str.cap 阅读全文
posted @ 2024-01-28 08:18 myrj 阅读(15) 评论(0) 推荐(0) 编辑
摘要:>>> f0=2304001 >>> xx=f0-1 >>> mvv=[] >>> muu=[] >>> muu.append([xx+1,xx+2,xx+3]) >>> muu [[2304001, 2304002, 2304003]] >>> xx=xx+3 >>> muu.append([xx 阅读全文
posted @ 2024-01-28 06:43 myrj 阅读(22) 评论(0) 推荐(0) 编辑
摘要:目标想根据kaohao新增加一个变量,其值用来标记kaohao是否连续 解决方案: >>> df4=df3[["kaohao"]].copy()>>> df4['consecutive'] = (df4['kaohao']!= df4['kaohao'].shift(+1)).cumsum() 阅读全文
posted @ 2024-01-28 06:28 myrj 阅读(270) 评论(0) 推荐(0) 编辑
摘要:worksheet1.set_default_row(72)AttributeError: 'Worksheet' object has no attribute 'set_default_row' 报错解决: pip install xlsxwriter 阅读全文
posted @ 2024-01-27 16:20 myrj 阅读(204) 评论(0) 推荐(0) 编辑
摘要:pandas 实现 以A列值作为唯一值,将A列值相同的数据合并为一条数据,以分号分隔 df_merge = data2.groupby('唯一值').agg({'序号': ';'.join} 阅读全文
posted @ 2024-01-27 11:08 myrj 阅读(8) 评论(0) 推荐(0) 编辑
摘要:groupd=group.groupby(group.index //3) for name,group1 in groupd: print(1,group1) 阅读全文
posted @ 2024-01-26 06:30 myrj 阅读(21) 评论(0) 推荐(0) 编辑
摘要:WINRAR批量压缩多个文件分别单独形成对应的压缩文件1.选中需要压缩的全部文件,右击“添加到压缩文件”2.“文件”选项卡中,选择“把每个文件放到单独的压缩文件中”3.单击确定即可 阅读全文
posted @ 2024-01-23 17:41 myrj 阅读(727) 评论(0) 推荐(0) 编辑
摘要:外键·外键就是来自其它表的主键,用于联系表与表。 阅读全文
posted @ 2024-01-23 10:41 myrj 阅读(13) 评论(0) 推荐(0) 编辑
摘要:对 Windows GUI进行自动化控制需要使用进程查看器工具对GUI界面元素进行定位,定位工具有很多,这里推荐使用微软提供的inspect.exe 或者 Accessibility Insights 这两款工具。 inspect.exe inspect.exe 是 Windows SDK 自带的一 阅读全文
posted @ 2024-01-19 19:08 myrj 阅读(2181) 评论(0) 推荐(0) 编辑
摘要:别人加 自己好友不用验证直接通过:1.设置--朋友权限--取消“加我为朋友时需要验证” 阅读全文
posted @ 2024-01-14 16:16 myrj 阅读(307) 评论(0) 推荐(0) 编辑
摘要:#header默认为0,即以第一列为列名,这里设为None,意味不设置第一行为列名; df11 = pd.read_table(url,header =None) df11.head() #names =***,可以自定义设置列名 user_cols = ['id','quantity','name 阅读全文
posted @ 2024-01-14 10:05 myrj 阅读(19) 评论(0) 推荐(0) 编辑
摘要:http://127.0.01:9870/dfshealth.html#tab-overview 阅读全文
posted @ 2024-01-14 07:24 myrj 阅读(54) 评论(0) 推荐(0) 编辑
摘要:替换WORD中的换行符,查找并替换^p为空 阅读全文
posted @ 2024-01-11 15:35 myrj 阅读(23) 评论(0) 推荐(0) 编辑
摘要:Visual Studio 2015 开发的 C++ 应用程序所必需的 https://www.microsoft.com/en-us/download/details.aspx?id=48145 阅读全文
posted @ 2024-01-08 09:29 myrj 阅读(28) 评论(0) 推荐(0) 编辑
摘要:import pyarrow.parquet as pq from pyarrow import fs # 创建Hadoop文件系统对象 fs = fs.LocalFileSystem() hadoop_path = "hdfs://<your-hdfs-address>/<csv-file>" # 阅读全文
posted @ 2024-01-07 16:03 myrj 阅读(13) 评论(0) 推荐(0) 编辑
摘要:删除空值 在一些情况下会删除有空值、缺失不全的数据,df.dropna可以执行这种操作: df.dropna() # 一行中有一个缺失值就删除 df.dropna(axis='columns') # 只保留全有值的列 df.dropna(how='all') # 行或列全没值才删除 df.dropn 阅读全文
posted @ 2024-01-01 19:46 myrj 阅读(88) 评论(0) 推荐(0) 编辑
摘要:替换数据 replace方法可以对数据进行批量替换: s.replace(0, 5) # 将列数据中的0换为5 df.replace(0, 5) # 将数据中的所有0换为5 df.replace([0, 1, 2, 3], 4) # 将0~3全换成4 df.replace([0, 1, 2, 3], 阅读全文
posted @ 2024-01-01 19:19 myrj 阅读(199) 评论(0) 推荐(0) 编辑
摘要:修改数值 在Pandas中修改数值非常简单,先筛选出需要修改的数值范围,再为这个范围重新赋值。 df.iloc[0,0] # 查询值 # 'Liver' df.iloc[0,0] = 'Lily' # 修改值 df.iloc[0,0] # 查看结果 # 'Lily' 以上修改了一个具体的数值,还可以 阅读全文
posted @ 2024-01-01 19:16 myrj 阅读(12) 评论(0) 推荐(0) 编辑
摘要:指定列df.assign() df.assign(k=v)为指定一个新列的操作,k为新列的列名,v为此列的值,v必须是一个与原数据同索引的Series。今后我们会频繁用到它,它在链式编程技术中相当重要,因此这里专门介绍一下。我们平时在做数据探索分析时会增加一些临时列,如果新列全部使用赋值的方式生成, 阅读全文
posted @ 2024-01-01 17:22 myrj 阅读(322) 评论(0) 推荐(0) 编辑
摘要:执行表达式df.eval() df.eval()与之前介绍过的df.query()一样,可以以字符的形式传入表 达式,增加列数据。下面以增加总分为例: # 传入求总分表达式 df.eval('total = Q1+Q3+Q3+Q4') ''' name team Q1 Q2 Q3 Q4 total 阅读全文
posted @ 2024-01-01 17:19 myrj 阅读(116) 评论(0) 推荐(0) 编辑
摘要:增加行 可以使用loc[]指定索引给出所有列的值来增加一行数据。目前我们的df最大索引是99,增加一条索引为100的数据: # 新增索引为100的数据 df.loc[100] = ['tom', 'A', 88, 88, 88, 88] df ''' name team Q1 Q2 Q3 Q4 0 阅读全文
posted @ 2024-01-01 17:18 myrj 阅读(143) 评论(0) 推荐(0) 编辑
摘要:追加合并 增加行数据的使用场景相对较少,一般是采用数据追加的模式。数据追加会在后续章节中介绍。 df.append()可以追加一个新行: df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB')) df2 = pd.DataFrame([[5, 6 阅读全文
posted @ 2024-01-01 17:16 myrj 阅读(53) 评论(0) 推荐(0) 编辑
摘要:删除 删除有两种方法,一种是使用pop()函数。使用pop(),Series会删除指定索引的数据同时返回这个被删除的值,DataFrame会删除指定列并返回这个被删除的列。以上操作都是实时生效的。 # 删除索引为3的数据 s.pop(3) # 93 s ''' 0 89 1 36 2 57 4 65 阅读全文
posted @ 2024-01-01 17:14 myrj 阅读(24) 评论(0) 推荐(0) 编辑
摘要:删除空值 在一些情况下会删除有空值、缺失不全的数据,df.dropna可以执行 这种操作: df.dropna() # 一行中有一个缺失值就删除 df.dropna(axis='columns') # 只保留全有值的列 df.dropna(how='all') # 行或列全没值才删除 df.drop 阅读全文
posted @ 2024-01-01 17:11 myrj 阅读(44) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示