08 2022 档案
摘要:一、空值 isna Pands 中 NaN(Not-A-Number) 视为空值,利用函数 isna 和 notna 进行判断。 注意:不要利用是否等于None判断是否为空! import pandas as pd pd.NA == None # False pd.isna(pd.NA) # Tru
阅读全文
摘要:一、介绍 add() 函数用于向调用者添加对象。 使用语法为: DataFrame.add(other, axis='columns', level=None, fill_value=None) 实际上等价于 dataframe + other 的直接使用相加语法。 区别在于支持使用 fill_va
阅读全文
摘要:一、介绍 箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。 1977年,美国著名数学家 John W. Tukey 首先在他的著作 《Explorat
阅读全文
摘要:〇、判断数据框中非数值的取值 data.loc[data['score'].apply(lambda x: False if str(x).isdigit() else True), 'score'].values 一、isinstance 判断输入是否为整数或者浮点数,可利用 ininstance
阅读全文
摘要:一、kill -9 pid 结束 Linux 后台进程,使用该命令。 kill -9 pid 实际上 kill -n 传输一个信号编码给到程序,n 有30个可以选择,最常用便是 -9。 二、查看后台进程 ps -ef | grep tomcat ps -ef | grep tomcat | grep
阅读全文
摘要:一、os.popen()方法 1.使用语法 os.popen() 方法用于从一个命令打开一个管道。 os.popen(cmd).read() 获取执行后结果。 os.popen(command[, mode[, bufsize]]) # 使用的命令 # 模式权限:默认'r'或者'w' # 文件需要的
阅读全文
摘要:一、删除文件和目录 Python 中利用 os 模块对文件进行操作。 import os path = r'C:\Users\111\Desktop\test' os.chdir(path) os.listdir() file_path = os.path.join(path, '我.txt') #
阅读全文
摘要:日常工作中常常需要打印日志,进行查看、调试,有时打印日志很长而长度不一致的话,查阅起来难免没那么直观,遂诞生寻找控制打印长度的函数。例如:ljust、rjust、center等。 一、ljust、rjust、center方法 这3个方法都可以设定对齐长度,填充特定字符。 语法 String.ljus
阅读全文
摘要:源于生产上有多个零碎的 HDFS 小文件需要通过 Python 进行读取,遂产生需求。 屡经测试,除去真正 pd.read_csv 读取数据时间无法避免之外,一边读取数据存储为临时变量,一边进行 pd.concat 合并也造成大量开销。 # 读取数据 data = pd.DataFrame() fo
阅读全文