摘要:
公式写法一: =RIGHT("0000"&C2,5) 用4个0连接C列的数字,然后用right函数从右边开始提取5位,这样就实现了补全5位数。 公式写法二: =TEXT(C2,"00000") 使用Text函数的作用就是将C2单元格的数字,变成5位的文本型数字字符。 阅读全文
摘要:
文本连接 方法s.str.cat()具有文本连接的功能,可以将序列连接成一个文本或者将两个文本序列连接在一起。 # 文本序列 s = pd.Series(['x', 'y', 'z'], dtype="string") # 默认无符号连接 s.str.cat() # 'xyz' # 用逗号连接 s. 阅读全文
摘要:
文本替换 在进行数据处理时我们可以使用替换功能剔除我们不想要的内容,换成想要的内容。这在数据处理中经常使用,因为经过人工整理的数据往往不理想,需要进行替换操作。我们使用.str.replace()方法来完成这一 操作。例如,对于以下一些金额数据,我们想去除货币符号,为后续转换为数字类型做准备,因为非 阅读全文
摘要:
文本分隔 对文本的分隔和替换是最常用的文本处理方式。对文本分隔后会生成一个列表,我们对列表进行切片操作,可以找到我们想要的内容。分隔后还可以将分隔内容展开,形成单独的行。下例以下划线对内容进行了分隔,分隔后每个内容都成为一个列表。分隔对空值不起作用。 # 构造数据 s = pd.Series(['天 阅读全文
摘要:
s = pd.Series(['lower', 'CAPITALS', 'this is a sentence', 'SwApCaSe']) s.str.lower() # 转为小写 s.str.upper() # 转为大写 s.str.title() # 标题格式,每个单词大写 s.str.cap 阅读全文
摘要:
>>> f0=2304001 >>> xx=f0-1 >>> mvv=[] >>> muu=[] >>> muu.append([xx+1,xx+2,xx+3]) >>> muu [[2304001, 2304002, 2304003]] >>> xx=xx+3 >>> muu.append([xx 阅读全文
摘要:
目标想根据kaohao新增加一个变量,其值用来标记kaohao是否连续 解决方案: >>> df4=df3[["kaohao"]].copy()>>> df4['consecutive'] = (df4['kaohao']!= df4['kaohao'].shift(+1)).cumsum() 阅读全文