Python练习-3.12
1、给文章中的手机号打上马赛克
也就是在文章中发现手机号之后,用*或者#等这一类无法将手机号直接识别出来的符号代替
# 文章中手机号的马赛克形式化
import re
content="白日18032021369依山尽,黄河12345454393412入海流,欲穷4534543534千里目,更上2132234234一层楼"
pattern=r"(1[3-9])\d{9}"
print(re.sub(pattern,r"\1******",content))
2、实现多种日期格式的标准化
其实也就是利用import re的sub函数方法进行的格式转换
3、Python实现英文分词计算词频
4、计算中文文章词频
需要安装名为jieba的库
内容不多,还是需要稍微笑话一下的哈!