字符串操作、文件操作,英文词频统计预处理
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684
1.字符串操作:
- 解析身份证号:生日、性别、出生地等
1 personalCard = input("请输入你的身份证号码:") 2 year = personalCard[6:10] 3 month = personalCard[10:12] 4 day = personalCard[12:14] 5 city=personalCard[3:5] 6 province=personalCard[1:3] 7 sex=personalCard[14:17] 8 print("你的出生日期为:"+year+'年'+month+'月'+day+'日') 9 print("省份代码为:"+province+"城市代码为:"+city) 10 if int(sex) % 2 == 0: 11 print("你的性别是:女") 12 else: 13 print("你的性别是:男")
- 凯撒密码编码与解码
1 Code = input("请输入要加密的信息:") 2 print("加密后为:") 3 for i in Code: 4 print(chr(ord(i)+3),end="") 5 Code2 = input("\n请输入要解密的信息:") 6 print("解密后为:") 7 for i in Code2: 8 print(chr(ord(i)-3),end="")
- 网址观察与批量生成
1 href='https://www.douyu.com/' 2 for i in range(1, 10): 3 if(i == 1): 4 print(href) 5 else: 6 print('https://www.douyu.com/'+str(i)+'.html')
2.英文词频统计预处理
- 下载一首英文的歌词或文章或小说,保存为utf8文件。
- 将所有大写转换为小写
- 将所有其他做分隔符(,.?!)替换为空格
- 分隔出一个一个的单词
- 并统计单词出现的次数。
- 从文件读入文本进行处理。
f = open('article.txt', 'r', encoding='utf8') text = f.read() text = text.lower() s = ',.' word = 'we' word2 = 'and' for i in s: text = text.replace(i, ' ') print(text.split()) for ii in text.split(' '): print(ii + '出现次数: '+ str(text.count(ii)))
3.文件操作
- 同一目录、绝对路径、相对路径
- 凯撒密码:从文件读入密函,进行加密或解密,保存到文件。
1 f = open('加密文档.txt', 'r', encoding='utf8') 2 f = f.read() 3 Code1 = '' 4 for i in f: 5 Code1 = Code1+chr(ord(i)+3) 6 Code2 = open('加密文档2.txt', 'a', encoding='utf8') 7 Code2 = Code2.write(Code1)
4.函数定义
- 加密函数
1 def JiaMi(dode) : 2 code1 = '' 3 for i in code : 4 i = i + chr(ord(i)+3) 5 return i
- 解密函数
1 def JieMi(code) : 2 code1 = '' 3 for i in code : 4 i = i + chr(ord(i)-3) 5 return i
- 读文本函数
1 def read(article) : 2 file = open(article, 'r',encoding = 'utf8') 3 return file.read()