字符串操作、文件操作,英文词频统计预处理

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684

1.字符串操作:

  • 解析身份证号:生日、性别、出生地等
 1 personalCard = input("请输入你的身份证号码:")
 2 year = personalCard[6:10]
 3 month = personalCard[10:12]
 4 day = personalCard[12:14]
 5 city=personalCard[3:5]
 6 province=personalCard[1:3]
 7 sex=personalCard[14:17]
 8 print("你的出生日期为:"+year+''+month+''+day+'')
 9 print("省份代码为:"+province+"城市代码为:"+city)
10 if int(sex) % 2 == 0:
11     print("你的性别是:女")
12 else:
13     print("你的性别是:男")

  • 凯撒密码编码与解码
1 Code = input("请输入要加密的信息:")
2 print("加密后为:")
3 for i in Code:
4     print(chr(ord(i)+3),end="")
5 Code2 = input("\n请输入要解密的信息:")
6 print("解密后为:")
7 for i in Code2:
8     print(chr(ord(i)-3),end="")

  • 网址观察与批量生成
1 href='https://www.douyu.com/'
2 for i in range(1, 10):
3     if(i == 1):
4         print(href)
5     else:
6         print('https://www.douyu.com/'+str(i)+'.html')

 

2.英文词频统计预处理

  • 下载一首英文的歌词或文章或小说,保存为utf8文件。
  • 将所有大写转换为小写
  • 将所有其他做分隔符(,.?!)替换为空格
  • 分隔出一个一个的单词
  • 并统计单词出现的次数。
  • 从文件读入文本进行处理。
f = open('article.txt', 'r', encoding='utf8')
text = f.read()
text = text.lower()
s = ',.'
word = 'we'
word2 = 'and'
for i in s:
    text = text.replace(i, ' ')
print(text.split())
for ii in text.split(' '):
    print(ii + '出现次数: '+ str(text.count(ii)))

3.文件操作

  • 同一目录、绝对路径、相对路径
  • 凯撒密码:从文件读入密函,进行加密或解密,保存到文件。
1 f = open('加密文档.txt', 'r', encoding='utf8')
2 f = f.read()
3 Code1 = ''
4 for i in f:
5     Code1 = Code1+chr(ord(i)+3)
6 Code2 = open('加密文档2.txt', 'a', encoding='utf8')
7 Code2 = Code2.write(Code1)

 

 4.函数定义

  • 加密函数
1 def JiaMi(dode) :
2       code1 = ''
3       for i in code :
4            i = i + chr(ord(i)+3)
5       return i
  • 解密函数
1 def JieMi(code) :
2       code1 = ''
3       for i in code :
4            i = i + chr(ord(i)-3)
5       return i
  • 读文本函数
1 def read(article) : 
2     file = open(article, 'r',encoding = 'utf8')
3     return file.read()

 

 

posted @ 2019-03-11 14:10  ALiuYu  阅读(164)  评论(0编辑  收藏  举报