字符串操作、文件操作,英文词频统计预处理
1.字符串操作:
解析身份证号:生日、性别、出生地等。
code=input("请输入您的身份证号:"); year=code[6:10]; month=code[10:12]; day=code[12:14]; province=code[0:2]; area={'11':'北京市','12':'天津市','13':'河北省','14':'山西省','15':'内蒙古自治区','21':'辽宁省','22':'吉林省','23':'黑龙江省','31':'上海市','32':'江苏省','33':'浙江省','34':'安徽省','35':'福建省','36':'江西省','37':'山东省','41':'河南省','42':'湖北省','43':'湖南省','44':'广东省','45':'广西壮族自治区','46':'海南省','50':'重庆市','51':'四川省','52':'贵州省','53':'云南省','54':'西藏自治区','61':'陕西省','62':'甘肃省','63':'青海省','64':'宁夏回族自治区','65':'新疆维吾尔自治区','71':'台湾省','81':'香港特别行政区','82':'澳门特别行政区'} print("你所查询的身份证归属地为:"+area.get(province)); print("出生日期是{}年{}月{}日".format(year,month,day)); sex=code[-2]; if int(sex)%2==0: print("性别为女"); else: print("性别为男")
凯撒密码编码与解码
def encryption(): str_raw = input("请输入明文:") k = int(input("请输入位移值:")) str_change = str_raw.lower() str_list = list(str_change) str_list_encry = str_list i = 0 while i < len(str_list): if ord(str_list[i]) < 123-k: str_list_encry[i] = chr(ord(str_list[i]) + k) else: str_list_encry[i] = chr(ord(str_list[i]) + k - 26) i = i+1 print ("加密结果为:"+"".join(str_list_encry)) def decryption(): str_raw = input("请输入密文:") k = int(input("请输入位移值:")) str_change = str_raw.lower() str_list = list(str_change) str_list_decry = str_list i = 0 while i < len(str_list): if ord(str_list[i]) >= 97+k: str_list_decry[i] = chr(ord(str_list[i]) - k) else: str_list_decry[i] = chr(ord(str_list[i]) + 26 - k) i = i+1 print ("解密结果为:"+"".join(str_list_decry)) while True: print (u"1. 加密") print (u"2. 解密") choice = input("请选择:") if choice == "1": encryption() elif choice == "2": decryption() else: print (u"您的输入有误!")
网址观察与批量生成
for i in range(4,6): url='http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html'.format(i) print(url)
2.英文词频统计预处理
下载一首英文的歌词或文章或小说。
将所有大写转换为小写
将所有其他做分隔符(,.?!)替换为空格
分隔出一个一个的单词
并统计单词出现的次数。
url=''' WHEN MINUTES BECOME HOURS WHEN DAYS BECOME YEARS AND I DON’T KNOW WHERE YOU ARE COLOR SEEMS SO DULL WITHOUT YOU ''' str1=url.lower() str2=str1.replace(",","") str3=str2.replace("'","") print(str3) print(str3.split()); print(str3.count('we'))
3.文件操作
同一目录、绝对路径、相对路径
凯撒密码:从文件读入密函,进行加密或解密,保存到文件。
词频统计:下载一首英文的歌词或文章或小说,保存为utf8文件。从文件读入文本进行处理。
同一目录:
f=open('ll.txt','r',encoding='utf8') text=f.read() f.close() print(text)
4.函数定义
加密函数
def get_text(): plaincode = 'abcd' cipher='' for i in plaincode: cipher=cipher+chr(ord(i) + 3) return cipher bigstr = get_text() print(bigstr)
解密函数
def get_text(): plaincode = 'defg' cipher='' for i in plaincode: cipher=cipher+chr(ord(i) -3) return cipher bigstr = get_text() print(bigstr)
读文本函数
def get_text(): with open('yw.txt', 'r', encoding='utf8',errors='ignore') as f: text = f.read() return text bigstr = get_text() print(bigstr)