【Python程序剖析】tdxExp2.py

代码:

 1 #encoding=utf-8
 2 import re
 3 
 4 # read file
 5 dic={}
 6 pattern="([0-9]{6})\s+([\u4e00-\u9fa5]+)"
 7 with open(r'C:\new_tdx\T0002\export\20220918.txt') as infile:
 8     for line in infile:
 9         list=re.findall(pattern,line)
10         if len(list)>0:
11             code=list[0][0]
12             name=list[0][1]
13             dic[code]=name
14 
15 # concat lines
16 sn=0
17 lines=""
18 for code,name in dic.items():
19     sn=sn+1
20     line=str(sn)+"."+code+" "+name+"\n"
21     lines=lines+line
22 
23 # write file
24 with open(r'C:\Users\ufo\Desktop\output.txt','w') as outfile:
25     outfile.write(lines)

 

剖析:

这段代码是将股票行情软件导出的自选股文本文件提取股票代号和名称又存成文本文件用的。

第2行import re是载入py的正则库,程序中将用到正则来识别股票名称;

第3行到第13行意在读取导出的文件,将代号和名称放到一个字典中。py中字典初始化用开闭大括号就行,它相当于java中的哈希表,赋值时用dic[key]=value就行;

第16行到21行意在读取字典键值,将其拼接到一个字符串里面去,这个字符串最终将存到文本文件中去。py中字符串的拼接用加号就行,如a=a+‘b’

第24行到25行就是将一个字符串写入一个文本文件的标准写法。

 

参考链接:https://www.cnblogs.com/pyhy/p/16698107.html

END

posted @ 2022-09-29 15:27  不朽的飞翔  阅读(79)  评论(1编辑  收藏  举报