python 正则匹配汉字、简单读写、打开txt文件
win10环境,假设:
py脚本所在的当前目录下有index.html文件,现在,
要将index.html 中的汉字提取出来,保存为当前目录下的temp.txt,然后用notepad.txt打开查看。代码:
#coding=utf8 import os,re with open('index.html', mode='r', encoding='UTF-8') as f: # 打开文件 data = f.read() # 读取文件 s = re.findall('[\u4e00-\u9fa5]', data)# 匹配所有汉字 kw = ("".join(s)) with open('temp.txt', mode='w', encoding='UTF-8') as fw: # 打开文件 fw.write(kw) #写文件 path = 'temp.txt' win32api.ShellExecute(0, 'open', 'notepad.exe', path, '', 1)
其中,mode参数为:r 表示 读, w表示 写, a表示 追加写入
打开文档也可用
import webbrowser as web web.open('filepath or url')