1、从文件中读取数据

1.1、读取整个文件

with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents)
    print(contents.rstrip())
在这个程序中,第1行代码做了大量的工作。我们先来看看函数open() 。要以任何方式使用文件——哪怕仅仅是打印其内容,都得先打开 文件,这样才能访问它。
函数open()接受一个参数:要打开的文件的名称。Python在当前执行的文件所在的目录中查找指定的文件。
在这个示例中,当前运行的是file_reader.py,因此Python在file_reader.py所在的目录中查找pi_digits.txt。函数open() 返回一个表示文件的对象。
在这里,open('pi_digits.txt') 返回一个表示文件pi_digits.txt 的对象;Python将这个对象存储在我们将在后面使用的变量中。
 
关键字with 在不再需要访问文件后将其关闭。在这个程序中,注意到我们调用了open() ,但没有调用close() ;你也可以调用open() 和close() 来打开和关闭文件,但
这样做时,如果程序存在bug,导致close() 语句未执行,文件将不会关闭。这看似微不足道,但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调
用close() ,你会发现需要使用文件时它已关闭 (无法访问),这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机,但通过使用前面所示的结构,可
让Python去确定:你只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭。

1.2、文件路径

当你将类似pi_digits.txt这样的简单文件名传递给函数open() 时,Python将在当前执行的文件(即.py程序文件)所在的目录中查找文件。
根据你组织文件的方式,有时可能要打开不在程序文件所属目录中的文件。例如,你可能将程序文件存储在了文件夹python_work中,而在文件夹python_work中,有一个名为
text_files的文件夹,用于存储程序文件操作的文本文件。虽然文件夹text_files包含在文件夹python_work中,但仅向open() 传递位于该文件夹中的文件的名称也不可行,因为Python
只在文件夹python_work中查找,而不会在其子文件夹text_files中查找。要让Python打开不与程序文件位于同一个目录中的文件,需要提供文件路径 ,它让Python到系统的特定位置
去查找。
由于文件夹text_files位于文件夹python_work中,因此可使用相对文件路径来打开该文件夹中的文件。相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程
序所在目录的。在Linux和OS X中,你可以这样编写代码:
with open('text_files/filename.txt') as file_object:
这行代码让Python到文件夹python_work下的文件夹text_files中去查找指定的.txt文件。在Windows系统中,在文件路径中使用反斜杠(\ )而不是斜杠(/ ):
with open('text_files\filename.txt') as file_object:
你还可以将文件在计算机中的准确位置告诉Python,这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径 。在相对路径行不通时,可使用绝对路径。

1.3、逐行读取

 为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而print 语句也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一

个来自print 语句。要消除这些多余的空白行,可在print 语句中使用rstrip()
filename = 'pi_digits.txt'
with open(filename) as file_object:
  for line in file_object:
    print(line.rstrip())

1.4、使用文件的内容

filename = 'pi_digits.txt' 
with open(filename) as file_object:
  lines = file_object.readlines()
❶ pi_string = ''
for line in lines:     pi_string += line.rstrip()
print(pi_string)
print(len(pi_string))
注意 读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int() 将其转换为整数,或使用
函数float() 将其转换为浮点数。

2、写入文件

2.1、写入空文件

filename = 'programming.txt' 
❶ with open(filename, 'w') as file_object:
❷   file_object.write("I love programming.")
在这个示例中,调用open() 时提供了两个实参(见❶)。第一个实参也是要打开的文件的名称;第二个实参('w' )告诉Python,我们要以写入模式 打开这个文件。打开文件
时,可指定读取模式 ('r' )、写入模式 ('w' )、附加模式 ('a' )或让你能够读取和写入文件的模式('r+' )。如果你省略了模式实参,Python将以默认的只读模式打
开文件。
如果你要写入的文件不存在,函数open() 将自动创建它。然而,以写入('w' )模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空
该文件。

2.2、写入多行

filename = 'programming.txt' 
with open(filename, 'w') as file_object:
  file_object.write("I love programming.\n")
  file_object.write("I love creating new games.\n")

2.3、附加到文件

如果你要给文件添加内容,而不是覆盖原有的内容,可以附加模式 打开文件。你以附加模式打开文件时,Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加
到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件。

3、异常

3.1、try-except代码块

try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero!")

3.2、使用异常避免崩溃

3.3、else代码块

通过将可能引发错误的代码放在try-except 代码块中,可提高这个程序抵御错误的能力。错误是执行除法运算的代码行导致的,因此我们需要将它放到try-except 代码块
中。这个示例还包含一个else 代码块;依赖于try 代码块成功执行的代码都应放到else 代码块中:

3.4、分析文本

3.5、使用多个文件

def count_words(filename):
    """计算一个文件大致包含多少个单词"""
    try:
        with open(filename) as f_obj:
            contents = f_obj.read()
            #print(5/0)
    except FileNotFoundError as e1:
        msg = "Sorry, the file " + filename + " does not exist." 
        print(msg)
    except Exception as e2:
        print(e2)
    else:
        # 计算文件大致包含多少个单词 
        words = contents.split() 
        num_words = len(words) 
        print("The file " + filename + " has about " + str(num_words) + " words.")

filename = 'programming.txt'
count_words(filename)

3.6、决定报告哪些错误

在什么情况下该向用户报告错误?在什么情况下又应该在失败时一声不吭呢?如果用户知道要分析哪些文件,他们可能希望在有文件没有分析时出现一条消息,将其中的原因告
诉他们。如果用户只想看到结果,而并不知道要分析哪些文件,可能就无需在有些文件不存在时告知他们。向用户显示他不想看到的信息可能会降低程序的可用性。Python的错误
处理结构让你能够细致地控制与用户分享错误信息的程度,要分享多少信息由你决定。
编写得很好且经过详尽测试的代码不容易出现内部错误,如语法或逻辑错误,但只要程序依赖于外部因素,如用户输入、存在指定的文件、有网络链接,就有可能出现异常。凭
借经验可判断该在程序的什么地方包含异常处理块,以及出现错误时该向用户提供多少相关的信息。

4、存储数据

4.1、使用json.dump()和json.load()

import json

numbers = [2, 3, 5, 7, 11, 13]

filename = 'numbers.json'
with open(filename,'w') as f_obj:
    json.dump(numbers,f_obj)
import json

filename = 'numbers.json'
with open(filename) as f_obj:
    numbers = json.load(f_obj)

print(numbers)

 

4.2、保存和读取用户生成的数据

4.3、重构

import json 

def greet_user(): ❶ """问候用户,并指出其名字"""
  filename = 'username.json'
  try:
    with open(filename) as f_obj:
      username = json.load(f_obj)
  except FileNotFoundError:
    username = input("What is your name? ")
    with open(filename, 'w') as f_obj:
      json.dump(username, f_obj)
      print("We'll remember you when you come back, " + username + "!")
  else:
    print("Welcome back, " + username + "!")
greet_user()
下面来重构greet_user() ,让它不执行这么多任务。为此,我们首先将获取存储的用户名的代码移到另一个函数中:
import json 

def get_stored_username():
"""如果存储了用户名,就获取它"""
  filename = 'username.json'
  try:
    with open(filename) as f_obj:
      username = json.load(f_obj)
  except FileNotFoundError:
❷  return None
  else:
    return username

def greet_user():
  """问候用户,并指出其名字"""
  username = get_stored_username()
if username:
    print("Welcome back, " + username + "!")
  else:
    username = input("What is your name? ")
    filename = 'username.json'
    with open(filename, 'w') as f_obj:
      json.dump(username, f_obj)
      print("We'll remember you when you come back, " + username + "!")

greet_user()
新增的函数get_stored_username() 目标明确,❶处的文档字符串指出了这一点。如果存储了用户名,这个函数就获取并返回它;如果文件username.json不存在,这个函数
就返回None (见❷)。这是一种不错的做法:函数要么返回预期的值,要么返回None ;这让我们能够使用函数的返回值做简单测试。在❸处,如果成功地获取了用户名,就打
印一条欢迎用户回来的消息,否则就提示用户输入用户名。
import json 

def get_stored_username():
  """如果存储了用户名,就获取它"""
  --snip--

def get_new_username():
  """提示用户输入用户名"""
  username = input("What is your name? ")
  filename = 'username.json'
  with open(filename, 'w') as f_obj:
    json.dump(username, f_obj)
  return username

def greet_user():
  """问候用户,并指出其名字"""
  username = get_stored_username()
  if username:
    print("Welcome back, " + username + "!")
  else:
    username = get_new_username()
    print("We'll remember you when you come back, " + username + "!")

greet_user()