csv文件的读取

.csv Introduction

CSV是一种常以逗号或者制表符分割的文件格式。
  • 利用Excel创建一个csv文件

    用记事本打开,实际上是这样子的:

  • 读取csv文件

    • 直接用open()打开

      with open("./data.csv") as f:
          for line in f:
              print(line)
      

    • 用python自带的标准库读取

      import csv
      csv_reader = csv.reader(open("./data.csv"))
      for line in csv_reader:
          print(line)
      

      可见格式稍微比上述漂亮一些。

    • 用pandas读取

      # 返回的是一个DataFrame数据
      pd_reader = pd.read_csv("./data.csv")
      print(pd_reader)
      


      显然利用pandas库直接读取我觉得更加方便快捷而且直观。

    • 另外一种比较通用的读取数据表的方法(指定分隔符)

      #sep 指定分隔符
      data = pd.read_table("./data.csv",sep=",")
      print(data)
      

      读取结果和上面一种方法一样。

summary

  • 当我们取得dataframe对象后,就可以对二维表进行一系列操作然后再写回csv文件,实现对数据的加工和处理。
  • 当然pandas不只局限在对csv文件的操作,同样可以对excel,json,xml格式的数据。
posted @ 2018-05-30 14:58  沁泽  阅读(1026)  评论(0编辑  收藏  举报