机器学习之pandas读取csv文件到指定行停止,不再读取后面的值

1.关于这个读取csv文件到指定行,目前想了两个方法。

  1.直接with open 文件 一行一行读,读到我们所需要的行返回。但是如果这个文件又需要用pandas处理,就会显得很麻烦,造成二次打开。如果只是单纯读取某一个文件的话,不需要进行数据集的处理,可以使用这种方式,因为是直接打开文件读。

  2.本身数据集需要用pandas处理,那么如何到指定行呢?

    这个方法的思路是,1.选取某一列,(这一列中,我们需要的值不能和指定行后面的值相同)

                2.找到我们需要停止的行和指定行下面的选取这列的值。

                3.找到以后找到该行的索引,index
                     4.将索引值-1或者2得到我们需要读取的指定行前面数据的最后一行的索引x(看你找的值和你需要得最后一个值之间差了几行,差几就减几)

             5.最后在pandas中读csv文件中加上nrows = x

2.代码例子:

  比如说:我要读取某个csv文件的前10行,有一行的空格和杂乱的值。

  

 

 

"""
coding:utf-8
@Software:PyCharm
@Time:2022/12/16 16:48
"""


import pandas as pd


def read_csv(dir_path):
    """
    指定行
    """
    data_ = pd.read_csv(dir_path)
    col_index_ = data_.loc[data_['indexs'] == 'fd'].index[0]
    required_col_index = col_index_ - 1

    data = pd.read_csv(dir_path, nrows=required_col_index)
    print(data)


if __name__ == '__main__':
    dir_path = r'C:\Users\Administrator\Desktop\ww.csv'
    read_csv(dir_path)

posted @ 2022-12-16 17:16  许个未来—  阅读(533)  评论(0编辑  收藏  举报