机器学习之pandas读取csv文件到指定行停止，不再读取后面的值

1.关于这个读取csv文件到指定行，目前想了两个方法。

　　1.直接with open 文件一行一行读，读到我们所需要的行返回。但是如果这个文件又需要用pandas处理，就会显得很麻烦，造成二次打开。如果只是单纯读取某一个文件的话，不需要进行数据集的处理，可以使用这种方式，因为是直接打开文件读。

　　2.本身数据集需要用pandas处理，那么如何到指定行呢？

　　　　这个方法的思路是，1.选取某一列，（这一列中，我们需要的值不能和指定行后面的值相同）

　　　　　　　　　　　　 2.找到我们需要停止的行和指定行下面的选取这列的值。

　　　　　　　　　　　　 3.找到以后找到该行的索引，index
　　　　　　　　　　 4.将索引值-1或者2得到我们需要读取的指定行前面数据的最后一行的索引x（看你找的值和你需要得最后一个值之间差了几行，差几就减几）

　　　　　　　　　　　　　5.最后在pandas中读csv文件中加上nrows = x

2.代码例子：

　　比如说：我要读取某个csv文件的前10行，有一行的空格和杂乱的值。

"""
coding:utf-8
@Software:PyCharm
@Time:2022/12/16 16:48
"""


import pandas as pd


def read_csv(dir_path):
    """
    指定行
    """
    data_ = pd.read_csv(dir_path)
    col_index_ = data_.loc[data_['indexs'] == 'fd'].index[0]
    required_col_index = col_index_ - 1

    data = pd.read_csv(dir_path, nrows=required_col_index)
    print(data)


if __name__ == '__main__':
    dir_path = r'C:\Users\Administrator\Desktop\ww.csv'
    read_csv(dir_path)

posted @ 2022-12-16 17:16 许个未来— 阅读(603) 评论(0) 收藏举报

刷新页面返回顶部

梦想不断实现，生活持续变好。

机器学习之pandas读取csv文件到指定行停止，不再读取后面的值

公告