机器学习之pandas读取csv文件到指定行停止,不再读取后面的值
1.关于这个读取csv文件到指定行,目前想了两个方法。
1.直接with open 文件 一行一行读,读到我们所需要的行返回。但是如果这个文件又需要用pandas处理,就会显得很麻烦,造成二次打开。如果只是单纯读取某一个文件的话,不需要进行数据集的处理,可以使用这种方式,因为是直接打开文件读。
2.本身数据集需要用pandas处理,那么如何到指定行呢?
这个方法的思路是,1.选取某一列,(这一列中,我们需要的值不能和指定行后面的值相同)
2.找到我们需要停止的行和指定行下面的选取这列的值。
3.找到以后找到该行的索引,index
4.将索引值-1或者2得到我们需要读取的指定行前面数据的最后一行的索引x(看你找的值和你需要得最后一个值之间差了几行,差几就减几)
5.最后在pandas中读csv文件中加上nrows = x
2.代码例子:
比如说:我要读取某个csv文件的前10行,有一行的空格和杂乱的值。
""" coding:utf-8 @Software:PyCharm @Time:2022/12/16 16:48 """ import pandas as pd def read_csv(dir_path): """ 指定行 """ data_ = pd.read_csv(dir_path) col_index_ = data_.loc[data_['indexs'] == 'fd'].index[0] required_col_index = col_index_ - 1 data = pd.read_csv(dir_path, nrows=required_col_index) print(data) if __name__ == '__main__': dir_path = r'C:\Users\Administrator\Desktop\ww.csv' read_csv(dir_path)
本文来自博客园,作者:许个未来—,转载请注明原文链接:https://www.cnblogs.com/future-panda/p/16987786.html