python中--try except 异常捕获以及正则化、替换异常值

 1.异常处理过程

 

异常名称描述
BaseException所有异常的基类
SystemExit解释器请求退出
KeyboardInterrupt用户中断执行(通常是输入^C)
Exception常规错误的基类
StopIteration迭代器没有更多的值
GeneratorExit生成器(generator)发生异常来通知退出
StandardError所有的内建标准异常的基类
ArithmeticError所有数值计算错误的基类
FloatingPointError浮点计算错误
OverflowError数值运算超出最大限制
ZeroDivisionError除(或取模)零(所有数据类型)
AssertionError断言语句失败
AttributeError对象没有这个属性
EOFError没有内建输入,到达EOF标记
EnvironmentError操作系统错误的基类
IOError输入/输出操作失败
OSError操作系统错误
WindowsError系统调用失败
ImportError导入模块/对象失败
LookupError无效数据查询的基类
IndexError序列中没有此索引(index)
KeyError映射中没有这个键
MemoryError内存溢出错误(对于Python解释器不是致命的)
NameError未声明/初始化对象(没有属性)
ReferenceError弱引用(Weakreference)试图访问已经垃圾回收了的对象
RuntimeError一般的运行时错误
NotImplementedError尚未实现的方法
SyntaxErrorPython语法错误
IndentationError缩进错误
TabErrorTab和空格混用
SystemError一般的解释器系统错误
TypeError对类型无效的操作
ValueError传入无效的参数
UnicodeErrorUnicode相关的错误
UnicodeDecodeErrorUnicode解码时的错误
UnicodeEncodeErrorUnicode编码时错误
UnicodeTranslateErrorUnicode转换时错误
Warning警告的基类
DeprecationWarning关于被弃用的特征的警告
FutureWarning关于构造将来语义会有改变的警告
OverflowWarning旧的关于自动提升为长整型(long)的警告
PendingDeprecationWarning关于特性将会被废弃的警告
RuntimeWarning可疑的运行时行为(runtimebehavior)的警告
SyntaxWarning可疑的语法的警告
UserWarning用户代码生成的警告

  • AttributeError 试图访问一个对象没有的树形,比如foo.x,但是foo没有属性x
  • IOError 输入/输出异常;基本上是无法打开文件
  • ImportError 无法引入模块或包;基本上是路径问题或名称错误
  • IndentationError 语法错误(的子类) ;代码没有正确对齐
  • IndexError 下标索引超出序列边界,比如当x只有三个元素,却试图访问x[5]
  • KeyError 试图访问字典里不存在的键
  • KeyboardInterrupt Ctrl+C被按下
  • NameError 使用一个还未被赋予对象的变量
  • SyntaxError Python代码非法,代码不能编译(个人认为这是语法错误,写错了)
  • TypeError 传入对象类型与要求的不符合
  • UnboundLocalError 试图访问一个还未被设置的局部变量,基本上是由于另有一个同名的全局变量,导致你以为正在访问它
  • ValueError 传入一个调用者不期望的值,即使值的类型是正确的

 2.异常处理方式

2.1 单个异常处理

语法如下:

    try:
        code   #处理的语句
    except  Error1 as e:   #遇到Error1执行下面的语句,在python2中写成except  Error1,e
        print(e)

demo

  name = [1,2,3]
    try:
        name[3]  #不存在3这个下标值
    except IndexError as e:   #抓取 IndexError 这个异常
        print(e) #e是错误的详细信息

#输出
list index out of range

2.2 多个异常处理

语法如下:

    try:
        code
    except Error1 as e:  #处理Error1异常
        print(e)
    except Error2 as e:   #处理Error2异常
        print(e)

代码如下:

    name = [1,2,3]
    data = {"a":"b"}
    try:
        data["c"]   #这边已经出现异常KeyError ,所以直接跳出code,跳到KeyError 下去处理
        name[3]
    except IndexError as e:
        print(e)
    except KeyError as e:
        print(e)

#输出
‘c’

合并成1个except,语法如下:

    try:
        code
    except (Error1,Error2,...) as e:
        print(e)
    try:
        data["c"]
        name[3]
    except (IndexError,KeyError) as e:
        print(e)

#输出
‘c’
注:第二种写法的用处:括号里面的所有错误,不管出现里面任何一种错误都用统一的处理方法。

2.3 Exception异常

    try:
        code
    except (Error1,Error2,...) as e:
        print(e)
    except Exception as e:   #用Exception表示一下子抓住所有异常,这个一般情况下建议在异常最后面用,用在最后抓未知的异常
        print(e)

demo

    try:
        open("qigao.text","r",encoding="utf-8")
    except (IndexError,KeyError) as e:   #没有IndexError,KeyError这两个异常
        print(e)
    except Exception as e:  #只能通过这个异常处理,Exception 抓住所有的异常
        print(e)

#输出
[Errno 2] No such file or directory: ‘qigao.text’

2.4 else用途

作用:没有异常,则走else部分的逻辑代码

    try:
        print("qigao,handson")    #代码没有异常
    except (IndexError,KeyError) as e:
        print(e)
    except Exception as e:
        print(e)
    else:             #没有异常出错,走else的逻辑代码
        print("没有异常")

#输出
qigao,handson
没有异常

2.5 finnally作用

    try:
        code
    except (Error1,Error2,...) as e:
        print(e)
    except Exception as e:
        print(e)
    else:
        print("没有错误,执行")
    finnally:
        print("不管有没有错,都执行finnally")

2.6 自定义异常

    class GaoError(Exception):  #定义一个异常类,继承Exception
      
        def __init__(self,message):
            self.message = message
      
        def __str__(self):
            return self.message #给对象取一个名

    try:
        raise GaoError("数据库连接不上了")  #触发自定义异常,GaoError("数据库连接不上了")这个对象
    except GaoError as e:
        print(e)

触发自定义异常:

2.7 断言

断言被用作你接下来的程序执行,如果后面程序依赖于前面的程序,后面的程序有很重要,就是后面的程序执行肯定不能出错,所以在执行之前要做检查工作。

    class C(object):
      
        def __init__(self):
            self.name = "AAAAA"
      
    c_obj = C()
      
    assert c_obj.name  == "AAAAA"   #断言
      
    print("没有错误继续...")


#输出
没有错误继续…

断言不符合

    class C(object):
      
        def __init__(self):
            self.name = "AAAAA"
      
    c_obj = C()
      
    assert c_obj.name  == "BBBBB"   #断言出字符串不匹配
      
    print("没有错误继续...")

Traceback (most recent call last):
  File "E:/PycharmProjects/pytest/day7/断言.py", line 10, in <module>
    assert c_obj.name  == "BBBBB
AssertionError   #报断言异常错误

3. 正则化、替换异常值

#输出结果整合:
import json
from pprint import pprint
import json
import pandas as pd

enddate=timeUtils().getAnyDay(-1) 

input_path=
result_path = 
output_path = 

def get_textLine(path):
    string_list = []
    string_list1 = []
    file_data = pd.read_table(path,sep = r'\001',encoding="UTF-8")
    for index, elem in file_data.iterrows():
        string_list.append(elem[0])
        string_list1.append(elem[1]) 
    return string_list,string_list1

def get_textLine1(path):
    string_list = []
    file_data = pd.read_table(path,sep = r'\001',encoding="UTF-8")
    for index, elem in file_data.iterrows():
        string_list.append(elem[0])
    return string_list

data_input,label=get_textLine(input_path)
data_result=get_textLine1(result_path)

# print(data_input[:3])#查看中间结果
print(data_result[200:300])
# print(len(data_result))

# pred =re.sub("\[\{\'text\': \'([0-9])\', \'probability\': (0.[0-9]+)}]",r'\1<-\2', text)
cases = []
# cases1 = []
for i in range(len(data_result)):
    try:
        if data_result[i]=='\"\"':
            index=str(0)
            # index1=str(0)
            #异常暂时替换为0
        else:
            pred =re.sub("\[\{\'text\': \'([0-9])\', \'probability\': (0.[0-9]+)}]",r'\1<-\2', data_result[i])  #'\[\{\'text\': \'([0-9+])\'',r'\1'
            index=pred[0]
            # index1=pred[3:]
    except IndexError as e:
        index = 'UNK'
    # cases.append(f'{data_input[i]}\001{label[i]}\001{pred}')
    cases.append(f'{index}')
    # cases1.append(f'{index1}')


# final_data=pd.DataFrame(columns = ['content','label','pred','probability'])
final_data=pd.DataFrame(columns = ['content','label','pred'])
final_data['content']=data_input
final_data['label']=label
final_data['pred']=cases 
# final_data['probability']=cases1

# final_data.to_csv(output_path, sep='\001',index=False,header=False) 
print(final_data[250:300])
# final_data.to_csv(output_path, sep='\001',index=False,index_label=False,header=False) 

#查看结果
# print(final_data)
# test=pd.read_csv(output_path,encoding="UTF-8",sep = r'\001',index_col="content")
# test=pd.read_csv(output_path,encoding="UTF-8",sep = r'\001')
# print(test.head(30))

# with open(output_path, 'w', encoding='utf8')as f:
#     for case in cases:
#         print(case) #查看输出
#         f.write("\n".join(case))

   
print("数据已上传oss")

4.读取的时候跳过异常行!

df = pd.read_csv(filename, error_bad_lines = False)

posted @ 2022-10-27 21:32  汀、人工智能  阅读(85)  评论(0编辑  收藏  举报