【论文考古】Training a 3-Node Neural Network is NP-Complete
今天看到一篇1988年的老文章谈到了训练一个简单网络是NPC问题[1]。也就是下面的网络结构,在线性激活函数下,如果要找到参数使得输入数据的标签估计准确,这个问题是一个NPC问题。这个文章的意义在于宣判了找简单的神经网络来降低计算难度是行不通的,同时找多项式内求解的算法也不用再考虑了。
站在时代的背景上,这篇文章反应了算力不足时期神经网络的尴尬位置,告诉我们算力设备是搞神经网络不可缺少的资源。
[1] A. Blum and R. L. Rivest, “Training a 3-Node Neural Network is NP-Complete.,” in COLT, 1988, pp. 9–18.
顺便复习一下P、NP、NPC、NP-hard问题的关系:
证明A是NP问题(A能在多项时间内验证):
方法一:A能规约成一个NPC问题
方法二:找到多项式内的验证方法
证明A是NPC问题:
方法一:
①某个NPC问题能规约到A
②A能在多项式时间内被验证
方法二:
某个NPC问题有解与问题A有解等价([1]中用的证明方法)
证明A是NP-hard问题(A不能在多项时间内验证):
①某个NPC问题能规约到A
②A不能在多项式时间内被验证