谈一谈自动编程

原文发表于2019-01-15。

这里所说的自动编程，是运用人工智能技术来自动生成程序，尽量免除人类劳动。

在自动产生程序之前，先要知道需求是什么吧？要能把需求准确地描述给机器，这就需要一种需求描述语言。假如我们制造了这种需求描述语言，它进一步发展，越发规范，成为了一种DSL（领域特定语言）。嗯，这就变成了DSL编程。

假如要生成一个应用程序，要选择一些开发框架、中间件和技术方案吧？人类开发时要考虑开发成本和效益的权衡，但是机器既然已懂得多种技术方案，对它来说开发成本为0，那么选择最好的那一个技术方案就行了。这就相当于存在一套最好(也可能最复杂)的框架，用DSL在框架之上编程。

闹了半天就是DSL和框架啊？智能到哪去了？

要想真正发挥人工智能的作用，我有两个思路：

自动提问
就算有了需求描述语言，人类就能准确描述需求吗？如果描述得不好，机器能否通过一些分析，针对不足之处，向人类提问，用答案来完善需求描述呢？
自主学习
人工智能的精髓是自主学习。如果机器能学习世界上现有的代码，不需要人类特意为它提供需求描述语言和技术方案，就方便多了。最好是人类直接说需求，机器自己思考，有问题就提问。

有一个有趣的事——最初的自动编程是什么呢？当编译器技术刚发明时，它就是自动编程：自动把高级语言代码转化成汇编码或机器码。

我个人认为，凡是能给人类省事的技术，哪怕是if-else，也可以算是某种人工智能。

现在要求高了，编译器是硬编码的智能，而我们还要可扩展、甚至自动扩展的智能。现在的自动编程主要有两个流派：基于规则推理的、基于机器学习的(包括统计学习、深度学习等)。学术界对自动编程有一个更特别的说法——程序合成(Program Synthesis)。

由于机器学习的火爆，比较流行的似乎是基于机器学习(+深度学习)的自动编程，其中一种是通过学习输入输出数据的样本，自动“猜”出一个能处理这些数据的程序。

对此，摘录马毅教授的一条微博：数学告诉我们，无论overfit了多大的样本数据，经验事实如何震撼，也取代不了逻辑严格的推理证明——这是唯一能将结论从有限样本扩展到无限的方法。

例如一个递归程序，只有数学归纳法能准确生成它，任何有限样本都无法准确生成它(只能近似猜测)。对于有一点小bug就能出大事的程序，不能松懈啊。

因此我不是很赞成基于机器学习的自动编程，即使要用，也只是辅助手段吧。啊哈哈~

posted @ 2020-12-25 18:21 计算法阅读(618) 评论(0) 收藏举报

刷新页面返回顶部