机器学习第一次作业
学习小结
经过对这门课1个月的学习,我收获了许多。
纠正了以前我对人工智能很多猜测的认知,虽然目前来说仍然很复杂。之前我觉得,人工智能非常厉害的地方无非就是比人类计算快,知识范围广。其实它的学习能力也是非常恐怖的,只不过我把它想得太神话了,不太相信当前的科技理论能去做出机器的“学习能力”或是“自我思维”。其实呢,机器学习现实点就是基于对样本和训练集中样本进行特征匹配,其中的非线性判别函数还是比较难构造的,就这样一直训练和测试,优化判别函数,等于强行给机器或者说一段程序灌输并构建函数来记录这是对的、这是错的,直到它的“判断能力”大幅提升时,就说该机器“学会”了一样东西。实质也即是最大概率的猜测,就连熟悉的命题也会出现错判的情况,更不用说去分析前所未有的未知事件了。
既然说机器学习靠的是数据集和判别函数。那么它的重点即是训练集的选取、更新,判别函数的构建、优化,更多的还有验证集。是数据赋予了机器知识储备,算法给予了机器思考能力。
机器学习与人工智能
机器学习到底是什么?
说到机器学习与人工智能的关系,简单概括就是:将海量数据通过机器学习进行处理后形成一个模型,最终适用于场景的过程就是人工智能。可以说,机器学习是人工智能背后的重要推动力量。
当然,机器学习作为人工智能的核心,是使计算机具有智能的必要条件,其应用已遍布人工智能的各个领域。当前的人工智能机器学习算法主要有三大类:监督学习、无监督学习、半监督学习。
监督学习是指,用正确答案已知的例子来训练神经网络,也就是用标记过的数据。简单来说,就是我们将已经知道的知识教给机器,让机器设计出一个模型。这里提到的数据标注的含义是:为数据打上说明其属性的标签。
与监督学习相对应的是无监督学习,在无监督学习中,使用过的数据是没有标记过的,即不知道输入的数据对应的输出结果是什么,只能自己尝试寻找数据中的模型和规律。半监督学习介于有监督学习与非监督学习之间,半监督学习是利用少量标注样本和大量未标注样本进行机器学习。
监督学习方式是制约人工智能发展的重要因素?
半监督学习暂且不提,在这里,主要讲解一下监督学习和无监督学习。目前,我们接触到的人工智能还处于机器学习的初级阶段,基本上都是监督学习阶段。这就需要人类去告诉计算机许多问题的答案。例如:在大量图像数据中,人类需要告诉计算机这是苹果的图片、这是香蕉的图片,以及电视、汽车等。当然,这是一个相当费时而又痛苦的过程。同时,又非常强大,人类已经能通过它解决了很多问题。
但是,在自动驾驶领域,对于如何避免危险发生的问题上,如果我们用的是监督学习,我们就必须告诉计算机:汽车可能遭遇的所有情形以及人类在那些情形中会做出的反应。这就暴露出监督学习的薄弱的一面。
如果,换做是无监督学习算法,就可以帮助我们解决自动驾驶汽车的问题。因为,无监督学习允许计算机投射未来的状况,即基于当前状况生成可能的未来,并且可以允许计算机为它们之前从未训练过的情形进行提前规划。
人工智能的“灵魂”————算法,需要进行革命
据统计,全球每天都会产生接近百亿次的搜索记录,同时社交媒体上的日常行为也促进了数据的大量产出。尽管,我们的世界每天都会产生大量的数据,但是,有很大一部分是未经过整理、未经过标注的数据。这就意味着这些大数据,对于目前监督学习的人工智能产品来说是不可用的。所以,打破人工智能发展局限的关键就要改变机器学习算法。
现在,人工智能技术的发展即将进入瓶颈期,如果机器能够提升算法,将会对人工智能的发展带来很大的帮助。无监督学习实际上是人类学习的方式,这也会让强人工智能成为可能。目前,无监督学习具有非常大的潜力,因为我们拥有的非标记数据比标记数据多得多,只是我们还没有找到很合适的非监督学习算法,非监督学习在未来存在着巨大的研究空间。
未来,随着科技的进步,当无监督学习技术越来越成熟时,人类将能够借助人工智能解决越来越多的难题。毫无疑问,今后,人工智能的进步将有赖于在无监督学习上取得突破!