Fork me on GitHub

吴军| 智能时代

智能时代

 科学研究发展的四个范式,

  • 即描述自然现象的实验科学、
  • 以牛顿定律和麦克斯韦方程等为代表的理论科学、
  • 模拟复杂现象的计算科学
  • 数据密集型科学

大数据是解决不确定性的良药 “用不确定的眼光看待世界,再用信息来消除这种不确定性”,是大数据 解决智能问题的本质。

吴军博士在书中提到 了世界的不确定性来自两 个方面,一是 影响世界的变量太多以至于无法用数学 模型来描述;

二是 来自客观世界本身:不 确定性是我们所在宇宙的特性。因此,用机械论已经完全无法对未来进行预测。

香农,这位不世出的天才,则通过借 用热力学中“熵”的概念,引入“信息熵”, 用信息论将世界的不确定性与信息联系 在了一起。这个建立在 不确定性上的理 论,正是今天人类研究大数据与机器智能的基石。 解

决智能问题,就是将问题转化为消除不确定性的问题,大数据则是解决不确定性问题的良药。可以预见,在这里会诞生无数的机会。

计算机之所以能战胜人类,是因为 机器获得智能的方式和人类不同, 它不是靠逻辑推理,而是靠大数据和智能算 法。在数据方面,Google 使用了几十万 盘围棋高手之间对弈的数据来训练 AlphaGo,这是它获得

所谓的“智能”的 原因。在计算方面,Google采用了上万 台服务器来训 练AlphaGo下棋的模型, 并且让不同版本的AlphaGo相互对弈了 上千万 盘,这才保证它能做到“算无遗 策”。具体到下棋的策略,AlphaGo里

面有两个关键的技术。

  • 第一个关键技术是把棋盘上当前的状态变成一 个获胜概率 的数学模型,这个模型里面没有任何人工的规则,而是完全靠前面所说的数据 训练出来的。
  • 第二个关键技术是启发式 搜索算法一一蒙特卡罗树搜索算法 (Monte Carlo Tree Search),它能将 搜索的空间 限制在非常有限的范围内, 保证计算机能够快速找到好的下法。

 

信息是关于世界、人和事的描述,它 比数据来得抽象。信息既可以是人类创造的,也可以是天然存在的客观事实,不过信息有时藏在事物的背后, 需要挖掘和测量才能得到;

数据和信息还是稍有不同,虽然数据最大的作用在于承载信息, 但是并非所有的数据都承载了有意义的信息。 数据本身是人造物,因此它们可以被随意制造,甚至可以被伪造。没有信息的数 据通常没有太大意

义。有用的 数据、毫无意义的数据和伪造的数据常 常 是混在一起的,后面两种数据无疑会 干扰我们从数据中获取有用的信 息,因 此如何处理数据,过滤掉没有用的噪声 和删除有害的数据,从 而获取数据背后

的信息,就成为技术甚至是一种艺术。只 有善用数 据,我们才能够得到意想不到 的惊喜,即数据背后的信息。

只要数据量足够,就可以用若干个简单的模型 取代 一个复杂的模型。这种方法被称为数据 驱动方法

 

posted @   kris12  阅读(693)  评论(1编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
历史上的今天:
2020-01-30 即时查询工具| Druid
2019-01-30 Redis数据库 02事务| 持久化| 主从复制| 集群
levels of contents
点击右上角即可分享
微信分享提示