吴军| 智能时代
智能时代
科学研究发展的四个范式,
- 即描述自然现象的实验科学、
- 以牛顿定律和麦克斯韦方程等为代表的理论科学、
- 模拟复杂现象的计算科学
- 数据密集型科学
大数据是解决不确定性的良药 “用不确定的眼光看待世界,再用信息来消除这种不确定性”,是大数据 解决智能问题的本质。
吴军博士在书中提到 了世界的不确定性来自两 个方面,一是 影响世界的变量太多以至于无法用数学 模型来描述;
二是 来自客观世界本身:不 确定性是我们所在宇宙的特性。因此,用机械论已经完全无法对未来进行预测。
香农,这位不世出的天才,则通过借 用热力学中“熵”的概念,引入“信息熵”, 用信息论将世界的不确定性与信息联系 在了一起。这个建立在 不确定性上的理 论,正是今天人类研究大数据与机器智能的基石。 解
决智能问题,就是将问题转化为消除不确定性的问题,大数据则是解决不确定性问题的良药。可以预见,在这里会诞生无数的机会。
计算机之所以能战胜人类,是因为 机器获得智能的方式和人类不同, 它不是靠逻辑推理,而是靠大数据和智能算 法。在数据方面,Google 使用了几十万 盘围棋高手之间对弈的数据来训练 AlphaGo,这是它获得
所谓的“智能”的 原因。在计算方面,Google采用了上万 台服务器来训 练AlphaGo下棋的模型, 并且让不同版本的AlphaGo相互对弈了 上千万 盘,这才保证它能做到“算无遗 策”。具体到下棋的策略,AlphaGo里
面有两个关键的技术。
- 第一个关键技术是把棋盘上当前的状态变成一 个获胜概率 的数学模型,这个模型里面没有任何人工的规则,而是完全靠前面所说的数据 训练出来的。
- 第二个关键技术是启发式 搜索算法一一蒙特卡罗树搜索算法 (Monte Carlo Tree Search),它能将 搜索的空间 限制在非常有限的范围内, 保证计算机能够快速找到好的下法。
信息是关于世界、人和事的描述,它 比数据来得抽象。信息既可以是人类创造的,也可以是天然存在的客观事实,不过信息有时藏在事物的背后, 需要挖掘和测量才能得到;
数据和信息还是稍有不同,虽然数据最大的作用在于承载信息, 但是并非所有的数据都承载了有意义的信息。 数据本身是人造物,因此它们可以被随意制造,甚至可以被伪造。没有信息的数 据通常没有太大意
义。有用的 数据、毫无意义的数据和伪造的数据常 常 是混在一起的,后面两种数据无疑会 干扰我们从数据中获取有用的信 息,因 此如何处理数据,过滤掉没有用的噪声 和删除有害的数据,从 而获取数据背后
的信息,就成为技术甚至是一种艺术。只 有善用数 据,我们才能够得到意想不到 的惊喜,即数据背后的信息。
只要数据量足够,就可以用若干个简单的模型 取代 一个复杂的模型。这种方法被称为数据 驱动方法
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
2020-01-30 即时查询工具| Druid
2019-01-30 Redis数据库 02事务| 持久化| 主从复制| 集群