近年来,中国人工智能高速发展。无人超市、无人物流、无人加油站、无人驾驶、无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。在这些令人诧异和振奋的事件背后,离不开计算机视觉、自然语言处理、生物特征识别及知识图谱等人工智能关键技术。可以说,在人工智能产业中,技术是连接芯片和应用场景的纽带,决定了产品的智能化程度。
计算机视觉
人工智能系统的大门
根据实际解决的问题, 计算机视觉技术可分为 人脸识别、图像检测、图像检索、目标跟踪、风格迁移 等几大板块。 其中,人脸识别、图像分类等功能计算机视觉技术已经比人类视觉更精准、更迅速。在医院,一般早期食管癌检出率低于 10% ,而腾讯觅影通过扫描上消化道内镜图片筛查食管癌,检出率高达 90% ,且用时不到 4 秒。商汤科技宣称,利用其计算机视觉技术,视频内容审核能够节省 99% 的人工。
然而,虽然在解决识别、检测、聚类等问题上,计算机视觉已经可以超越人类,但其发展仍面临挑战。
首先, 缺乏可用于人工智能模型训练的大规模数据集。缺乏标注数据是几乎所有应用场景普遍存在的挑战。当前的应用场景多以项目制形式落地,数据仍然在项目建设方,数据不能共享也无法形成闭环,也就导致技术的进步分散在各个企业的各个项目中,难以带来行业整体跨越。
其次, 缺乏从技术到产品到规模化应用的工程化经验。计算机视觉技术的应用已不再是单一的软件应用,涉及到新型基础架构,涉及到新的数据分析流程,还涉及到智能硬件如摄像头的安装等等。每一个环节都可能会影响识别效果。将这一技术从实验室扩展到工业化应用的过程本身就是很大的挑战。
自然语言处理
中国领先的人工智能技术
一个完整的自然语言处理系统包含 语音识别、语义识别、语音合成 三部分。 其中,国内企业在语音识别和语音合成已处世界领先地位。
语音识别 是指让计算机“听到”人的语音,目前已经比较成熟,尤其汉语的语音识别领先英语。根据2017年IBM、谷歌和微软发布的词错率进展数据,他们的识别率均在94%-95%之间,而在此之前,国内语音识别企业,如百度、搜狗、科大讯飞,识别率均已达到97%左右。
语音合成 是指计算机将准备“回复”给人类的语句,通过合成音频的形式,利用扬声器外放。百度地图的语音导航、苹果手机的Siri助手背后都利用了语音合成技术,这项技术已日臻成熟。当前,科大讯飞的语音合成技术代表了世界领先水平。2018年科大讯飞打败卡内基梅隆等众多高校、科研机构和企业,连续13年赢得Blizzard Challenge(国际语音合成大赛)冠军。
区别于语音识别“ 听到” 人类语言,语义识别更加强调“ 听懂” 。 当用户对智能系统说出一个饭店的名字,系统对用户语音进行识别,搜索饭店,这是“语音识别”;当用户对智能系统说“自助餐”、“海鲜”、“连锁店”等模糊语句,智能系统根据用户的性别、爱好、饮食倾向等特征进行智能分析,并精准推荐,则是“语义分析”。可见,语义识别比语音识别技术难度高好几个层次。
语义识别 是当前自然语言处理发展的瓶颈,仍处于初级研究阶段。由于目前的人工智能技术只能把音变成字,字变成音,不能理解其中含义,很难实现基于场景的生动会话,商业落地的场景十分有限。
知识图谱
人工智能的下一技术风口
知识图谱 最初是由Google 公司在 2012 年提出来的一个新的概念。从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络( Semantic Network )的知识库”。但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图( Multi-relational Graph )。如果说以往的智能分析专注在每一个个体,知识图谱则专注于这些个体之间的 “ 关系 ” 。知识图谱用 “ 图 ” 的表达形式,最有效、最直观地表达出实体间的关系,是最接近真实世界、符合人类思维模式的数据组织结构。
相较于传统的智能分析, 知识图谱是基于图的数据结构,即知识图谱需要从海量信息中抽去多个维度的特征信息, 并在这些特征信息素材的基础上,通过智能推理实现从数据到可视化图像深加工,从而能够直观易懂的展现给用户,并与用户交互。
目前, 知识图谱主要应用于面向 互联网的搜索、推荐、问答 等业务场景,成为以 商业搜索引擎公司 为首的互联网公司重兵布局的人工智能技术之一。 同时,也开始在金融、医疗、电商及公共安全保障等领域得到广泛的探索。当我们使用搜索软件时,搜索结果右侧的联想,就来自于知识图谱技术。在反洗钱或电信诈骗场景,知识图谱可精准追踪卡与卡间的交易路径,追本溯源识别洗钱/套现路径和可疑人员,并通过他们的交易轨迹,层层关联,分析得到更多可疑人员、账户、商户或卡号等实体。
然而, 目前知识图谱尚处于发展初期,受制于抽取数据的样本量限制、深加工准确率和效率较低、数据噪声大等因素限制,应用场景非常有限 。相信未来,随着研究的深入,会有越来越多的应用场景被发掘出来,对于知识图谱所能发挥的价值可期。
虽然人工智能在图像识别、语音识别、文本处理、游戏博弈等诸多方面全面赶超人类,取得了突破性进展,但整体来看其还是在婴幼儿时期, 远未达到人们所预期的智能水平,也远未到成熟的地步。相信未 来,随着时代的进步,技术瓶颈将不断被突破,人工智能的发展将更加多元化,更多的黑科技会使得我们的生活更智能。