【AI开发第一步】微软认知服务API应用
目录
从3月份Google家的阿尔法狗打败韩国围棋冠军选手李世石,到之后微软Build2016大会宣布的“智能机器人”战略。种种迹象表明未来慢慢会进入“人工智能”时代,人工智能不再像以前那样听起来高大上,普通的码农屌丝也能开发出具备人类智慧的APP。听起来是不是很叼?
以前是这样的:
You:吴博士,您研究的主要方向是撒?
吴博士:人工智能。
You:挖槽,好叼。你觉得未来机器人会不会控制人类呢?
吴博士:......
现在是这样的:
You:博士来来来,看看我这个App(将‘高富帅’才会用的肾8递过去)。
吴博士:嗯,很普通嘛。有什么特别的吗?
You:用它自拍一下试试...
吴博士:(拍完照)。窝草,它怎么认识我姓Wu?年龄显示也太大了吧,我才42啊!
You:博士,这是一个具备'人类意识'的App额...博士你听,它从你脸色判断出你常年肾透支啊...
吴博士:......
借用微软认知服务官网上的一段话:
“
Give your Apps a human side
Knock down barriers between you and your ideas. Enable natural and contextual interaction with tools that augment users' experiences via the power of machine-based AI. Plug them in and bring your ideas to life.
”
翻译过来大概是:
“
让你的应用拥有人的智慧
你的想法不再只是想法。基于机器学习的人工智能使自然的和基于语境的人机交互变为可能,为你的应用增强用户体验。现在你就可以在你的应用中接入这些智能,把你的想法变成现实。
”
微软已经公开了“认知服务”的一些API,用起来特别简单,NuGet上有现成的Package。主要分为5大类:
-
视觉类
-
语音类
-
语言类
-
知识类
-
搜索类
以上5大类中,每类API都可以免费试用,当然有次数限制。对于那种想体验一下的童鞋完全够用,如果想要大范围商用,花钱买也行。
废话说太多,还是要上点干货。
空余时间利用“视觉”类API做了一个Demo。具备以下功能:
- 图片分析。描述图片、给图片贴Tags、判断图片是否涉黄、找出图片中的人脸等等;
- 人脸分析。判断人脸年龄、性别(跟How-Old颜值相机类似);
- 人脸情绪分析。判断每张脸的表情,是否‘生气’、‘高兴’、‘惊讶’...
可以说功能强大,呵呵,至少比how-old颜值相机功能大一点 :)
源码下载(干活):
https://github.com/sherlockchou86/ComputerVision.UWP
手机上也可以运行,图片有三种方式:URL网络图片、本地上传、以及相机拍照。都有对应的API。没有做成App上传到Store,感觉界面并不太友好,只适合开发人员看看而已。
【1】人脸识别
【2】情绪分析
【3】图片描述(注意description中的内容,直接可以识别图中人物为川普)
【4】判断图片是否涉黄(虽然图中adult content为false,但是racy content为true,说明露得不是很多)
【5】给图片打标签(分类),可以看到,非常准确
本文仅介绍了跟“视觉”有关的API使用方法,大概就相当于人类的“眼睛”。其他诸如“嘴巴说话”、“大脑分析语音”、“理解文本”以及“掌握知识”等一系列API暂未涉及到。本文仅是开端,大家可以试试其他:)
开源有益,多谢点赞!