Reading Club·Beijing第1期DeepQA框架与Siri架构会场笔记(PPT下载)

     读书会·北京第1期DeepQA框架与Siri架构会场笔记(含PPT下载)


前言

    读书会以"革新学术,砥厉品行,共同探讨,相互学习”为宗旨,不限主题,不限形式,重在创造或营造一种良好的学术气氛,和一种轻松的讨论氛围,以及持续深入探讨研究的持久热情。且现在市面上一般的官方活动基本都是华而不实,真正有价值的实质性的活动则少之又少。希望,读书会能众者兼顾。

    读书会,昨日已于清华园顺利举办第一期,希望日后持续举办下去(欢迎一切欲分享主讲之人联系我,尤其是最近刚出了新书的朋友)。下面,再极为简略的说下昨日下午读书会的举办情况(不了解读书会的朋友请先参看我的上一篇文章:http://blog.csdn.net/v_july_v/article/details/7237351)。

    首先非常感谢所有昨日于清华FIT楼参与读书会的朋友。大家的热情出乎我的意料(据签到人员名单统计,到会人数为160+,第2期及以后将控制人数,加大场地),现场氛围也非常好,虽然有将近一半的朋友因为没有座位而站完全场,但丝毫没有混乱的感觉。总体说来,还算不错。图为本人现场主持(谢谢@姐_夫提供的照片):


    OK,闲话少说,下面咱们来分别看看昨日读书会第1个主题:张栋的DeepQA,以及第2个主题:张俊林的Siri(本人主讲的第3个主题因时间不够现场取消,文末PPT下载部分含两个主题的PPT下载地址)。

一、张栋之DeepQA基本框架

    在此之前,我必须说明下,到底什么是DeepQA,可能有很多朋友如我一样,去听昨日的讲座讨论之前,是不知DeepQA为何物。其实,DeepQA很简单,Deep是深度的意思,QA即Q(question)& A(answer),一问一答,综合起来,便叫深度问答系统。

    简单的说,DeepQA就是IBM的一个人工智能解决方案,在许多问答竞赛类节目中胜过了人,试图去理解人类的问题,并从已有的知识库中找到答案,在众多答案中打分从而找到最佳答案。

    相信很快思维敏捷的朋友就会说到,一问一答?这不跟搜索引擎一个理么。

    搜索引擎的形式是,你向他查询什么问题,它便根据他的查询结果给出答案(当然,至于答案令不令你满意,或者你是否能找到合适的答案则又是另外一回事了)。如下图所示(张栋博士的PPT主要就是根据下面三张图而展开的):

    How Search Engine Solve Q&A?

    而这个DeepQA呢,有点像现实当中的技术支持/客服系统,而本身其自动语音服务就能解决相当一部分问题,不过DeepQA的目标决不仅仅是回答一些特定的简单问题,而是利用运算能力,融合信息检索、自然语言处理、知识表示及推理、机器学习、人机交互等相关技术,对现有数据加以分析来找出最佳答案。

    那么How DeepQASolve Q&A?如下图所示:

    原PPT的这段文字有点问题,我更正如下:DeepQA = Massively Parallel Probabilistic Evidence-Based Architecture Generates and scores many hypotheses using a combination of 1000’s of Natural Language Processing, Information Retrieval, Machine Learning and Reasoning Algorithms,These gather, evaluate, weigh and balance different types。

    大致意思是:深度问答系统, 建立了一套基于概率化证据的大规模并行架构,它综合利用数千种自然语言处理、信息检索、机器学习和推理算法,分析生成出多种假设,然后从中收集、评估、权衡各类证据,最终给出最佳答案。如下图所示:

    对于上面这张DeepQA的架构图,看下的由天蓝提琴所提供的汉化版,便一目了然了,如下:


    由于张栋更多的是侧重与现场各位讨论的形式进行,所以,核心细节并未涉及到太多(希望以后的读书会讲座能再讲得深入点)。

DeepQA后续讨论

    读书会·北京书友会官方交流群内的朋友cyqcyq提出了一系列问题:1、什么是evidence?什么是hypotheses?2、基于什么算法能把 施者|动作|受者 作为一个 evidence 或者 一个 hypotheses?3、靠什么算法把众多 施者|动作|受者 组合中靠谱的筛出来?4、谁来判断  施者|动作|受者 是 evidence?5、如果有人工干预怎么把这个判断量减少到最小?..

    关于Watson的答题过程可以参看来自上图作者天蓝提琴的此篇文章:http://www.guokr.com/watson/article/6643/其摘要如下:“看到watson在Jeopardy!预赛中的惊人表现,你是否好奇于watson是怎样看懂题目并得出答案的呢?难道watson真的能和人类一样思考问题?现在果壳网就以他回答的第一个问题为例,给大家解说一下watson看到问题并给出答案的全过程...”。

二、张俊林之Siri基本架构

    张俊林先生的PPT有43页,基本属于巨细,娓娓道来,主要讲了Siri的整体架构,其输入系统,以及从文本到意图和从意图到服务的主题,最后讲了下输出系统,以及Siri向何处去的等等问题。

    当然,涉及到更多的如语义分析的技术细节及其原理,讲座依然也未有涉及。

PPT下载

    昨日读书会第一期,第1个主题张栋的DeepQA PPT下载:;第2个主题张俊林的Siri基本架构 PPT下载:。updated:原来的微盘下载链接全部失效,正确的打包统一PPT免积分下载地址为http://download.csdn.net/detail/v_july_v/4061067。02.13.17:20分。

    参会的其中一位朋友左其盛所写的文章:在清华校园内的听的一场关于机器学习的演讲的一些笔记。欢迎参会的其它朋友继续分享现场笔记或照片,我一一贴下,已让更多的朋友了解。

后记

    由于昨日时间不允许,所以我现场取消了原计划自己制定的第3个主题:基础算法的学习。同时,对机器人感兴趣的可以在新浪微博上关注@小猴机器人。最后感谢所有参与读书会的朋友,感谢两位主讲的张大儒,感谢提供场地的清华天雷同学,感谢报名参加志愿者工作的朋友,感谢图灵教育的杨老师。

    下面是陈吉锆提供的现场照片,十分感谢(按出场先后顺序排序):

    更多请关注本人微博@周磊July,咱们下期再见(欢迎听众报名,主讲分享人报名,特别是最近出了新书的朋友,欢迎提供部分免费100+场地)。有任何问题,随时联系我,周磊July、二零一二年二月十三日。

    updated:读书会建站,迫切想为读书会建个网站,用于发布,报名,交流。我的想法是,有一两个懂前端的,花一个星期先弄个简单的原型,然后再花两三个月,渐渐成型。不急于求成,但求能先弄出来便行,方便你我,方便读书会的书友们交流,同时也为读书会能坚持下去之用。望懂前端的联系我。

    最后,读书会第2期主讲人初步确定:最新消息,@刘未鹏pongba 与项亮@xlvector_Hulu (推荐系统实践作者),初步定为将于4月中旬举办的读书会第2期的主讲分享人,@梁斌penny 亦可能会到场助阵,相信与第1期相比,不逊精彩,令人期待,:-)。2012.03.04

posted on 2012-02-13 14:48  July_  阅读(3137)  评论(0编辑  收藏  举报