CAAI论坛(20.5.16北京站):《大数据与人工智能》---大数据驱动的智能服务技术与应用 听阅总结

    有幸听了此次CAAI论坛北京站。此次论坛主题为:大数据驱动的智能服务技术与应用  ,一共有9场分享,覆盖了学术和企业,从大数据的发展概述到大数据与人工智能在交通、医疗、金融中的应用。由于每个报告分享时间实在有限,总体而言讲的比较宽泛,多是方向性的,也有少数具体讲解的。

    没有ppt,这些内容是我对直播的加工,而且我离开了几次,内容可能不全,记录只是为了偶尔“复习”和为大家分享。

    一,杜小勇(人大):

      主题:数据危机与数据治理

      要点:

      1.数据危机:数据需求与数据价值开发不充分的矛盾

       表现:(1):数据属性不明;(2)数据垄断,共享性差,数据服务过于依赖平台;(3)数据流通性差,数据边界明显;(4)数据质量过低;(5)隐私安全问题;(6)其他。。。。(没有了或者我忘记了)

      2,发展面临的挑战:(1)理论体系不成熟;(2)技术滞后(也就是技术发展相较于数据量的增长而言太慢);(3)人才缺口;大数据人才为新兴专业人才,要求与技术能力不明确。

      3,未来:(1)形成新学科:例如数据工程之类;(2)数据治理(本来是很大一块,可惜我上厕所去了)。

    二,李飞飞(阿里):

      主题:大数据与数据库系统的融合

      要点:

      1,云原生数据库与分布式大数据相比,弹性与池化能力更强;

      2,大数据与数据库实时结合,例如HTAP,将大数据呈现于数据库系统做到及时对接,实现FASTdata;

      3,   计算与数据查询一体化,采用自然语言来“替代”SQL语言等(易于操作,但是个人理解并不是取代,而是用户自然语言操作,系统自动转化为SQL)、数据湖模式

    三,童咏昕(北航):

      主题:大数据智能出行服务

      童教授主要讲了他们的一个智能的“叫车”分单系统的研究过程

      1,采用匹配问题建模(如匈牙利算法等),但是存在不能动态性处理的问题;

      2, 最近邻模型,具有许多理论基础;但是有离线和在线的处理问题;

      3,以(在线算法成本/离线算法成本)为优化目标,得到了与以往理论不一致的实验效果:贪心最优。并且加权比为:3.195

      4, 利用机器学习进行实时的自适应学习:也就是设置一个自适应的匹配时间窗,在不同车流与人流下自适应最优。

      5,挑战:车流人流低估的激励机制;用户位置隐私的保护;假设仿真环境而不是运用实际平台测试算法。

    四,沈超(西交)

      主题:大数据驱动的网络空间行为分析和异常检测

      没有技术讲解,重点在应用。对于这个报告挺害怕的,感受到了大数据对群体或者个人的监管,通过假隐私数据形成了“隐私数据”。

      应用1:网络舆情的监管与分析(包括热点分析、舆情主要力量分析、水军检测)。

      应用2:犯罪预测和用户画像形成、匿名关联。这个简直令人瑟瑟发抖,这个可以通过生成用户画像,感觉有将匿名用户做到实名匹配的能力!

      应用3: 虚拟货币交易管理与识别,解决刷虚拟货币的问题。~~又是鹅厂。

    五,李文玲(北航)

      主题以及内容:基于多源数据的群体协作与跟踪服务(个人理解就是通过群体位置加权得到更准确的位置)

 

    六,任文涛(中科院信息研究所)

      主题以及内容:先验智能对于图像增强的应用。

    七,杨全柱(东北大学)

      主题以及内容:基于医学影像数据的智能诊断服务(智能技术使心脑血管影像更加形象化)

    八,陈成才(小i机器人研究院院长)

      主题以及内容:作为商业人员,重点讲述了智能服务的应用场景;金融是有巨大应用的需求;真正将智能产业化、应用到生产中对其发展大有裨益。

    九,没看,吃夜宵去了。

posted @ 2020-05-16 14:02  无极183  阅读(391)  评论(0编辑  收藏  举报
/*
*/