Fork me on GitHub

  第一次蹭国际会议,哈哈,而且是高端霸气上档次的IJCAI,收获很大。

  首先是第一天早上的Computers and Thought Award的获得者,大牛Kristen Grauman(居然是女子)关于图像的演讲。这里首先知道了图像也可以hash,这个下午看Poster才明白是怎么hash的,后面详述。然后是图像识别经历了很长的过程,在对象的识别上不断提升,但是在active learning上没有进步,具体也不知道什么意思。然后就是关于图像的特征学习和人的推理相结合,达到根据内容检索的类似的效果。其中有一个GRE类比让我印象深刻。老虎:狮子=斑马:驴子,前面的有斑纹,后面的没有。但是具体怎么实现的,速度慢到什么程度不是很清楚。

早上离得太远没看清楚,要不要这么漂亮。。。。

 

  然后是百度深度学习研究院的招聘,可以投简历到idl_job@baidu.com,蒋凡的推荐系统签名赠书错过了,尼玛,20分钟就结束了,唉。另外3d打印,ABB机器人也很抢眼球。

  然后是尽量不要去听lecture,尤其不要听母语非英文的人演讲,有问题也不方便问;最好听Poster,有人一对一的讲解。有什么不懂的,包括基础知识都可以问,主要遇到的人足够nice。

 几个我印象深刻的Poster:

  Online Hash:使用二维0、1向量来描述图像这种高纬度的数据,学习中用xor,速度很快,比PCA等快很多。适合于相关图像检索,目前对于稀疏数据还可以,80%,对于密集数据,就是相似度大的数据效果不好,只有30%正确率。

  What Users Care about a Framework for Social Content Alignment: 关于Document comment topic model(DCT)。使用一个先验,假设comment是关于文章的或是无关的是随机的。然后是相关的建模。最后得到的效果不好,然后根据主题选取排名靠前的,给comment中相关的赋予高的权重,其他的低权重,然后效果比较好。使用svm,即使是已经label的数据也只有80%的正确率,作者的和这个比差一点,目前在svm里面算比较好的。这是清华博三的同学做的,我还没问完就跑了。不是很清楚。

  Online Expectation Maximization for Reinforcement Learning in POMDPs(partially observed markov dynamic process): 使用卡尔曼滤波器。其Online的参数是emperical的,是随着数据增大而adaptive变化的。对于小数据不用调整,对于大量数据可能需要手工调整,这个地方的理论还没有做,只证明了收敛。主要用于决策模型。Miao Liu,本科也是华科的,读了两个硕士,现在杜克大学读博。

  Learning Finite Beta-Liouville Mixture Models via Variational Bayes for Proportional Data Clustering:这个模型比狄里克莱模型更generalize。就是在狄里克莱模型上加了一个Beta分布,多了两个参数,可以对负数建模。使用这个函数做先验,在人脸表情上(使用了一个什么库,把feature变为0、1的整数表示)做了实验,分类效果较好。Wentao Fan,在加拿大某学校读了硕士接着读博,已经结婚。和我的方向比较相近。

  Hierarchical Beyesian Matrix Factorization with Side Information:韩国的Yong-Deok Kim,非常nice,给我讲了一个小时,给别人也讲了很久。题目中的Hierarchical没有什么意义。 使用了variational inference,只需要一个矩阵的存储,不能online,因为有两个隐变量,具体为什么我不太清楚,他试过但是没有成功,gibbs sampling的存储不够,每个矩阵i*j*t,t是时间,因为后面算出来的推荐系统矩阵需要平均。他的sideinformation作为最后矩阵分解的依据,引入了dependence,所以解法很复杂,貌似效果不错。

  Non-negative Mutiple Matrix Factorization:NM2F,一上去就问和NMF的区别,现在又忘了。。多了一些auxiliary information,然后不记得了。。

  Probablistic Matrix Factorization with Sparse Covariance Prior for Collaborative Filtering:浙大美女直博港中文,已经名花有主,而且不苟言笑。居然主要做图像。jiaya jia也是做图像的,主要是computer graphic生成,和汤晓鸥应该有很多交叉的。考虑到分解后信息的相关,比如age和history,在通常的矩阵分解法中引入分解后两个矩阵的协方差矩阵,然后对这两个协方差矩阵也进行估计,最后一起建模,效果比单纯的矩阵分解要好些,误差更小,而且迭代下降速度更快。。采用拉普拉斯分布,作为每个矩阵元素的prior,这个其实也是一个1-norm。

 

还有一个广告的,是cornel和其他各大公司研究院的,做的是卖广告的策略,经过各个agent的比价,最终收敛。作者很帅,但是超级严肃,太偏工程没人感兴趣。我看他可怜才去问的。。

还有一个motion detection的,根据event这个隐变量调节focus。还蛮有意思。这个领域全部都是他一个人做的。实验对比都是和自己比,sigh。。

 

另外注意bow在其他领域的应用。

 

 

 

 

 

 

 

 

posted on 2013-08-06 20:30  huashiyiqike  阅读(1298)  评论(0编辑  收藏  举报