蹭IJCAI2013会议学习记录

第一次蹭国际会议，哈哈，而且是高端霸气上档次的IJCAI，收获很大。

首先是第一天早上的Computers and Thought Award的获得者，大牛Kristen Grauman（居然是女子）关于图像的演讲。这里首先知道了图像也可以hash，这个下午看Poster才明白是怎么hash的，后面详述。然后是图像识别经历了很长的过程，在对象的识别上不断提升，但是在active learning上没有进步，具体也不知道什么意思。然后就是关于图像的特征学习和人的推理相结合，达到根据内容检索的类似的效果。其中有一个GRE类比让我印象深刻。老虎：狮子=斑马：驴子，前面的有斑纹，后面的没有。但是具体怎么实现的，速度慢到什么程度不是很清楚。

早上离得太远没看清楚，要不要这么漂亮。。。。

然后是百度深度学习研究院的招聘，可以投简历到idl_job@baidu.com，蒋凡的推荐系统签名赠书错过了，尼玛，20分钟就结束了，唉。另外3d打印，ABB机器人也很抢眼球。

然后是尽量不要去听lecture，尤其不要听母语非英文的人演讲，有问题也不方便问；最好听Poster，有人一对一的讲解。有什么不懂的，包括基础知识都可以问，主要遇到的人足够nice。

几个我印象深刻的Poster：

Online Hash：使用二维0、1向量来描述图像这种高纬度的数据，学习中用xor，速度很快，比PCA等快很多。适合于相关图像检索，目前对于稀疏数据还可以，80%，对于密集数据，就是相似度大的数据效果不好，只有30%正确率。

What Users Care about a Framework for Social Content Alignment: 关于Document comment topic model（DCT）。使用一个先验，假设comment是关于文章的或是无关的是随机的。然后是相关的建模。最后得到的效果不好，然后根据主题选取排名靠前的，给comment中相关的赋予高的权重，其他的低权重，然后效果比较好。使用svm，即使是已经label的数据也只有80%的正确率，作者的和这个比差一点，目前在svm里面算比较好的。这是清华博三的同学做的，我还没问完就跑了。不是很清楚。

Online Expectation Maximization for Reinforcement Learning in POMDPs(partially observed markov dynamic process): 使用卡尔曼滤波器。其Online的参数是emperical的，是随着数据增大而adaptive变化的。对于小数据不用调整，对于大量数据可能需要手工调整，这个地方的理论还没有做，只证明了收敛。主要用于决策模型。Miao Liu，本科也是华科的，读了两个硕士，现在杜克大学读博。

Learning Finite Beta-Liouville Mixture Models via Variational Bayes for Proportional Data Clustering：这个模型比狄里克莱模型更generalize。就是在狄里克莱模型上加了一个Beta分布，多了两个参数，可以对负数建模。使用这个函数做先验，在人脸表情上（使用了一个什么库，把feature变为0、1的整数表示）做了实验，分类效果较好。Wentao Fan，在加拿大某学校读了硕士接着读博，已经结婚。和我的方向比较相近。

Hierarchical Beyesian Matrix Factorization with Side Information：韩国的Yong-Deok Kim，非常nice，给我讲了一个小时，给别人也讲了很久。题目中的Hierarchical没有什么意义。使用了variational inference，只需要一个矩阵的存储，不能online，因为有两个隐变量，具体为什么我不太清楚，他试过但是没有成功，gibbs sampling的存储不够，每个矩阵i*j*t，t是时间，因为后面算出来的推荐系统矩阵需要平均。他的sideinformation作为最后矩阵分解的依据，引入了dependence，所以解法很复杂，貌似效果不错。

Non-negative Mutiple Matrix Factorization:NM2F，一上去就问和NMF的区别，现在又忘了。。多了一些auxiliary information，然后不记得了。。

Probablistic Matrix Factorization with Sparse Covariance Prior for Collaborative Filtering:浙大美女直博港中文，已经名花有主，而且不苟言笑。居然主要做图像。jiaya jia也是做图像的，主要是computer graphic生成，和汤晓鸥应该有很多交叉的。考虑到分解后信息的相关，比如age和history，在通常的矩阵分解法中引入分解后两个矩阵的协方差矩阵，然后对这两个协方差矩阵也进行估计，最后一起建模，效果比单纯的矩阵分解要好些，误差更小，而且迭代下降速度更快。。采用拉普拉斯分布，作为每个矩阵元素的prior，这个其实也是一个1-norm。

还有一个广告的，是cornel和其他各大公司研究院的，做的是卖广告的策略，经过各个agent的比价，最终收敛。作者很帅，但是超级严肃，太偏工程没人感兴趣。我看他可怜才去问的。。

还有一个motion detection的，根据event这个隐变量调节focus。还蛮有意思。这个领域全部都是他一个人做的。实验对比都是和自己比，sigh。。

另外注意bow在其他领域的应用。

posted on 2013-08-06 20:30 huashiyiqike 阅读(1297) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

蹭IJCAI2013会议学习记录

公告