Matrix Completion with Noise

Candes E J, Plan Y. Matrix Completion With Noise[J]. arXiv: Information Theory, 2010, 98(6): 925-936.

这篇文章,同一个人(团队?)写的,遗憾的是,没怎么看懂。怎么说呢,里面的关于对偶的性质实在不知道从何入手,但想来还是得记一笔。

这篇文章,讨论的是这样的一个问题,有一个矩阵MRn1×n2,但是因为种种原因,我们只能知晓其中的一部分元素即PΩ(M),那么问题来了,有没有办法能够恢复M呢,或者说在什么条件下我们能恢复M呢(实际上,这个问题好像是作者前一篇论文已经给出了答案)?然后,又有新的困难,因为我们的观测是有误差的,也就是说我们观测到的实际上不是PΩ(M),而是PΩ(M+Z)
作者总拿Netflix举例子,类似地,我们可以用网易云来举例子(虽然估计网易云的推荐方法和这个并没有啥大关系)。

我们可以这么想,M的每一行是一个用户,每一列是一首歌,其中的每一个元素是该用户给这首歌打的分(当然,这个分可能是通过一些操作的判断的,比如收藏,评论,下载,是否跳过等等)。显然,一个用户不可能听过里面的所有的歌,一首歌也没法让所有人都听(打分),所以,我们所见识到的是PΩ(M),一个稀疏的矩阵。然而,推荐歌曲,关注的就是那些用户没有听过的但可能被打高分的歌,所以我们要做的就是利用PΩ(M)恢复出M。听起来的确蛮好玩的。

然后问题是,恢复需要什么前提。很显然,如果一首歌没有被人听过,或者该用户没有听过任何歌,肯定没法把分数恢复出来,因为这跟瞎猜没分别,所以,假设就是M低秩,但是每行每列不能全为零。

和之前一样,作者采用不连贯条件来描述:
在这里插入图片描述

恢复1

本来,是应该求解下述问题的:

在这里插入图片描述
但是,这个问题很难求解(NP-hard)。

然后rank的凸放松是核范数,所以:

在这里插入图片描述

核范数与SDP

核范数与SDP

然后,作者指出,核范数可以通过对偶,转换成一个半正定规范问题(看这篇论文最大的收获吧)。

XyW1W2使M:=[W1XXTW2]0,TrW1+TrW22y

先来前推后,只要构造出这么一个W1就可以了。假设X=UΣVT,ΣRr×rW1=UΣUT,W2=VΣVT。那么,TrW1+TrW22y容易证明,第一个条件这么来玩:

[z1T,z2T][W1XXTW2][z1z2]

再令a=UTz1,b=VTz2,可得:

[z1T,z2T][W1XXTW2][z1z2]=(a+b)TΣ(a+b)0

对于任意的z1,z2成立,所以半正定条件也得证了。

好了,现在来反推:
X=sup{Tr(XTW)|W1},其中表示谱范数。
注意ATr(A),当A为半正定矩阵的时候。
所以

MTr(M)=Tr(W1+W2)2y

M=sup{Tr(MTW)|W1},所以

Tr(MTW)2y

N:=[UT00VT]M[0In1×n1In2×n20][V00U]=[ΣUTW1UVTW2VΣ]

W=[0In1×n1In2×n20][V00U][UT00VT]=[0UVTVUT0]

容易证明W1,所以Tr(N)=Tr(MTW)=2X2y,故Xy得证。但愿没出错。。。

然后,论文就给出了第一个定理,关于恢复的:
在这里插入图片描述
这个结果貌似是之前的工作,,满足一定条件,M就会有很大概率被恢复。

然后呢,论文又提了以下加强版的不连贯条件:
在这里插入图片描述
然后有相应的定理2:

在这里插入图片描述

然后跳过。

稳定恢复

用户的评分是不一定正确,不同的场合,不同的天气可能就会给出不同的分数,如果是机器推断的分数那就更是如此了。所以,我们观测的部分数据实际上不一定是PΩ(M),而是PΩ(Y)=PΩ(M+Z),其中Z是类似噪声的存在。
假设,PΩ(Z)Fδ,求解下列问题:

minXs.t.PΩ(XY)Fδ

这个问题同样可以作为SDP求解,假设其解为M^。有如下定理:

在这里插入图片描述
但是问题是,我们从何知道δ呢?而在实际操作的时候,作者是求解下述问题:

min12PΩ(XY)F2+μX

作者说,这个问题是上面那个问题的对偶结果,饶了我吧,有点像,但是整不出来。然后,不同的情况,作者也给出了μ的一些选择。

作者还拿上面的结果和下面的神谕问题进行了比较:
在这里插入图片描述
这个神谕,就是指,我们已经知道XT里面了,然后用了对偶还是共轭算子?晕了已经。就这样吧,再看我就得吐了。

posted @   馒头and花卷  阅读(282)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示