Matlab计算矩阵间距离
夜深人静时分,宿舍就我自己,只有蚊子陪伴着我,我慢慢码下这段文字............
感觉知识结构不完善:上学期看论文,发现类间离散度矩阵和类内离散度矩阵,然后百度,找不到,现在学模式识别,见了,发现是数学公司,不过老师不讲........
一.问题来源
今天有个意想不到的收货,下午讲课的时候遇到一个人主动加我,来自南京信息工程大学的某X(处于隐私保护,未经李某X同意,笔者不敢公开其信息),下面是他的话:很久没去博客园了。。。。现在只有matlab版本的一些hash算法;我现在主要就是在研究基于hash的图像检索,如果你有需要的话,可以给你一些资料。
我们俩交流了很多.......从实验室,到研究课题,到LOL,笔者深深为他渊博的学识和不俗的谈吐所打动,恩恩,遇到志同道合的人挺不容易的........最重要的是感谢他的开源精神,给我了很多我急需的资料和代码。在此,也感谢博客园提供的这个平台,让我们在这茫茫人海中有了相知相识的机会,哈哈,这其实就是局部敏感哈希的思想——在茫茫人海中发现相似的你啊,爱你们.............
该篇博客来自于某X分享的代码,我产生了写此篇博文的灵感。
二.问题解析
实现矩阵间任意行之间的欧式距离。通俗地说如下:两个点的距离知道吧,矩阵是类似的原理,求X1和X2矩阵的距离,假设得到的结果矩阵为C,那么C的下标ij表示的是X1中的第i行和X2中的第j行的距离。
2.1 方法1
if nargin == 2
P1 = double(P1);
P2 = double(P2);
X1=repmat(sum(P1.^2,2),[1 size(P2,1)]);%sum(x,2):横向相加,得到列向量;sum(x),默认为竖向相加。
X2=repmat(sum(P2.^2,2),[1 size(P1,1)]);
R=P1*P2';
D=real(sqrt(X1+X2'-2*R));
else
P1 = double(P1);
% each vector is one row
X1=repmat(sum(P1.^2,2),[1 size(P1,1)]);
R=P1*P1';
D=X1+X1'-2*R;
D = real(sqrt(D));
end
加入p1:100*256,p2:5900*256,那么x1:100*5900,x25900*100,R:5900*100。
repmat表示复制和平铺,sum(P1.^2,2)就是每个元素先平方,然后每行求和,就变成一个列向量;求矩阵X1和X2的距离:类似于(A-B)^2 = A^2+B^2-2AB然后开根号;matlab里面调用repmat(a,m,n)命令:三个参数的含义:a:要被复制的矩阵或者向量,m复制成多少行,n复制成多少列。就是把a复制成m行,n列。[1 size(P2,1)]:这个就是将sum(P1.^2,2)得到的列向量复制一行,size(p2,1)列。
不计算距离如何知道样本是不是紧邻呀,这个就是欧式距离度量紧邻与否。紧邻与否可以通过语意度量,也可以通过距离度量,欧式距就是其中一种。
2.2 方法2
写到上面,我想起了王老师写的k-means(链接),那时候第一次接触repmat函数。
%repmat 即 Replicate Matrix ,复制和平铺矩阵,是 MATLAB 里面的一个函数。
%B = repmat(A,m,n)将矩阵 A 复制 m×n 块,即把 A 作为 B 的元素,B 由 m×n 个 A 平铺而成。B 的维数是 [size(A,1)*m, size(A,2)*n] 。
%点乘方a.^b,矩阵a中每个元素按b中对应元素乘方或者b是常数
%sum(x,2)表示矩阵x的横向相加,求每行的和,结果是列向量。 而缺省的sum(x)就是竖向相加,求每列的和,结果是行向量。
dist = sum((repmat(x(i,:),k,1)-nc).^2,2);
2.3 方法3
直接饮用小伙伴们的问题。
比如说,A阵是20*10,B阵是30*10的,A阵的20个行向量和B阵中的30个行向量计算欧式距,得到20*30的欧式距离矩阵C这个应该怎么写?
我每次写出来的C阵每行都是相同的 简直郁闷死了,请教大牛~
clear all
%你可以定义自己的A,B矩阵,下面的矩阵仅作为例子
A=zeros(20,10);
B=ones(30,10);
%Dist距离矩阵
Dist=zeros(20,30);
for i=1:20
for j=1:30
Dist(i,j)=norm(A(i,:)-B(j,:));
end
end
2.4 方法4
Dist = sqrt(A.^2*ones(size(B'))+ones(size(A))*(B').^2-2*A*B')
这个和方法1,异曲同工。而且,据传,此方法较快。
2.5 方法五
for i = 1:size(X,1) Distance(i,:) = diag((repmat(X(i,:),n,1)-X)*(repmat(X(i,:),n,1)-X)'); end
三.结束语
看了这么久的LSH,苦于没有合适的代码,很痛苦,给国内的某些大牛写信,从来没收到过回信,给国外的大牛写信基本当天就会回信..........这算是国内外学者的精神风貌不同吧........正式这个原因,我慢慢想着摒弃开源,恩恩,感谢某X,让我有了继续开源的精神动力,人生路上就是需要这类人的陪伴.....从长远来源,笔者认为开源更有意义,也更能体现自己的价值.......每次我说我不懂,别人说我谦虚,其实我是真的不懂.....知道个大概,对面其实是一种误导.......不过有时候也挺佩服自己能坚持下来...........笔者的目标是——互联网行业布道者,欢迎志同道合的人和我联系............晚安~~~
参考文献:IloveMatlab社区,百度知道,某X语录。