求文本特征值、特征向量的研究


本科做的题目就是模式识别。正好重温一下。

 

首先对文本向量化,得到向量I, 例如是1*n的向量

 

然后求协方差矩阵 = I*IT, 得到n*n的矩阵, 那么如果有M个文本,就可以得到 Sum(I*IT)(1~M)= AAT

 

然后降维处理,得到ATA。这2个矩阵的特征值是相同的,特征向量关系:f= A*v ,f是前者的特征向量,v是后者的特征向量。

 

由于我只有1个文本,所以变换后的矩阵是个数,本质就是这个矩阵的模的平方。

 

。。。。搞了半天。。。。似乎没有什么用。不过由于不用求特征值和特征向量,那么算法就很简单了。 

 

posted @     阅读(642)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述
IT民工
点击右上角即可分享
微信分享提示