orion-orion - 博客园

2023年10月19日

摘要：

K为图G的MarKov转移算子，则我们称算子L = I - K为图G的（归一化）Laplacian算子。通过研究L，我们就能把握Laplacian二次型E[f]=⟨f, Lf⟩的特性，从而把握图G的特性，这是谱图理论中至关重要的一点。事实上，我们可以找到Laplacian算子的n个相互正交的规范化特征向量（范数为1）及其对应的特征值。而这事实上和我们在线性代数课程中所学过的谱定理密切相关。我们前面证明过Markov转移算子K是自伴的，则L=I−K也是自伴的（事实上，又由于⟨f, Lf⟩⩾0，L还是半正定的）。阅读全文

posted @ 2023-10-19 00:24 orion-orion 阅读(658) 评论(0) 推荐(0) 编辑

2023年9月27日

谱图论：Laplacian二次型和Markov转移算子

摘要：

以下部分是我学习CMU 15-751: TCS Toolkit的课堂笔记。接下来将要介绍的是谱图论（spectral graph theory）的关键，也就是Laplacian二次型（Laplacian quadratic form）。直观地理解，Laplacian二次型刻画了图的“能量”（energy）。它在其它语境下，又被称为Dirichlet形式（Dirichlet form），局部方差（local variance），解析边界大小（analytic boundary size）。直觉上，其值越小，也就意味着f更加“光滑”（smooth），即其值不会沿着边变化得太剧烈。阅读全文

posted @ 2023-09-27 00:32 orion-orion 阅读(458) 评论(0) 推荐(0) 编辑

2023年9月21日

迁移学习：互信息的变分上下界

摘要：

在机器学习，尤其是涉及异构数据的迁移学习/联邦学习中，我们常常会涉及互信息相关的优化项，我上半年的第一份工作也是致力于此。其思想虽然简单，但其具体的估计与优化手段而言却大有门道，我们今天来好好总结一下，也算是对我研一下学期一个收尾。为了解决互信息估计的的难解性，我们的方法是不直接对互信息进行估计，而是采用变分近似的手段，来得出互信息的下界/上界做为近似，转而对互信息的下界/上界进行最大化/最小化。阅读全文

posted @ 2023-09-21 00:22 orion-orion 阅读(2372) 评论(6) 推荐(3) 编辑

2023年5月21日

SICP：惰性求值、流和尾递归（Python实现）

摘要：

在上一篇博客中，我们介绍了用Python对来实现一个Scheme求值器。然而，我们跳过了部分特殊形式（special forms）和基本过程（primitive procedures）实现的介绍，如特殊形式中的delay、cons-stream，基本过程中的force、streawn-car、stream-map等。事实上，以上特殊形式和基本过程都和惰性求值与流相关。这篇博客我们将介绍如何用Python来实现Scheme中的惰性求值和流，并使用惰性求值的原理来为我们的Scheme解释器增添尾递归的支持。所谓流，一言以蔽之，就是使用了惰性求值技术的表。它初始化时并没有完全生成，而是能够动态地按需构造，从而同时提升程序的计算和存储效率。阅读全文

posted @ 2023-05-21 22:14 orion-orion 阅读(449) 评论(0) 推荐(1) 编辑

2023年5月15日

SICP：元循环求值器（Python实现）

摘要：

元语言抽象就是建立新的语言。它在工程设计的所有分支中都扮演着重要的角色，在计算机程序设计领域更是特别重要。因为这个领域中，我们不仅可以设计新的语言，还可以通过构造求值器的方式实现这些语言。对某个程序设计语言的求值器（或者解释器）也是一个过程，在应用于这个语言的一个表达式时，它能够执行求值这个表达式所要求的动作。接下来我们将要讨论如何关于在一些语言的基础上构造新的语言。在这篇博客里，我们将用Python语言去构造一个Scheme语言的求值器。事实上求值器的实现语言无关紧要，我们也可以用Scheme语言去构造Scheme语言的求值器。用于被求值语言同样的语言写出来的求值器被称为元循环（metacircular）。阅读全文

posted @ 2023-05-15 20:14 orion-orion 阅读(540) 评论(0) 推荐(0) 编辑

2023年5月13日

联邦学习：联邦场景下的域泛化

摘要：

然而，目前大多数域泛化方法需要将不同领域的数据进行集中收集。然而在现实场景下，由于隐私性的考虑，数据常常是分布式收集的。因此我们需要考虑联邦域泛化（federated domain generalization, FedDG）方法。这里需要注意的是，传统的域泛化方法常常要求直接对齐表征或操作数据，这在联邦场景下是违反数据隐私性的。此外对于跨域的联邦学习，由于客户端异构的数据分布/领域漂移（如不同的图像风格）所导致的模型偏差（bias），直接聚合本地模型的参数也会导致次优（sub-optimal）的全局模型，从而更难泛化到新的目标域。阅读全文

posted @ 2023-05-13 22:04 orion-orion 阅读(1368) 评论(0) 推荐(0) 编辑

2023年4月18日

Linux：管道命令与文本处理三剑客（grep、sed、awk）

摘要：

众所周知，bash命令执行的时候会输出信息，但有时这些信息必须要经过几次处理之后才能得到我们想要的格式，此时应该如何处置？这就牵涉到管道命令(pipe) 了。管道命令使用的是|这个界定符号。每个管道后面接的第一个数据必定是命令，而且这个命令必须要能够接受标准输出的数据才行，这样的命令才可为管道命令。接下来我们选取grep、sed、awk这三个用于文本处理的管道命令来进行介绍。这三个命令可谓是Linux下操作文本的三大利器，合称Linux文本处理三剑客。阅读全文

posted @ 2023-04-18 00:26 orion-orion 阅读(2861) 评论(0) 推荐(2) 编辑

2023年4月11日

Linux：进程模型和进程管理

摘要：

在Linux系统中，执行一个程序或命令就可以触发一个进程，系统会给予这个进程一个ID，称为PID，同时根据触发这个进程的用户与相关属性关系，基于这个PID一组有效的权限设置。举个常见的例子，我们要操作系统的时候通常是利用ssh连接程序或直接在主机上登录，然后获取shell。默认的shell是bash，对应的路径为/bin/bash，那么同时间的每个人登录都是执行/bin/bash，不过每个人获取的权限不同。阅读全文

posted @ 2023-04-11 23:27 orion-orion 阅读(653) 评论(6) 推荐(2) 编辑

Git：国内用命令行访问GitHub的方法

摘要：

首先可以直接改Hosts文件（现在不太管用了）。如果你是Linux或Mac系统，那么可以通过命令sudo vim /etc/hosts打开Hosts文件并进行修改。如果你已经拥有了网络代理服务，那么我们可以在此基础上配置终端代理。我们查看得知自己代理服务器的IP地址为http://127.0.0.1，端口号为7890，则我们就可以使用这里的IP地址和端口号配置GitHub的终端代理了：git config --global http.https://github.com.proxy socks5://127.0.0.1:7890。阅读全文

posted @ 2023-04-11 10:33 orion-orion 阅读(1559) 评论(6) 推荐(0) 编辑

2023年3月23日

SICP：求值和环境模型（Python实现）

摘要：

一个环境就是帧（frame）的一个序列，每个帧是包含着一些绑定（bindings）的表格。这些约束将一些变量名字关联于对应的值（在一个帧内，任何变量至多只有一个绑定）。每个帧还包含一个指针，指向这个帧的外围环境（enclosing environment）。如果由于当前讨论的目的，将相应的帧看做是全局（global）的，那么它将没有外围环境。一个变量相对于某个特定环境的值，也就是在这一环境中，包含着该变量的第一个帧里这个变量的绑定值。阅读全文

posted @ 2023-03-23 13:56 orion-orion 阅读(274) 评论(0) 推荐(1) 编辑

Orion's Blog

联邦学习、图机器学习、推荐系统

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类

友情链接

阅读排行榜

评论排行榜

推荐排行榜

最新评论