摘要:
1 简介 这篇论文的主要贡献是两个神经网络结构。一个是现在常见的 BiLSTM + CRF,另一个是受到 shift-reduce parsers 启发的网络结构,其中利用了 Stack-LSTM 来计算中间内容的向量表示。话不多说,直接切入讲网络结构,然后以 QA 的形式讨论其他细节。 2 LST 阅读全文
摘要:
这篇博客主要介绍一种最优化的方法:牛顿法,拟牛顿法的两种实现(DFP 和 BFGS)。 牛顿法 牛顿法是一个寻找方程根的算法,迭代计算的过程如图所示。这个算法如何和函数的最优化联系起来呢? 最优化 我们想要求解的问题如下: \(\mathop{min}\limits_{x \in R^n} f(x) 阅读全文
摘要:
这篇博客主要介绍一个最优化算法——前向分步算法,接着用前向分步算法推导 Adaboost 和提升树、梯度提升。 前向分步算法 前向分步算法是一种优化方法,给定损失函数 \(L\),预测函数 \(f(x)\),优化目标是最小化损失函数: \(min\sum_{i=1}^{N}L(y_i, f(x_i) 阅读全文
摘要:
这篇博客主要讲几种常见的集成学习方法:bagging, boosting, stacking。 简介 这一小节先简单讲讲这几种集成学习方法的思路,这几种方法的思路其实是很简单的。 bagging,是 Bootstrap aggregating 的简称,它使用了自主采样法(Boostrap)。从训练集 阅读全文
摘要:
决策树 下面分成五个方面讲决策树。 简介 生成 剪枝 优缺点 sklearn 的使用建议 简介 决策树,就是模拟人类决策的树。可以将决策树理解为一系列 if-else 的决策过程。下图数据来源于员工离职预测 [7],使用 sklearn 生成 max_depth 为 2 的决策树。对于一组数据,根据 阅读全文
摘要:
介绍 本文记录了 Efficient Knowledge Graph Accuracy Evaluation 的实现过程。目前实现了在随机生成的三元组上进行 static evaluation 和 incremental evaluation。 Github 地址:https://github.co 阅读全文
摘要:
CRAQ 这篇论文主要介绍 chain replication,改进了读性能。CRAQ 是 Chain Replication with Apportion Queries 的缩写,将读操作分摊到所有的节点上,所有的节点都可以进行读操作。chain 越长,读性能就越好,但是写性能就越差。 操作流程 阅读全文
摘要:
Zookeeper Zookeeper 是分布式系统的服务,底层使用类似 Raft 的 Zab 共识算法,它提供的服务用于协作分布式程序。它提供了类似文件系统的 API,客户端可以使用这些 API 来完成分布式程序,比如分布式锁。 公开课中其实存在着一些看不懂的话题,不知道在讨论什么,zookeep 阅读全文
摘要:
Raft 一致性算法。 整体结构 Raft 的作用是让多台主机保持一致。fault-tolerant virtual machine 论文中提到过两种方法,一种是复制所有的状态到别的主机上,包括 CPU,内存,IO 设备。另一种方法是对主机进行状态机建模,通过复制主机的日志,执行相同的日志内容来保持 阅读全文
摘要:
Fault-Tolerant Virtual Machine 思维导图 需求 实现一个容错的虚拟机,要求在虚拟机出问题的时候,可以有备份虚拟机上线,并且外界感受不到异常。 整体结构 primary/backup 策略有两种: 将 primary所有的状态,包括处理器、内存、IO 全部发送给backu 阅读全文