摘要:
RNN 模型一般设定固定的文本长度(text sequence length,可理解为文本序列在时间维度上的步数 time step),以保证网络输出 层数据维度的一致性。但在训练和测试时,难以保证输入文本长度的一致性,因此常常需要截断操作(即将超过预设长度的文本截断) 和 pad 操作(即对不足预 阅读全文
摘要:
1. torch.nn.Embedding embedding 的主要目的是对稀疏特征进行降维。函数原型如下: """ num_embeddings – 词典的大小 embedding_dim – 嵌入向量的维度,即用多少维的向量来表示一个词 padding_idx(optional) – 填充id 阅读全文
摘要:
nn.ModuleList 可以把任意 nn.Module 的子类 (比如 nn.Conv2d, nn.Linear 之类的) 加到这个 list 里面,方法和 Python 自带的 list 一样,无非 是 extend,append 等操作。但不同于一般的 list,加入到 nn.ModuleL 阅读全文
摘要:
<phoneme alphabet="py" ph="juan3">卷</phoneme> <p>这是第一段话。说完之后将会停顿一会。</p> 这双<w>球鞋</w>是C罗送给我的。(使指定的词组不被拆分,以保证不会有停顿。) <prosody rate="50%">语速会变慢一半</prosody 阅读全文
摘要:
假设一个数据库存储每个酒店的以下信息:它的价格(夜间价格)、离海滩的距离。用户希望检索“最佳”酒店,如何比较两个酒店的质量呢? $a$ 比 $b$ 好吗?是的,$a$ 酒店比 $b$ 酒店更便宜,而且离海滩更近,我们说 $a$ 支配 $b$。 $a$ 是不是比 $i$ 好呢?它们是不可比的。一些用户 阅读全文
摘要:
图像其实就是二元函数 $f(x,y)$,只不过是离散的,图像梯度就是这个二元离散函数的偏导。计算图像梯度是一个一个像素点求的。 连续二元函数的偏导数为 $$\frac{\partial f(x,y)}{\partial x} = \lim_{\Delta x\rightarrow 0}\frac{f 阅读全文
摘要:
这个博客写的不详细,有兴趣的话可以看视频:https://www.bilibili.com/video/BV1Hv411e7CW。 使用一个固定窗口在图像上进行任意方向上的滑动,比较滑动前与滑动后两种情况,窗口中的像素灰度变化程度,如果存在任意方向上的滑动, 都有着较大灰度变化,那么我们就可以认为该 阅读全文
摘要:
时空数据库管理移动对象,比如:汽车、飞机、地貌变化等。空间数据库是时空数据库的特例,即时刻固定。 轨迹压缩 每秒钟都会从 GPS 获取大量 $(x,y,t)$ 格式的数据,如何在不降低物体轨迹精度的前提下减小数据量呢?主要有三个指标:处理时间、压缩率、误差测量。 误差:原始轨迹位置与估计轨迹位置之间 阅读全文
摘要:
$B$ 树的搜索本质上是一维区间的划分过程,每次搜索节点所找到的子节点其实就是一个子区间。$R$ 树是把 $B$ 树的思想扩展到了多维空间, 采用了 $B$ 树分割空间的思想,是一棵用来存储高维数据的平衡树。 对于一棵 $R$ 树,叶子节点所在层次称为 $Level \; 1$,根节点所在层次称为 阅读全文
摘要:
$B$ 树是为了磁盘或其它存储设备而设计的一种多叉平衡查找树,多叉就是多个分支的意思,二叉树就是最多只有两个分支的树。 如下图所示,即是一棵 $B$ 树。 一棵 $m$ 阶的 $B$ 树必须满足如下条件: 1)每个结点最多含有 $m$ 个分支,也就是说:每个节点最多 $m-1$ 个关键字。 2)根节 阅读全文