摘要:
我们知道语言模型(Language Model, LM)实际上是对一种token序列的概率分布。例如对一个句子\(S = w_1, ... , w_t\),我们要估计这一个句子的概率,计算过程如下: \[ P(S) = P(w_1, ..., w_t) \\ =P(w_1, ..., w_{t-1} 阅读全文
摘要:
为什么安装TensorFlow需要重装CUDA?nvidia-smi和nvcc -V显示的不是同一版本CUDA?用conda装CUDA不可以吗? 阅读全文
摘要:
枚举 枚举法是一种通过枚举所有可能解,检查该可能解是否符合要求,并将符合要求的解计入答案的方法。 在解决问题的过程中,我们需要枚举的对象有很多种,比如数值、区间、矩形、日期等等。 在设计枚举算法时,一些思路直接的算法虽然很容易理解,但是通常会导致高昂的时间代价。所以我们可以通过加入数学计算、并且存储 阅读全文
摘要:
算法评价与复杂度 在现实生活中,计算资源,包括CPU的计算速度和内存的大小,是有限的,而我们的等待时间也是有限的。所以,我们需要用更快(或内存利用率更高)的算法来应对时间紧张(或者内存紧张)的开发场景。 时间限制:一方面,CPU的运算速度是有限制的;另一方面,等待问题结果的时间也是有限的。所以,衡量 阅读全文
摘要:
高精度加减法 高精度整数可以由数位数组和长度两部分组成。数位数组存储整数时使用的是小端序。 使用小端序的理由: 因为加法、减法及后面介绍的乘法等,都是从低位算到高位。这样存储符合我们平时习惯的枚举顺序。 因为数位计算结束后,需要更新数位数组的长度。把高位放在数组后面比较方便数组伸缩。 高精度整数使用 阅读全文
摘要:
代码例子: #include <iostream> #include <cstring> #include <string> using namespace std; int main() { string s1("LaoWang"); string s2 = "Liu"; // 如果感兴趣,可以在 阅读全文
摘要:
1 导论 线性模型是一类统计模型的总称,包括线性回归模型,方差分析模型,协方差分析模型和线性混合效应模型,是统计学中应用最广泛的模型之一。 模型形式:f(x)=W*X+b 样本X,权重W表达各个特征在预测中的重要性 线性是一系列一次特征的线性组合,在二维空间中是一条直线,在三维空间是平面,推到n维空 阅读全文