摘要: 我们知道语言模型(Language Model, LM)实际上是对一种token序列的概率分布。例如对一个句子\(S = w_1, ... , w_t\),我们要估计这一个句子的概率,计算过程如下: \[ P(S) = P(w_1, ..., w_t) \\ =P(w_1, ..., w_{t-1} 阅读全文
posted @ 2024-01-15 20:28 Teddyonthebench 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 一个由tf1.6.0引发的故事|从CUDA到gcc配置,非root用户重装旧版本TF环境 为什么安装TensorFlow需要重装CUDA?nvidia-smi和nvcc -V显示的不是同一版本CUDA?用conda装CUDA不可以吗? 阅读全文
posted @ 2022-12-02 17:13 Teddyonthebench 阅读(372) 评论(0) 推荐(1) 编辑
摘要: 枚举 枚举法是一种通过枚举所有可能解,检查该可能解是否符合要求,并将符合要求的解计入答案的方法。 在解决问题的过程中,我们需要枚举的对象有很多种,比如数值、区间、矩形、日期等等。 在设计枚举算法时,一些思路直接的算法虽然很容易理解,但是通常会导致高昂的时间代价。所以我们可以通过加入数学计算、并且存储 阅读全文
posted @ 2022-04-24 22:01 Teddyonthebench 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 算法评价与复杂度 在现实生活中,计算资源,包括CPU的计算速度和内存的大小,是有限的,而我们的等待时间也是有限的。所以,我们需要用更快(或内存利用率更高)的算法来应对时间紧张(或者内存紧张)的开发场景。 时间限制:一方面,CPU的运算速度是有限制的;另一方面,等待问题结果的时间也是有限的。所以,衡量 阅读全文
posted @ 2022-04-24 16:52 Teddyonthebench 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 高精度加减法 高精度整数可以由数位数组和长度两部分组成。数位数组存储整数时使用的是小端序。 使用小端序的理由: 因为加法、减法及后面介绍的乘法等,都是从低位算到高位。这样存储符合我们平时习惯的枚举顺序。 因为数位计算结束后,需要更新数位数组的长度。把高位放在数组后面比较方便数组伸缩。 高精度整数使用 阅读全文
posted @ 2022-04-24 13:02 Teddyonthebench 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 代码例子: #include <iostream> #include <cstring> #include <string> using namespace std; int main() { string s1("LaoWang"); string s2 = "Liu"; // 如果感兴趣,可以在 阅读全文
posted @ 2022-04-12 23:29 Teddyonthebench 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 1 导论 线性模型是一类统计模型的总称,包括线性回归模型,方差分析模型,协方差分析模型和线性混合效应模型,是统计学中应用最广泛的模型之一。 模型形式:f(x)=W*X+b 样本X,权重W表达各个特征在预测中的重要性 线性是一系列一次特征的线性组合,在二维空间中是一条直线,在三维空间是平面,推到n维空 阅读全文
posted @ 2021-12-20 23:31 Teddyonthebench 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-11-16 23:29 Teddyonthebench 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 简要介绍了CSS中浮动的问题 阅读全文
posted @ 2021-06-24 19:31 Teddyonthebench 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 上集 CSS 2 CSS选择器 2.3.4 伪类选择器 选择到元素的某个时间点(段),用来添加一些选择器的特殊效果。 伪类的语法: selector:pseudo-class {property:value;} CSS类也可以使用伪类: selector.class:pseudo-class {pr 阅读全文
posted @ 2021-06-24 19:20 Teddyonthebench 阅读(42) 评论(0) 推荐(0) 编辑