摘要:
基本概念 随机试验:一种试验,其结果不可预测。 样本空间:随机试验所有可能结果的集合。 事件:样本空间的子集,表示随机试验的某些结果。 概率:事件发生的可能性大小,通常在0到1之间。 古典概率:假设所有结果等可能时的概率计算。 互斥事件:不能同时发生的事件。 全概率:一系列互斥且完备的事件的概率总和 阅读全文
摘要:
假设: 输入(中文): "我有一本书" 目标(英文): "I have a book" A,一般过程 一,训练阶段: 在 训练阶段,我们希望训练模型从源语言(中文)生成目标语言(英文)。在这个过程中,解码器依赖于编码器的输出,并通过与目标序列进行比较来计算损失,并优化模型参数。 # 1. 输入序列( 阅读全文
摘要:
1,词向量的本质 词向量(WordEmbedding)是通过训练得到的低维稠密向量,用于表示词汇的语义信息。在训练过程中,词向量不仅捕捉了词汇的自身特征(如词义、词性),还捕捉了词汇的上下文特征(如语法角色、位置信息、与其他词的关系)。 2,词向量的维度 词向量的每个维度并不是独立的,而是通过训练数 阅读全文
摘要:
#include <stdio.h>#include <stdlib.h>#include <stdint.h>#include <string.h> #define ROTRIGHT(word, bits) (((word) >> (bits)) | ((word) << (32 - (bits) 阅读全文
摘要:
1,权重更新前后,如果梯度是正的,权重将减少;如果梯度是负的,权重将增加。 2,权重更新前后,权重的大小没有必然结论。 3,注意跨越最小极值点的情况。 阅读全文
摘要:
1,操作系统命令行看系统python的库 where pythonC:\Users\augus\AppData\Local\Microsoft\WindowsApps\python.exe >>> for item in sys.path:... print(item)... C:\Program 阅读全文
摘要:
在kali上安装pycharm后启动报错_JAVA_OPTIONS env|grep 的确有这样的变量 /etc/X11/Xsession.d/90kali-themes.conf /etc/environment.d/95kali-themes.conf 这两个文件中,将_JAVA_OPTIONS 阅读全文
摘要:
(.venv) PS C:\Users\augus\PycharmProjects\pythonProject> pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124L 阅读全文
摘要:
在 CUDA 编程模型中,grid 和 block 是用来组织和管理线程的两个关键结构。每个 grid 由多个 block 组成,而每个 block 又由多个线程组成。grid 和 block 都可以配置为 1、2 或 3 维,这允许程序在不同的规模和结构上运行。 dim 的含义- dim.x:表示 阅读全文
摘要:
在C++中,内存分配是通过几种不同的方式来管理的。这包括自动存储、静态存储和动态存储。下面分别解释这些存储类别以及如何使用它们进行内存分配。 #1,自动存储(Automatic Storage) 这是最常用的存储类型,当一个变量在函数内被声明时,它会自动获得存储空间,并且在函数结束时自动释放。例如: 阅读全文