05 2023 档案
摘要:@,torch.matmul,torch.mm:矩阵相乘,第一个矩阵的列和第二个矩阵的行维度相同 *,torch.mul:矩阵对应元素相乘,所以两个矩阵维数相同,同维矩阵 torch.dot:一维的张量进行相乘再相加,结果是一个值
阅读全文
摘要:静态方法 :需在类成员函数前面加上@staticmethod标记符,以表示下面的成员函数是静态函数。使用静态方法的好处是,不需要定义实例即可使用这个方法。另外,多个实例共享此静态方法。 class Person: grade=1 def __init__(self,name): self.name
阅读全文
摘要:模型冻结部分层的训练方式: 第一步:在训练之前,将除了Embedding之外的层设置为param.requires_grad = False,如下所示: for name, param in model.named_parameters(): if "model.embed_tokens" not
阅读全文
摘要:1.Controller @RequestMapping 注解用于绑定URI到具体处理器。 @RestController:Spring 4 新增注解,同样可以注解 Controller 类,相当于@Controller + @ResponseBody,主要是为了使 http 请求返回 json 或
阅读全文
摘要:SparkSession spark = SparkSession.builder().appName("spark-item").config("spark.sql.warehouse.dir", warehouse_location).enableHiveSupport().config("sp
阅读全文
摘要:大模型git项目: 首页 · 魔搭社区 (modelscope.cn) Hugging Face – The AI community building the future. GitHub - LC1332/Luotuo-Chinese-LLM: 骆驼(Luotuo): Open Sourced
阅读全文
摘要:目前常见的连续特征处理可以概括为三种:No Embedding、Field Embedding、Descretization。接下来将为大家一一介绍。 之前离散化的不足 尽管离散化在工业界广泛引用,但仍然有以下三方面的缺点: TPP(Two-Phase Problem):将特征分桶的过程一般使用启发
阅读全文
摘要:安装cuda vim ~/.bashrcexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH 安装cudnn sudo cp cudnn-linux-x86
阅读全文
摘要:bert中n(seq_len)默认是512,通过padding,head_size = 64 hidden_size = 768 默认计算方式是hidden_size / heads(12) = 64,输入为seq_len(句子长度)*batch(句子个数)*embedingsize (44条消息)
阅读全文