02 2023 档案
发表于 2023-02-19 14:58阅读:76评论:0推荐:0
摘要:一个比较简单的做法是在 loss.backward() 之后和 optimizer.step() 调用之前,添加以下几行,可以找到未使用的参数(注意区分自己特地冻结的参数): for name, param in model.named_parameters(): if param.grad is
阅读全文 »
发表于 2023-02-17 11:01阅读:11评论:0推荐:0
摘要:两个或多个其实指的就是类别数,如果是一个二分类问题,就是两个。 红框和蓝框分别代表了每个类别的推理值,(此时可能通过了激活函数或者未通过),反正最后就是将通过激活函数后的值进行比较大小,大者为识别的类别,即predict对应的label
阅读全文 »
发表于 2023-02-07 18:34阅读:18评论:0推荐:0
摘要:ChatGPT 火爆出圈了,有些人惊叹于它的能力,当然也有部分人觉得也就那样。这就不得不提 Prompt 了,据说【相关文献1】,ChatGPT 效果好不好完全取决于你的 Prompt,“看来 Propmt 也成一个技术活儿了”。 当我这么想的时候,没想到国外居然已经有了成熟的售卖 Prompt 的
阅读全文 »