Fork me on GitHub

04 2023 档案

摘要:解释1: 在深度学习中,Fisher信息矩阵(FIM)是一种可以用来表征损失函数的变化,进行二阶优化,和构建几何学习理论的工具。FIM衡量了模型输出对模型参数变化的敏感度。然而,精确的FIM要么不存在闭式解,要么计算代价太高,所以通常根据经验样本来估计。 改善Fisher的条件数意味着降低FIM估计 阅读全文
posted @ 2023-04-23 15:23 stardsd 阅读(1231) 评论(0) 推荐(0) 编辑
摘要:随着研究和行业转向能够执行大量下游任务的大规模模型,理解赋予模型细微差别的多模态数据集的复杂性迅速增加。对数据集的起源、发展、意图、伦理考虑和演变的清晰和透彻的理解成为负责任和知情部署模型的必要步骤,尤其是那些在面向人的环境和高风险领域中的模型。然而,这种理解的负担往往落在文档的可理解性、简洁性和全 阅读全文
posted @ 2023-04-21 15:31 stardsd 阅读(211) 评论(0) 推荐(0) 编辑
摘要:2023 年 4 月 19 日,星期三 高级研究员 Lauren Wilcox 代表技术、人工智能、社会和文化团队发布 Google 将AI 视为一项基础和变革性技术,最近在生成 AI 技术方面取得了进展,例如LaMDA、PaLM、Imagen、Parti、MusicLM和类似的机器学习 (ML) 阅读全文
posted @ 2023-04-21 15:03 stardsd 阅读(143) 评论(0) 推荐(0) 编辑
摘要:MIPS(Microprocessor without Interlocked Pipeline Stages, 没有互锁流水线级别的微处理器)是由MIPS Technologies开发的精简指令集计算机(RISC)指令集架构(ISA)。它通常用于嵌入式系统、网络设备和其他需要高性能和效率的应用程序 阅读全文
posted @ 2023-04-19 14:55 stardsd 阅读(437) 评论(0) 推荐(0) 编辑
摘要:# 导入必要的库 import torch import torch.nn as nn import torch.optim as optim from torch.utils.data import DataLoader, Dataset # 定义超参数 epochs = 10 # 训练轮数 lr 阅读全文
posted @ 2023-04-13 15:56 stardsd 阅读(486) 评论(0) 推荐(0) 编辑
摘要:The Waluigi Effect (mega-post) - LessWrong Waluigi Effect(瓦路易吉效应)是一个伴随ChatGPT出现的新概念。Waluigi是Mario游戏中的反派角色,是Luigi的头号对手。Waluigi Effect则指训练AI做某件事情会增加其做完全 阅读全文
posted @ 2023-04-10 16:56 stardsd 阅读(213) 评论(0) 推荐(0) 编辑
摘要:QEMU和KVM是两个不同的虚拟化技术,但它们经常一起使用。 QEMU是一个开源的虚拟化工具,可以模拟多种不同的硬件平台,并在这些平台上运行虚拟机。它可以在多个操作系统上运行,包括Linux、Windows和MacOS等。QEMU提供了完整的虚拟化功能,包括CPU、内存、磁盘、网络和输入输出等。 K 阅读全文
posted @ 2023-04-10 14:55 stardsd 阅读(515) 评论(0) 推荐(0) 编辑