随笔 - 934, 文章 - 0, 评论 - 247, 阅读 - 344万

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

08 2024 档案

摘要:每当我们看到一个小团队获得巨大成就时,总是会感叹其为何会有如此高的效率,在AI时代,这样的案例会越来越多。 Instagram 2012 年 Instagram 被 Facebook 以 10 亿美金收购时只有 13 个人。 Instagram 于 2010 年推出,是一家以照片和视频分享为核心的社 阅读全文

posted @ 2024-08-24 19:36 蝈蝈俊 阅读(34) 评论(0) 推荐(0) 编辑

摘要:谷歌前CEO施密特被下架的斯坦福AI讲座中,给出了当前AI的三个重要发展方向是: 更大的上下文窗口; 更强大的AI代理; 文本到行动能力的提升; 并认为在接下来的一年里就可以看到效果。 在讲解讨论文本到行动时,施密特用TikTok举的例子可以让我们清晰的看到未来AI可以做什么? 如果TikTok下架 阅读全文

posted @ 2024-08-20 06:48 蝈蝈俊 阅读(36) 评论(0) 推荐(0) 编辑

摘要:针对特定的场景,LLM优化方法有三类:Prompt Engineering、RAG、Fine-tuning 不论使用那种方式优化,我们都需要在完成优化后,评估优化的效果,这个效果不能只人为的感觉(做不过来,也不科学),那如何做自动化评分呢? 下面以最常见的问答、对话系统的优化任务为例来展开介绍几种简 阅读全文

posted @ 2024-08-19 16:59 蝈蝈俊 阅读(202) 评论(0) 推荐(0) 编辑

摘要:Google 前 CEO 埃里克·施密特近期在斯坦福 CS323 课堂上的访谈中提到: 只有AI在组织形态和流程上创新后,才算真正的变革开始。 完整的视频: https://www.bilibili.com/video/BV1Fy411v7jt/ 下面是这部分翻译: 电力是一种通用技术。通用技术有一 阅读全文

posted @ 2024-08-19 09:26 蝈蝈俊 阅读(105) 评论(0) 推荐(0) 编辑

摘要:https://www.substratus.ai/blog/calculating-gpu-memory-for-llm 这里提供了一个公式可以计算加载一个模型需要多少GPU内存? M = \frac{(P * 4B)} {(32/{Q}) } * 1.2 这个公式首先计算模型的全精度大小\((P 阅读全文

posted @ 2024-08-18 20:30 蝈蝈俊 阅读(171) 评论(0) 推荐(0) 编辑

摘要:在计算机中,浮点数的表示基于IEEE 754标准,这是最广泛使用的浮点数表示标准。对于一个具体的数值,如 10.2345434,它会被分解为符号位、指数位和尾数位。 这里以最常见的 float32(单精度浮点数)为例来解释这个过程: 符号位 如果数值是正的,符号位为0;如果数值是负的,符号位为1。 阅读全文

posted @ 2024-08-03 18:13 蝈蝈俊 阅读(31) 评论(0) 推荐(0) 编辑

摘要:访问 Hugging Face 中的资源,需要使用Access Tokens,可以在 Hugging Face 设置页面(https://huggingface.co/settings/tokens)生成自己的token。 一旦你获得了token,可以有下面几种方法使用它: 一、直接在代码中传递to 阅读全文

posted @ 2024-08-01 15:40 蝈蝈俊 阅读(4158) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示