随笔 - 934, 文章 - 0, 评论 - 247, 阅读 - 344万

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

02 2024 档案

摘要:QLoRa的核心思想是首先使用低秩分解技术降低参数的数量,然后对这些低秩表示的参数应用量化技术,进一步减少所需的存储空间和计算量。 低秩分解 低秩分解(Low-Rank Factorization):通过将模型中的权重矩阵分解为更小的矩阵乘积,减少模型中的参数数量。 参看:LoRA 微调和低秩矩阵 阅读全文

posted @ 2024-02-27 09:29 蝈蝈俊 阅读(138) 评论(0) 推荐(0) 编辑

摘要:Faster-Whisper https://github.com/SYSTRAN/faster-whisper 是一个使用 CTranslate2 重新实现的 OpenAI Whisper 模型,旨在提高转录速度和效率。 它显著提高了处理速度,与原始 Whisper 模型相比,保持了相同的准确性的 阅读全文

posted @ 2024-02-26 13:51 蝈蝈俊 阅读(851) 评论(0) 推荐(0) 编辑

摘要:LoRA(Low-Rank Adaptation)是一种技术,旨在有效调整大型语言模型,以适应特定任务,而无需重新训练整个模型。在论文《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGEMODELS》(https://arxiv.org/abs/2106.0968 阅读全文

posted @ 2024-02-25 20:10 蝈蝈俊 阅读(1099) 评论(0) 推荐(0) 编辑

摘要:今天看到这段话: 你以为的新能源:电力驱动 真正的新能源:人工智能 ​​​ Sam Altman 在英特尔的活动上也提到了这一点,如果非要类比,把现在当做交流直流大战的阶段是个恰当的比喻。 在电力技术初期,人们对于电力的本质、产生方式以及它如何转化和利用其他自然资源有很多探索和质疑。电力的产生确实需 阅读全文

posted @ 2024-02-23 20:36 蝈蝈俊 阅读(44) 评论(0) 推荐(0) 编辑

摘要:Ollama (https://ollama.com/) 是一款命令行工具,可在 macOS 、 Linux 、Windows 上本地运行 Llama 2、Code Llama 、Gemma 等模型。 Ollama 目前支持近二十多个语言模型系列(https://ollama.com/library 阅读全文

posted @ 2024-02-22 16:59 蝈蝈俊 阅读(5513) 评论(1) 推荐(0) 编辑

摘要:在与语言模型(LLM)的交流中,明确指导(告诉它做什么)往往比单纯指出禁止行为(告诉它不做什么)更加有效。 这种方法的优点在于能够更直接、更精确地引导模型的回答方向,减少模型需要考虑的可能性范围,从而提高获取期望答案的几率。 OpenAI 的官方文档 https://help.openai.com/ 阅读全文

posted @ 2024-02-08 10:21 蝈蝈俊 阅读(122) 评论(0) 推荐(0) 编辑

摘要:体验 可以通过 https://chat.openai.com/g/g-rxlwmrnqa-video-script-generator 地址体验,它将按照你的主题要求,创建TikTok视频脚本。 Prompt You are an expert in the field of topic, who 阅读全文

posted @ 2024-02-07 10:15 蝈蝈俊 阅读(130) 评论(0) 推荐(0) 编辑

摘要:不论是安装Edge,还是Edge Webview2,都是报这个错误。 试了很多办法都不行,最后找到 https://zhuanlan.zhihu.com/p/588463531 强行删除C:\Program Files (x86)\Microsoft 该文件夹。 我可以看到这个文件夹是空的,强行删除 阅读全文

posted @ 2024-02-01 16:15 蝈蝈俊 阅读(1422) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示