导航

上一页 1 2 3 4 5 6 ··· 83 下一页

2024年6月14日

摘要: LightningAI 的首席数据科学家Akshay(https://x.com/akshay_pachaar)做了六张图解释Transformer,相当清晰明了。 一、Embeddings(词嵌入) 词嵌入是使用一组数字对每个token(大约一个词)进行有意义的表示。 这种嵌入是我们作为语言模型的 阅读全文

posted @ 2024-06-14 10:36 蝈蝈俊 阅读(89) 评论(0) 推荐(0) 编辑

2024年5月25日

摘要: 在Transformer最初被提出时,主要是为了解决传统神经机器翻译模型中存在的下面三个问题: 1、长距离依赖问题(Long-range dependency) 举个例子,在英文到中文的翻译中,句子中的主语和谓语动词可能之间相隔较远,但是需要正确地识别和翻译。 比如: “The cat that I 阅读全文

posted @ 2024-05-25 15:35 蝈蝈俊 阅读(192) 评论(0) 推荐(0) 编辑

2024年5月20日

摘要: 选择 Sources 标签 在开发者工具中,点击顶部菜单中的“Sources”选项卡。 注意: 在切换到“Sources”选项卡后,默认是没有源码的,需要再次刷新下页面,才能看到对应的源码,才能设置断点。 设置断点: 在你想要暂停执行的代码行上,点击行号旁边的空白区域,这将在那一行上设置一个断点。 阅读全文

posted @ 2024-05-20 10:23 蝈蝈俊 阅读(14) 评论(0) 推荐(0) 编辑

2024年5月15日

摘要: 最新的价格表在: https://openai.com/api/pricing/ GTP-4o 比 GTP-4 Turbo 便宜一半 GTP-4o 比 GPT-3.5 Turbo 贵10倍 https://ai.google.dev/pricing?hl=zh-cn Gemini 1.5 Flash 阅读全文

posted @ 2024-05-15 14:20 蝈蝈俊 阅读(29) 评论(0) 推荐(1) 编辑

摘要: 在使用 Appium 开发应用时,可以通过多种方式抓取指定区域的内容并定位到该位置。Appium Inspector (https://github.com/appium/appium-inspector)就是其中一个很方便的工具。 安装 Appium Inspector 支持Win、Mac、Lin 阅读全文

posted @ 2024-05-15 10:46 蝈蝈俊 阅读(63) 评论(0) 推荐(0) 编辑

2024年5月11日

摘要: 首先要给手机解锁,我这里已经解锁了,就直接从解锁后开始了。 一、准备 如何查看小米手机型号 打开小米手机【设置】,点击【我的设备】; 在【我的设备】界面,找到【手机型号】一栏即可查看设备型号; 打开小米手机的开发者选项 依次点击:手机设置-> 我的设备-> 全部参数-> 连续点击几次“MIUI 版本 阅读全文

posted @ 2024-05-11 14:22 蝈蝈俊 阅读(26) 评论(0) 推荐(0) 编辑

2024年5月10日

摘要: 微信的文件助手有下面这些版本: 网页版 https://filehelper.weixin.qq.com/ 移动版 PC版 https://weixin.qq.com/ 这些之间都是可以互传文件的。 这样一台机器登录文件传输助手网页版,一台机器登录PC版本的微信,两台互联网上的机器互传文件就可以实现 阅读全文

posted @ 2024-05-10 10:19 蝈蝈俊 阅读(32) 评论(0) 推荐(0) 编辑

2024年5月6日

摘要: Mac下Microsoft Remote Desktop未在中国地区上架。 一个解决办法: https://docs.microsoft.com/en-us/windows-server/remote/remote-desktop-services/clients/remote-desktop-ma 阅读全文

posted @ 2024-05-06 10:54 蝈蝈俊 阅读(18) 评论(0) 推荐(0) 编辑

2024年4月29日

摘要: 随着开源LLM越来越成熟,业务接入LLM推理也成为必然,如何选模型大小和显卡,主要看下面这些。 一、选GPU显卡 在选择显卡进行大型语言模型推理时,主要要看下面几个指标: 1、 VRAM(视频随机存取存储器): VRAM 的容量直接影响您能够加载的模型的大小。大型语言模型需要大量的内存来存储权重和进 阅读全文

posted @ 2024-04-29 20:04 蝈蝈俊 阅读(674) 评论(0) 推荐(0) 编辑

2024年4月28日

摘要: 清华大学和智谱AI团队研究发现: 大模型的涌现能力与预训练loss的关系比模型参数更紧密。 https://arxiv.org/pdf/2403.15796 这篇论文《从损失角度理解语言模型的涌现能力》通过将预训练损失作为评估指标,强调了在理解和评价语言模型的涌现能力时,损失的重要性可能超过了模型参 阅读全文

posted @ 2024-04-28 10:16 蝈蝈俊 阅读(74) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 ··· 83 下一页