摘要: 利用书籍进行系统学习,凭借博客/新闻等资料开阔眼界,辅之以代码及项目实战,并勤加以总结,方可进步。 常用网站: 找英文电子书网站:gen.lib.rus.ec 和 www.jiumodiary.com/ Leetcode刷题:https://leetcode.com/ ,练习数据结构和算法必备 Co 阅读全文
posted @ 2017-08-08 09:41 xiaoxi666 阅读(1181) 评论(0) 推荐(1)
摘要: 写在前面 许多大模型具有推理参数,用于控制输出的“随机性”。常见的几个是 Top-K、Top-p,以及温度。比如我们常用的 Dify 平台就支持 Top-p 和 温度 的设置: 鼠标放到问号上面,可以看到各自的解释: Top-p: 含义:Kernel sampling threshold. Used 阅读全文
posted @ 2025-04-15 22:52 xiaoxi666 阅读(341) 评论(0) 推荐(1)
摘要: 强化学习在LLM中的应用越来越多了,本文针对常见的几种训练算法,用生活中的例子做类比,帮助理解相关概念。 包括:PPO、DRO、DPO、β-DPO、sDPO、RSO、IPO、GPO、KTO、ORPO、SimPO、R-DPO、RLOO,以及GRPO。 PPO(Proximal Policy Optim 阅读全文
posted @ 2025-02-18 23:18 xiaoxi666 阅读(328) 评论(0) 推荐(0)
摘要: Deepseek这么火,来学学底层技术吧! 阅读全文
posted @ 2025-01-30 21:09 xiaoxi666 阅读(748) 评论(0) 推荐(0)
摘要: 前言 提到注意力机制,你一定会想起Transformer的经典架构图: (图源:https://www.datacamp.com/tutorial/how-transformers-work,这篇文章讲得不错) 初看起来可能一头雾水:向量映射是啥?编码器和解码器是干啥的?前馈机制是啥?为啥要归一化? 阅读全文
posted @ 2024-12-09 11:32 xiaoxi666 阅读(1017) 评论(0) 推荐(0)
摘要: 前言 文章开始前,先尝试回答几个问题: 在日常工作中,程序的打包和部署方式流程是怎样的? 如果使用Docker容器部署方式,是用原生Docker命令,还是Kaniko这类工具? 除了业务服务外,如果还需要同时运行其他进程,应该怎么办?举个例子:除了主服务进程(比如Web服务器),还需要同时启动Ngi 阅读全文
posted @ 2024-12-09 11:30 xiaoxi666 阅读(87) 评论(0) 推荐(0)
摘要: 在云计算和微服务架构中,南北向流量和东西向流量是两种常见的流量模式。 南北向流量(North-South Traffic) 定义:南北向流量指的是从外部进入系统内部或从系统内部出去的流量,通常是客户端到服务器之间的通信,例如用户通过浏览器或移动应用访问 Web 服务或 API。 特点:这种流量穿过系 阅读全文
posted @ 2024-12-09 11:26 xiaoxi666 阅读(824) 评论(0) 推荐(0)
摘要: 众所周知,LLM的函数function-calling能力很强悍,解决了大模型与实际业务系统的交互问题。其本质就是函数调用。 从openai官网摘图: 简而言之: LLM起到决策的作用,告知业务系统应该调用什么函数,以及入参是什么。 业务系统负责实现对应的函数(比如本地实现,或者调用其他系统提供的服 阅读全文
posted @ 2024-12-09 11:25 xiaoxi666 阅读(2699) 评论(3) 推荐(1)
摘要: 众所周知,B站是学习网站😄 最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。 值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的 阅读全文
posted @ 2024-07-13 19:56 xiaoxi666 阅读(411) 评论(0) 推荐(1)
摘要: 最近大模型发展迅速,与之对应的向量化需求也被带动起来了,由此社区也衍生出很多模型,本文选几款,简单做下评测。 阅读全文
posted @ 2024-02-13 11:53 xiaoxi666 阅读(18962) 评论(1) 推荐(2)
摘要: 说起国际化,开发过跨区域网页的小伙伴应该都遇到过。我们的网页需要配置多套语言,方便用户进行切换。 本文就以 React 为例,介绍其中一种实现方案,并学习一下其中的知识点。 一种国际化方案 方案是这样的: 为多套语言创建对应的 object,并 export 出去 通过 js 立即执行函数,加载选定 阅读全文
posted @ 2023-02-20 23:40 xiaoxi666 阅读(235) 评论(0) 推荐(0)
TOP
点击右上角即可分享
微信分享提示