会员
T恤
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xiaoxi666
Master programmers think of systems as stories to be told rather than programs to be written.
博客园
首页
新随笔
联系
订阅
管理
随笔 - 125
文章 - 0
评论 - 74
阅读 -
36万
[置顶]
软件开发:网站&视频&书籍&文章推荐(不断更新)
摘要: 利用书籍进行系统学习,凭借博客/新闻等资料开阔眼界,辅之以代码及项目实战,并勤加以总结,方可进步。 常用网站: 找英文电子书网站:gen.lib.rus.ec 和 www.jiumodiary.com/ Leetcode刷题:https://leetcode.com/ ,练习数据结构和算法必备 Co
阅读全文
posted @ 2017-08-08 09:41 xiaoxi666
阅读(1181)
评论(0)
推荐(1)
2025年4月15日
LLM中的Top-K/Top-p/温度都是怎么发挥作用的?
摘要: 写在前面 许多大模型具有推理参数,用于控制输出的“随机性”。常见的几个是 Top-K、Top-p,以及温度。比如我们常用的 Dify 平台就支持 Top-p 和 温度 的设置: 鼠标放到问号上面,可以看到各自的解释: Top-p: 含义:Kernel sampling threshold. Used
阅读全文
posted @ 2025-04-15 22:52 xiaoxi666
阅读(341)
评论(0)
推荐(1)
2025年2月18日
RLHF各种训练算法科普
摘要: 强化学习在LLM中的应用越来越多了,本文针对常见的几种训练算法,用生活中的例子做类比,帮助理解相关概念。 包括:PPO、DRO、DPO、β-DPO、sDPO、RSO、IPO、GPO、KTO、ORPO、SimPO、R-DPO、RLOO,以及GRPO。 PPO(Proximal Policy Optim
阅读全文
posted @ 2025-02-18 23:18 xiaoxi666
阅读(328)
评论(0)
推荐(0)
2025年1月30日
近期最值得关注的AI技术报告与Agent综述!
摘要: Deepseek这么火,来学学底层技术吧!
阅读全文
posted @ 2025-01-30 21:09 xiaoxi666
阅读(748)
评论(0)
推荐(0)
2024年12月9日
通俗理解自注意力机制和多头注意力机制
摘要: 前言 提到注意力机制,你一定会想起Transformer的经典架构图: (图源:https://www.datacamp.com/tutorial/how-transformers-work,这篇文章讲得不错) 初看起来可能一头雾水:向量映射是啥?编码器和解码器是干啥的?前馈机制是啥?为啥要归一化?
阅读全文
posted @ 2024-12-09 11:32 xiaoxi666
阅读(1017)
评论(0)
推荐(0)
你的Docker部署能更简单吗?GitLab集成与多进程管理又怎么做?
摘要: 前言 文章开始前,先尝试回答几个问题: 在日常工作中,程序的打包和部署方式流程是怎样的? 如果使用Docker容器部署方式,是用原生Docker命令,还是Kaniko这类工具? 除了业务服务外,如果还需要同时运行其他进程,应该怎么办?举个例子:除了主服务进程(比如Web服务器),还需要同时启动Ngi
阅读全文
posted @ 2024-12-09 11:30 xiaoxi666
阅读(87)
评论(0)
推荐(0)
什么是南北向流量和东西向流量?
摘要: 在云计算和微服务架构中,南北向流量和东西向流量是两种常见的流量模式。 南北向流量(North-South Traffic) 定义:南北向流量指的是从外部进入系统内部或从系统内部出去的流量,通常是客户端到服务器之间的通信,例如用户通过浏览器或移动应用访问 Web 服务或 API。 特点:这种流量穿过系
阅读全文
posted @ 2024-12-09 11:26 xiaoxi666
阅读(824)
评论(0)
推荐(0)
如何实现LLM的通用function-calling能力?
摘要: 众所周知,LLM的函数function-calling能力很强悍,解决了大模型与实际业务系统的交互问题。其本质就是函数调用。 从openai官网摘图: 简而言之: LLM起到决策的作用,告知业务系统应该调用什么函数,以及入参是什么。 业务系统负责实现对应的函数(比如本地实现,或者调用其他系统提供的服
阅读全文
posted @ 2024-12-09 11:25 xiaoxi666
阅读(2699)
评论(3)
推荐(1)
2024年7月13日
推荐一枚宝藏Up主,顺便聊聊感想
摘要: 众所周知,B站是学习网站😄 最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。 值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的
阅读全文
posted @ 2024-07-13 19:56 xiaoxi666
阅读(411)
评论(0)
推荐(1)
2024年2月13日
Embedding 模型部署及效果评测
摘要: 最近大模型发展迅速,与之对应的向量化需求也被带动起来了,由此社区也衍生出很多模型,本文选几款,简单做下评测。
阅读全文
posted @ 2024-02-13 11:53 xiaoxi666
阅读(18962)
评论(1)
推荐(2)
2023年2月20日
立即执行函数在前端国际化方案中的应用
摘要: 说起国际化,开发过跨区域网页的小伙伴应该都遇到过。我们的网页需要配置多套语言,方便用户进行切换。 本文就以 React 为例,介绍其中一种实现方案,并学习一下其中的知识点。 一种国际化方案 方案是这样的: 为多套语言创建对应的 object,并 export 出去 通过 js 立即执行函数,加载选定
阅读全文
posted @ 2023-02-20 23:40 xiaoxi666
阅读(235)
评论(0)
推荐(0)
下一页
公告
昵 称 :
xiaoxi666
+关注
GitHub :
github.com/xiaoxi666
微信公众号(文章首发公众号,欢迎关注):
昵称:
xiaoxi666
园龄:
11年1个月
粉丝:
52
关注:
5
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
积分与排名
积分 - 150982
排名 - 9182
随笔分类
(125)
c++(14)
java(35)
linux(6)
mac(3)
matlab(1)
maven(10)
other(6)
Qt(1)
版本控制(3)
高并发(1)
计算机网络(3)
开源open source(3)
模板小程序(18)
数据库(3)
算法(17)
转载(1)
更多
阅读排行榜
1. 矩阵求逆的几种方法总结(C++)(82542)
2. vector作为参数的三种传参方式(59790)
3. Qt中纯C++项目发布为dll的方法(超详细步骤)(23825)
4. Embedding 模型部署及效果评测(18959)
5. 理解ScheduledExecutorService中scheduleAtFixedRate和scheduleWithFixedDelay的区别(16953)
评论排行榜
1. 【开源项目】扫雷(31)
2. Qt中纯C++项目发布为dll的方法(超详细步骤)(5)
3. codeM美团编程大赛初赛B轮D题(考验你的数学思维!)(4)
4. 如何实现LLM的通用function-calling能力?(3)
5. 【开源项目】将图片转换为字符画(3)
推荐排行榜
1. vector作为参数的三种传参方式(12)
2. 【开源项目】扫雷(9)
3. 矩阵求逆的几种方法总结(C++)(9)
4. 聊聊 SpringBoot 中的两种占位符:@*@ 和 ${*}(6)
5. Log4j2源码分析:配置加载(4)
TOP
点击右上角即可分享