会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
33
下一页
2026年1月23日
数据中心 级间空调调控
摘要: “级间空调”通常指的是应用于行级空调或列间空调这种贴近热源的精确制冷方式。它们位于服务器机柜排之间(行间)或紧靠机柜侧面(列间),与传统的房间级空调相对。 1. 送风温度 定义:指空调机组将处理后的冷空气吹出时的温度。这是你为IT设备提供的“进口”空气温度。 测量点:通常在空调出风口的百叶窗或风帽处
阅读全文
posted @ 2026-01-23 10:51 wangssd
阅读(34)
评论(0)
推荐(0)
2026年1月15日
llm 绝对位置编码/相对位置编码/旋转位置编码
摘要: 位置编码(Positional Encoding, PE)是Transformer架构能够理解序列顺序的关键组件, Transformer 的核心组件 ——自注意力机制(Self-Attention) 是置换不变性(Permutation Invariant)的,即它本身不感知输入序列中 token
阅读全文
posted @ 2026-01-15 16:42 wangssd
阅读(176)
评论(0)
推荐(0)
2026年1月14日
技术选型
摘要: AutoGen、Dify、coze、langChain、langGraph选型 LangChain / LangGraph: AI应用的“底层开发框架”。为开发者提供模块化组件和设计模式,需要较强的编程能力,灵活性极高。 AutoGen: 专注于“多智能体对话”的框架,通过对话驱动多智能体间的协作。
阅读全文
posted @ 2026-01-14 16:15 wangssd
阅读(66)
评论(0)
推荐(0)
2026年1月6日
llama-factory 安装报错 if "const" in schema: TypeError: argument of type 'bool' is not iterable ERROR: Exception in ASGI application
摘要: 报错信息: (llamaFactory) root@autodl-container-d19d40bcb0-1bd39636:~/autodl-tmp/project/LlamaFactory-0.9.1/src# llamafactory-cli webui /root/autodl-tmp/co
阅读全文
posted @ 2026-01-06 17:40 wangssd
阅读(39)
评论(0)
推荐(0)
2026年1月4日
粒子群算法PSO/强化学习
摘要: 强化学习(Reinforcement Learning, RL)和粒子群算法(Particle Swarm Optimization, PSO)是两类不同范式的智能优化方法。 1)动态序贯问题:环境一直在变,每一步的决策会影响下一步的环境,需要连续调整策略,追求长期整体最优。→ 用强化学习 2)静态
阅读全文
posted @ 2026-01-04 14:54 wangssd
阅读(46)
评论(0)
推荐(0)
2025年12月31日
粒子群优化算法(Particle Swarm Optimization, PSO)
摘要: 粒子群优化(Particle Swarm Optimization, PSO)是一种基于群体智能的随机优化算法,模拟鸟群、鱼群的群体觅食行为,通过个体间的信息共享和协作在解空间中寻找最优解。 在自然界中,鸟群觅食会表现出两个核心特征: 社会信息共享: 单只鸟不知道食物(最优解)在哪里,但会关注附近哪
阅读全文
posted @ 2025-12-31 14:20 wangssd
阅读(211)
评论(0)
推荐(0)
2025年12月30日
市场估值 PE(市盈率)/ PEG(市盈率相对盈利增长比率)
摘要: 收益 每股收益(EPS)是公司 “赚” 了多少钱,每股分红是公司决定 “给” 你多少钱。 核心区别 概念全称含义归属权 每股收益 Earnings Per Share (EPS) 公司的利润。即公司每一股股票背后代表的净利润。 属于公司(虽然理论上属于股东,但公司可以决定怎么花)。 每股分红 Div
阅读全文
posted @ 2025-12-30 09:56 wangssd
阅读(160)
评论(0)
推荐(0)
2025年12月29日
deepspeed/vllm底层原理
摘要: DeepSpeed 聚焦于大模型高效训练(同时支持推理优化),通过分布式技术突破训练的显存、算力瓶颈; vLLM 专注于大模型高吞吐、低延迟推理,核心解决推理阶段的显存利用率和请求处理效率问题。 一、DeepSpeed 底层原理 DeepSpeed 是微软推出的分布式训练 / 推理框架,核心目标是让
阅读全文
posted @ 2025-12-29 14:46 wangssd
阅读(194)
评论(0)
推荐(0)
2025年12月26日
编码器(Encoder) / 解码器(Decoder) / 编码器-解码器(Encoder-Decoder)架构
摘要: 大模型的架构主要可分为编码器(Encoder)、解码器(Decoder)、编码器 - 解码器(Encoder-Decoder) 三大类,不同架构适用于不同的任务场景。 一、 编码器架构(Encoder-only) 核心思想:基于双向注意力机制,能够完整捕捉输入序列的上下文信息,擅长理解类任务。 核心
阅读全文
posted @ 2025-12-26 13:30 wangssd
阅读(133)
评论(0)
推荐(0)
llm 视频/语音对齐(风景视频/虚拟主播)
摘要: 1. 风景视频类型(无需对口型) 1. 文本输入模块 职责:接收用户的原始文本(支持纯文本、带情绪标注的文本,比如[欢快]今天天气很好),做基础校验(非空、长度限制)。 设计要点:支持文本分段(比如按句号 / 逗号拆分,匹配视频镜头节奏)、保留文本的情绪 / 语速标注。 2. 文本处理与拆分模块 职
阅读全文
posted @ 2025-12-26 11:00 wangssd
阅读(64)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
33
下一页
公告