只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2019-10-30 23:29 qccz123456 阅读(35) 评论(0) 推荐(0)
摘要: RDMA → RoCE v2 → UDP/IP ↘ IB ↘ iWARP → TCP/IP RDMA是网络数据传输的技术规范,与TCP/IP是类似,IB和RoCE v2是RDMA的具体实现: 1)InfiniBand,IB:需采用全套专用IB设备,成本高、延时极低、CPU开销极低,为HPC和AI训练 阅读全文
posted @ 2026-01-20 20:39 qccz123456 阅读(4) 评论(0) 推荐(0)
摘要: deepseek-ocr-app 安装和使用 Hardware and Drive river Version: 580.105.08 CUDA Version: 13.0 GPU-Memory: more than 10GB $ nvidia-smi + + | NVIDIA-SMI 580.10 阅读全文
posted @ 2025-11-29 14:14 qccz123456 阅读(20) 评论(0) 推荐(0)
摘要: LLM推理的后处理 LLM推理的后处理是将模型“原始”且可能“粗糙”的输出,转化为安全合规(道德合法等)、格式化、结构化的结果。 flowchart TD A[LLM生成原始文本] --> B[安全与质量过滤] subgraph B [安全与质量过滤] B1[内容安全过滤] B2[事实性核查] B3 阅读全文
posted @ 2025-11-26 09:51 qccz123456 阅读(25) 评论(0) 推荐(0)
摘要: 1 核心概念:Symbolic(符号式) vs. Imperative(命令式) 特性 Symbolic(符号式/声明式) Imperative(命令式) 核心思想 先定义,后执行。像画蓝图,先声明计算流程(计算图),然后再喂入数据执行。 边定义,边执行。像捏粘土,每个操作指令会立即执行并返回结果。 阅读全文
posted @ 2025-11-24 17:46 qccz123456 阅读(34) 评论(0) 推荐(0)
摘要: build_engine: trt.Builder(TRT_LOGGER) ↓ ↓ network config ↓ ↓ Snetwork Sconfig ↓ ↓ plan(serialized_network) runtime ↓ ↓ engine(deserialize_cuda_engine) 阅读全文
posted @ 2025-08-05 15:21 qccz123456 阅读(22) 评论(0) 推荐(0)
摘要: 1)SpecINT SepcJBB SpecPower SpecFloat 2)lmbench 3)STREAM 阅读全文
posted @ 2025-07-15 10:25 qccz123456 阅读(18) 评论(0) 推荐(0)
摘要: ![](https://img2024.cnblogs.com/blog/1706941/202407/1706941-20240705112534177-2000198722.png) 阅读全文
posted @ 2024-07-05 11:25 qccz123456 阅读(14) 评论(0) 推荐(0)
摘要: ![](https://img2024.cnblogs.com/blog/1706941/202407/1706941-20240705112354552-1335000917.png) 阅读全文
posted @ 2024-07-05 11:24 qccz123456 阅读(23) 评论(0) 推荐(0)
摘要: 概念篇 1.1 什么是推荐系统? 1.1.1 能做什么? 推荐系统可以把那些最终会在用户(User) 和物品(Item)之间产生的连接提前找出来。 强调 “连接”,人与任何其他的连接, 其他可指人、咨询、消费品、服务等。 1.1.2 需要什么? 需要已经存在的连接,从已有的连接去预测未来的连接。 1 阅读全文
posted @ 2024-07-05 10:36 qccz123456 阅读(47) 评论(0) 推荐(0)
摘要: mkldnn的文件目录结构如下: doc/:文档说明,基本在 http://intel.github.io/mkl-dnn/index.html 中已经展示 advanced/:关于int8量化和版本更新的说明 build/: 关于build、build_options和link design/:关 阅读全文
posted @ 2024-07-01 10:38 qccz123456 阅读(109) 评论(0) 推荐(0)