摘要: 本文针对FlashAttention反向融合算子的性能优化方案展开介绍,并通过优化实现了典型场景4倍左右的性能提升,希望对开发者优化此类基于Ascend C开发的融合算子带来启发。 阅读全文
posted @ 2024-06-12 14:08 华为云开发者联盟 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 本文介绍了在Python中使用线程池和进程池来实现并发编程的方法,并提供了相应的代码示例。 阅读全文
posted @ 2024-06-12 10:04 华为云开发者联盟 阅读(576) 评论(0) 推荐(3) 编辑
摘要: GaussDB作为企业级的数据库,经过了多年的技术发展,具备丰富的技术特性,使用LLVM技术后提升了系统的查询性能,使得开发者在OLAP和OLTP多场景中均受益。 阅读全文
posted @ 2024-06-12 09:24 华为云开发者联盟 阅读(60) 评论(0) 推荐(0) 编辑