摘要:
本文针对FlashAttention反向融合算子的性能优化方案展开介绍,并通过优化实现了典型场景4倍左右的性能提升,希望对开发者优化此类基于Ascend C开发的融合算子带来启发。 阅读全文
摘要:
本文介绍了在Python中使用线程池和进程池来实现并发编程的方法,并提供了相应的代码示例。 阅读全文
摘要:
GaussDB作为企业级的数据库,经过了多年的技术发展,具备丰富的技术特性,使用LLVM技术后提升了系统的查询性能,使得开发者在OLAP和OLTP多场景中均受益。 阅读全文