DECHIN - 博客园

2025年6月25日

PyTorch中实现开立方

摘要：

本文介绍了在PyTorch中直接使用幂次函数计算有可能导致的计算结果异常的问题。由于PyTorch中并未像Numpy和MindSpore一样直接支持cbrt开立方函数，因此这里也提供了一个在PyTorch中计算开立方的函数。阅读全文

posted @ 2025-06-25 17:56 DECHIN 阅读(94) 评论(0) 推荐(0)

2025年6月23日

conda环境部署脚本

摘要：

本文简单的介绍了一下在空白的Ubuntu Linux中安装conda的方法和脚本，其中包含了CUDA部分的安装。阅读全文

posted @ 2025-06-23 10:16 DECHIN 阅读(139) 评论(0) 推荐(0)

2025年6月20日

tensor_scatter_add算子异同点

摘要：

本文介绍了MindSpore中的tensor_scatter_add算子的用法，可以对一个多维的tensor在指定的index上面进行加和操作。在PyTorch中虽然也有一个叫scatter_add的算子，但是本质上来说两者是完全不一样的操作。阅读全文

posted @ 2025-06-20 15:49 DECHIN 阅读(390) 评论(0) 推荐(0)

2025年6月18日

gather算子大不同

摘要：

本文通过2个实际的案例，演示了一下gather算子在MindSpore框架下PyTorch框架下的异同点。两者的输入都是tensor-axis-index，一个是输入顺序上略有区别，另一个是对于输入的张量索引维度的要求。在PyTorch中，如果我们要实现类似于MindSpore中的gather功能，需要手动对输入索引的维度操作一下。阅读全文

posted @ 2025-06-18 15:06 DECHIN 阅读(139) 评论(0) 推荐(0)

2025年6月16日

MindSpore中的ReduceMax和max操作的区别

摘要：

本文介绍了在pytorch和mindspore中两种计算张量最大值的算子，如果直接使用max算子，两者的输出都是最大值元素和最大值索引。但是mindspore中额外的支持了ReduceMax算子，可以允许我们只输出最大值而不输出最大值索引。阅读全文

posted @ 2025-06-16 14:52 DECHIN 阅读(74) 评论(0) 推荐(0)

2025年6月11日

PyTorch中的求余

摘要：

本文通过几个示例，介绍了在Python、Numpy和PyTorch三个不同的框架下，对于求余数函数的定义。比较特殊的是pytorch中的fmod函数，并不符合数学上的求余数方法，而是需要使用remainder函数。阅读全文

posted @ 2025-06-11 15:50 DECHIN 阅读(85) 评论(0) 推荐(0)

2025年6月3日

Python中的cls变量

摘要：

本文介绍了在Python的classmethod装饰的类方法的cls变量的意义，通过几个不同的示例对比，凸显cls变量在Python编程中的应用场景。对于大多数的场景来说，使用普通的Python类和函数定义即可。如果需要在类的外部使用类的内部函数，但是可能有多个不同初始化的类输入，那么可以使用staticmethod进行装饰。如果只有一个类，而有多种不同的输入场景下，可以使用classmethod进行装饰。阅读全文

posted @ 2025-06-03 17:50 DECHIN 阅读(375) 评论(2) 推荐(2)

2025年4月25日

解决Cupy相关报错

摘要：

本文记录了一些使用python-cupy的过程中有可能的遇到的一些问题，一部分是环境配置问题，还有一部分是运行输入问题。阅读全文

posted @ 2025-04-25 15:53 DECHIN 阅读(404) 评论(0) 推荐(0)

2025年4月22日

QUBO建模

摘要：

这篇文章算是对Fred Glover的一篇综述的解读，添加了一些方便直观理解的示例具体的建模过程。对于不同的场景，可以使用不同的惩罚项进行QUBO建模，从而可以使用求解器或者Ising机进行求解。阅读全文

posted @ 2025-04-22 15:17 DECHIN 阅读(768) 评论(0) 推荐(0)

2025年3月12日

KTransformers实战DeepSeek-R1-1.58bit量化模型

摘要：

本文介绍了国产的大模型推理工具KTransformers在本地成功运行的一个案例，在容器化部署的基础上，结合Open WebUI做了一个用户友好的大模型服务。阅读全文

posted @ 2025-03-12 15:34 DECHIN 阅读(2394) 评论(0) 推荐(1)

2025年3月10日

Ollama+DeepSeek+SlackBot

摘要：

本文介绍了一种使用Slack聊天工具中的机器人SlackBot的API接口，实现本地化部署Ollama的DeepSeek大模型的远程通讯方案。相比于调用公网的API接口，数据隐私稍微好一点点。最终的方案应该是自建加密聊天工具+Ollama本地化部署，但是这个时间成本有点高，用户可以自行尝试。阅读全文

posted @ 2025-03-10 10:33 DECHIN 阅读(936) 评论(1) 推荐(1)

2025年3月5日

Cython与CUDA之Add

摘要：

本文介绍了使用CUDA和Cython来实现一个CUDA加法算子的方法，并介绍了使用CUDA参数来估算性能极限的算法。经过实际测试，核函数部分的算法性能优化空间已经不是很大了，更多时候可以考虑使用Stream来优化Host和Device之间的数据传输。阅读全文

posted @ 2025-03-05 09:59 DECHIN 阅读(490) 评论(0) 推荐(0)

2025年3月3日

Cython与CUDA之BatchGather

摘要：

以学习CUDA为目的，接上一篇关于Cython与CUDA架构下的Gather算子实现，这里我们加一个Batch的维度，做一个BatchGather的简单实现。阅读全文

posted @ 2025-03-03 15:54 DECHIN 阅读(430) 评论(0) 推荐(0)

2025年2月28日

DeepSeek满血版测试

摘要：

本文收集了一些目前为止仅有DeepSeek满血版可以正确答复的“简单问题”，以供测试和验证自己所使用的模型是满血版DeepSeek还是残血版的DeepSeek。有两点需要提示：各大厂商模型可以联网更新，本问题集有一定的时效性；部分数学和推理类问题，跟temperature参数的设定有关，temperature参数设置的越低，回答越严谨。阅读全文

posted @ 2025-02-28 16:34 DECHIN 阅读(2964) 评论(0) 推荐(0)

CUDA时长统计

摘要：

这篇文章主要介绍了一个CUDA入门的技术：使用CUDA头文件写一个专门用于CUDA函数运行时长统计的宏，这样就可以统计目标Kernel函数的运行时长。可以直接在CUDA中打印相应的数值，也可以回传到Cython或者Python中进行打印。阅读全文

posted @ 2025-02-28 09:45 DECHIN 阅读(561) 评论(0) 推荐(0)

Dechin的博客

研究兴趣: 分子动力学模拟、量子计算与量子算法、Python编程与深度学习

公告