2

定制化训练DeepSeek模型:LoAR、COT推理与SFT技术应用

DeepSeek-R1 模型微调系列 DeepSeek-R1 模型微调系列一. 前言介绍本文内容:1.1 项目背景1.2 LoRA和 QLoRA 简介1.3 LLaMA 架构和 Qwen 架构LLaMA 架构Qwen 架构二. 环境准备2.1 Unsloth 安装(显卡版本-暂时不用)2.2 创建P ...

宁采臣open 发布于 2025-02-12 15:15 评论(0) 阅读(177)
0

学习深度学习入门必看(基于Python3)《深度学习入门:基于Python的理论与实现》PDF免费下载

人工智能书籍教程,日本深度学习入门书,基于python3,从零创建一个深度学习模型。 本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度... ...

不知名也 发布于 2025-02-09 17:30 评论(0) 阅读(25)
0

FunPapers[1]: GBDT和DNN强强联手,表格预测新突破!

论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。 ...

Milkha 发布于 2025-01-28 00:30 评论(0) 阅读(34)
0

TensorFlow2入门与实践--CNN

卷积神经网络CNN CNN原理 关于CNN的原理本文使用代码的方式来直观理解卷积中各个操作过程。 卷积 卷积层是CNN的核心组件,通过可学习的卷积核在输入特征图上进行滑动窗口操作。每个位置上,卷积核与输入进行逐元素乘积并求和,得到输出特征图上的一个值。多个卷积核并行工作可以提取不同的特征模式。卷积层 ...

清水芙涟 发布于 2025-01-25 21:45 评论(0) 阅读(152)
2

贝叶斯机器学习:最大熵及高斯分布

高斯分布,也被称为正态分布,广泛应用于连续型随机变量分布的模型中。高斯分布可以从多个不同的角度来理解。例如,对于一个一元实值向量,使得熵取得最大值的是高斯分布。这个性质对于多元高斯分布也成立。当我们考虑多个随机变量之和的时候,也会产生高斯分布。观察式多元高斯分布的形式,考虑其中在指数位置上出现的二次... ...

orion-orion 发布于 2025-01-23 23:12 评论(0) 阅读(415)
0

线性代数13.向量的线性相关性&内积&范数&正交

13.向量的线性相关性&内积&范数&正交 13.1 向量组的线性相关性 13.1.1 定义 对于任意向量组\(A:a_1,a_2,a_3,...,a_n\),存在不全为0的数\(k_i(i=1,2,3,...,m)\),使: \[\tag{1} \sum_{i=1}^mk_i\cdot a_i=0 ...

nafe 发布于 2025-01-14 23:48 评论(0) 阅读(34)
0

线性代数12.矩阵的秩及相关性质

12.矩阵的秩及相关性质 12.1 k阶子式 12.1.1 k阶子式示例 设存在以下矩阵: \[X_{mn}= \begin{bmatrix} x_{11} & x_{12} & x_{13} & ... & x_{1n}\\ x_{21} & x_{22} & x_{23} & ... & x_{ ...

nafe 发布于 2025-01-12 23:22 评论(0) 阅读(29)
0

线性代数11.三种初等矩阵及其性质

11.三种初等矩阵及其性质 11.1 三种初等矩阵 设存在列向量A: \[A= \begin{bmatrix} a_1\\ a_2\\ a_3\\ a_4\\ ...\\ a_i\\ ...\\ a_j\\ ...\\ a_n \end{bmatrix} \]则以下\(X_1,X_2,X_3\)三种 ...

nafe 发布于 2025-01-11 14:49 评论(0) 阅读(35)
1

贝叶斯机器学习:共轭先验

离散随机变量的二项分布和多项式分布,以及连续随机变量的高斯分布,这些都是参数分布(parmetric distribution)的具体例子。之所以被称为参数分布,是因为少量可调节的参数控制了整个概率分布。在频率派的观点中,我们通过最优化某些准则(例如似然函数)来确定参数的具体值。而在贝叶斯派的观点中... ...

orion-orion 发布于 2025-01-08 18:55 评论(0) 阅读(216)
0

线性代数10.矩阵的初等变换&矩阵的标准形

10.矩阵的初等变换 10.1 矩阵初等变换的规则 对于任意存在第\(i,j\)两行、或第\(i,j\)两列的矩阵,满足以下初等变换规则: 10.1.1 对调 对调\(i,j\)两行,记为:\(r_i \leftrightarrow r_j\) 对调\(i,j\)两列,记为:\(c_i \leftr ...

nafe 发布于 2025-01-07 23:04 评论(0) 阅读(45)
0

线性代数9.矩阵的逆-分块矩阵

9.矩阵的逆-分块矩阵 9.1 分块矩阵的加法 设矩阵\(A、B均为m\times n\)的矩阵,且A、B均按相同的方式划分为\(s \times t\)块,其中: \[A= \begin{bmatrix} A_{11} &...&A_{1t}\\ &...&\\ A_{s1} &...&A_{st ...

nafe 发布于 2025-01-06 17:25 评论(0) 阅读(52)
0

线性代数8.矩阵的逆-相关性质&特殊矩阵&算法应用

8.矩阵的逆 8.1 相关性质 性质1:若矩阵A可逆,则\(A^{-1}\)也可逆: \[(A^{-1})^{-1}=A \] 性质1的证明:\(A \cdot A^{-1}=E\) 性质2:若矩阵A可逆,则\(\lambda \cdot A\)也可逆: \[(\lambda \cdot A)^{- ...

nafe 发布于 2025-01-05 20:16 评论(0) 阅读(55)
0

线性代数7.矩阵的逆-定义&定理

7.矩阵的逆-定义和定理 7.1 逆矩阵的定义 对于n阶矩阵A,存在一个n阶矩阵B,使: \[AB=BA=E \]则称矩阵A是可逆的。 且B是A的逆矩阵,简称“逆阵”,记为: \[B=A^{-1} \]7.2 对逆矩阵的理解 若存在矩阵\(A_{n×n}\)、\(X_{n×1}\)、\(Y_{n×1 ...

nafe 发布于 2025-01-05 17:46 评论(0) 阅读(116)
0

动手深度学习-PyTorch(第二版)PDF、EPUB免费下载

李沐,动手深度学习,中文第二版,2023年8月18日。 本书是《动手学深度学习》的重磅升级版本,选用经典的PyTorch深度学习框架,旨在向读者交付更为便捷的有关深度学习的交互式学习体验。 本书重新修订《动手学深度学习》的所有内容,并针对技术的发展,新增注意力机制、预训练等内容。本书包含15章,第... ...

不知名也 发布于 2025-01-05 16:40 评论(0) 阅读(403)
0

线性代数6.矩阵的行列式-代数余子式

6.矩阵的行列式-代数余子式 6.1 余子式和代数余子式 设存在n阶行列式\(|A|\),并存在\(|A|\)中的元素\(a_{ij}\) 则\(|A|\)中,除去元素\(a_{ij}\)所在的第\(i\)行和第\(j\)列所有元素后,剩下元素所形成的行列式称为\(a_{ij}\)的\(余子式\), ...

nafe 发布于 2025-01-04 16:36 评论(0) 阅读(64)
0

线性代数5.矩阵的行列式-相关性质

5.矩阵的行列式-相关性质 若存在行列式: \[|A|= \begin{vmatrix} a_{11} & a_{12} & a_{13} &...& a_{1n}\\ a_{21} & a_{22} & a_{23} &...& a_{2n}\\ a_{31} & a_{32} & a_{33} ...

nafe 发布于 2025-01-01 23:29 评论(0) 阅读(52)
0

线性代数4.矩阵的行列式-特殊矩阵的行列式求值

4.矩阵的行列式-特殊矩阵的行列式求值 (1)设存在以下n阶行列式\(|A_1|\): \[|A_1|= \begin{vmatrix} \lambda_{11}\\ & \lambda_{22}\\ && \lambda_{33}\\ &&&\lambda_{44}\\ &&&&...\\ &&& ...

nafe 发布于 2024-12-30 17:54 评论(0) 阅读(16)
0

线性代数3.矩阵的行列式-二阶行列式&n阶行列式计算

3.矩阵的行列式-二阶行列式&克莱姆法则&n阶行列式计算 3.1 二阶行列式 定义: \[形如 \begin{vmatrix} a & b\\ c & d \end{vmatrix} 的式子为二阶行列式,其中\begin{vmatrix} a & b\\ c & d \end{vmatrix}=ad ...

nafe 发布于 2024-12-29 23:32 评论(0) 阅读(32)
0

线性代数2.矩阵的迹&转置&对称矩阵

2.矩阵的迹&转置&对称矩阵 2.1 矩阵的迹 定义: \(n \times n\)矩阵主对角线上元素的总和称为\(矩阵的迹\) 矩阵X的迹记为\(tr(X)\) 示例: 设存在以下\(n \times n\)的矩阵: \[X_{n \times n}= \begin{bmatrix} x_{11} ...

nafe 发布于 2024-12-27 23:13 评论(0) 阅读(151)
0

线性代数1.矩阵的基本概念&意义&特殊矩阵&基本运算

1.矩阵的基本概念&意义&特殊矩阵&基本运算 1.1 矩阵的定义: 矩阵是由\(m \times n\)个数排成的数表。 如以下矩阵: \[X= \begin{bmatrix} x_{11} & x_{12} & x_{13} & ... & x_{1n}\\ x_{21} & x_{22} & x ...

nafe 发布于 2024-12-27 14:21 评论(0) 阅读(116)

统计信息

  • 博客 - 795558
  • 随笔 - 11518198
  • 文章 - 972546
  • 评论 - 4154262