2022年1月4日

摘要: 一、背景 由于GIL的存在,python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程。 Python提供了非常好用的多进程包multiprocessing,只需要定义一个函数,Python会完成其他所有事情。借助这个包,可以轻松完成从 阅读全文
posted @ 2022-01-04 21:41 dychen0408 阅读(7975) 评论(0) 推荐(0) 编辑
 
摘要: Pandas 是一个强大的分析结构化数据的工具,它基于 Numpy(提供高性能的矩阵运算三方库),是 Python 数据挖掘和数据分析领域的事实标准三方库。 这里有很全面的Pandas教程:pandas 教程,该教程不需要去先学习 python 和 numpy 库。 pandas如何创建 假设有个表 阅读全文
posted @ 2022-01-04 21:13 dychen0408 阅读(198) 评论(0) 推荐(0) 编辑
 

2021年5月26日

摘要: MLE(极大似然估计)与MAP(最大后验估计)在机器学习中是经常用到的参数估计的方法。都属于频率学派的参数估计。 一、极大释然估计(MLE) MLE在构造目标函数过程中非常常见。已知了观测的样本值为$D$,MLE核心思想是:假设我们已知了该样本内定的一个参数$\theta$,这个参数$\theta$ 阅读全文
posted @ 2021-05-26 13:44 dychen0408 阅读(546) 评论(0) 推荐(0) 编辑
 

2021年5月25日

摘要: 一、scipy库的LP scipy库官方文档:Linear Programming 官方文档例子 利用官方的lingprog:API介绍 1.1 线性规划 利用官方的API的标准形式如下: 最小化目标函数 约束条件是小于等于 或者 等于 转化为矩阵的形式 1.2 linprog scipy.opti 阅读全文
posted @ 2021-05-25 22:37 dychen0408 阅读(236) 评论(0) 推荐(0) 编辑
 

2021年1月22日

摘要: 说明:主要参考资料来源于cs860 在本节中,我们介绍差分隐私,首先我们会介绍Warner提出的第一个差分隐私算法[1]。 一、Randomized Response 问题描述 问题: 假设自己是一个班级的老师,这个班级有一场考试,但是这场考试有很多人作弊,但是自己不确定多少人作弊。那怎么你怎么能计 阅读全文
posted @ 2021-01-22 21:05 dychen0408 阅读(872) 评论(0) 推荐(1) 编辑
 

2021年1月20日

摘要: 一、背景 左侧描述经典的数据处理和机器学习流程。 中间的数据预处理、特征工程、算法选择、超参数优化四个步骤,有很多参数,很复杂,如何自动处理? 二、Introduction 自动将四个步骤进行自动化处理 主要流程有以下四部分: 数据预处理:数据收集、数据清洗、数据增广等 特征工程: 特征选择、提取和 阅读全文
posted @ 2021-01-20 19:51 dychen0408 阅读(111) 评论(0) 推荐(0) 编辑
 

2021年1月14日

摘要: 绝大部分内容都来自:浅谈「正定矩阵」和「半正定矩阵」 若侵权则删除 浅谈「正定矩阵」和「半正定矩阵」 在众多的机器学习模型中,线性代数的身影无处不在,当然,我们也会时常碰到线性代数中的正定矩阵和半正定矩阵。例如,多元正态分布的协方差矩阵要求是半正定的。 × × 1. 基本的定义 正定和半正定这两个词 阅读全文
posted @ 2021-01-14 16:48 dychen0408 阅读(786) 评论(0) 推荐(0) 编辑
 

2021年1月13日

摘要: 先说一下协方差和相关系数 1.协方差 公式:$$ Cov(X,Y) = E[(X-\mu_x)(Y-\mu_y)]$$ 其中,$\mu_x$和$\mu_y$是随机变量$X$ 和$Y$的均值,两个随机变量的值对其均值的偏差相乘,然后再求期望。 如果$(X-\mu_x)\(与\)(Y-\mu_y)$同号 阅读全文
posted @ 2021-01-13 20:55 dychen0408 阅读(1666) 评论(0) 推荐(0) 编辑
 

2021年1月3日

摘要: 保存数据到文件(磁盘) 1.利用numpy中的save() 和 load()保存单种数据 保存 import numpy as np filename = '**path and file **' np.save(file,data) 加载 data= np.load('**path and fil 阅读全文
posted @ 2021-01-03 22:17 dychen0408 阅读(296) 评论(0) 推荐(0) 编辑
 

2020年12月3日

摘要: 一、生成array\list\tensor 1.生成array import numpy as np a1 = array([[1,2],[3,4]]) 2. 生成list a2 = list(range(16)) 3.生成tensor import torch a3 = torch.tensor( 阅读全文
posted @ 2020-12-03 16:59 dychen0408 阅读(5013) 评论(0) 推荐(0) 编辑