摘要:
原文链接:https://blog.csdn.net/nan355655600/article/details/106246625 YOLO v3 Yolov3是2018年发明提出的,这成为了目标检测one-stage中非常经典的算法,包含Darknet-53网络结构、anchor锚框、FPN等非常 阅读全文
摘要:
4.机器调度问题 m台机器,n个任务,每个任务时间可能不一致,求如何分配,在最短的时间完成任务? def machine(time_list,m): time_list.sort(reverse=True) if len(time_list)<=m: return time_list[0] else 阅读全文
摘要:
1.冒泡排序 def bubblesort(nums): for i in range(len(nums)-1): for j in range(len(nums)-i-1):if nums[j]>nums[j+1]: nums[j],nums[j+1] =nums[j+1],nums[j] ret 阅读全文
摘要:
线性回归(正规方程求解,损失函数形式为最小二乘法) 案例: from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing 阅读全文
摘要:
决策树的三种算法实现 当然决策树的原理不止信息增益这一种,还有其他方法。但是原理都类似,我们就不去举例计算。 ID3 信息增益 最大的准则 C4.5 信息增益比 最大的准则 CART 分类树: 基尼系数 最小的准则 在sklearn中可以选择划分的默认原则 优势:划分更加细致(从后面例子的树显示来理 阅读全文
摘要:
朴素? 假设:特征与特征之间是相互独立 贝叶斯公式(变式如下): P(B|A)=P(A|B)*P(B)/P(A) 应用场景: 文本分类 单词作为特征 拉普拉斯平滑系数: 目的:防止计算出的分类概率为0 计算出现 影院,支付宝,云计算 属于娱乐的概率?(未算分母P(A)) P(娱乐|影院,支付宝,云计 阅读全文
摘要:
KNN核心思想: 你的“邻居”来推断出你的类别 计算距离: 欧氏距离 曼哈顿距离 绝对值距离 明可夫斯基距离 如果取的最近的电影数量不一样?会是什么结果? k 值取得过小,容易受到异常点的影响 k 值取得过大,样本不均衡的影响(投票机制,少数服从多数,一般取奇数) 结合前面数据,分析K-近邻算法需要 阅读全文
摘要:
转换器 - 特征工程的父类 1 实例化 (实例化的是一个转换器类(Transformer)) 2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 标准化: (x - mean) / std fit_transform() fit() 计算 每一列的平均值、标准差 trans 阅读全文
摘要:
降维的两种方式 特征选择 主成分分析(可以理解一种特征提取的方式) 降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 特征选择:数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。 Filter(过滤式):主要探究特征本身特点、特征与 阅读全文
摘要:
为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征 我们需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 归一化: from sklearn.preprocessing 阅读全文