随笔分类 - ML
常见机器学习和基础
摘要:一、DT(决策树算法)概述 一句话:以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处熵值为0(叶节点中的实例都属于一类)。 自顶向下的递归方法选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程。 决策树算法:ID3和C4.5都是基于信息增益作为特征选择的度量,C
阅读全文
摘要:一、KNN(k-近邻算法)工作原理 一句话:从训练集中找出k个最接近测试数据的训练样本,再从这k个样本中找出出现次数最多的分类,作为测试数据的分类。 存在一个样本数据集合(训练样本集)且样本集中每个数据都存在标签(即我们知道样本集中每一数据与所属分类的对应关系); 输入没有标签的数据后,将该数据的每
阅读全文
摘要:显卡 显卡至少GeForece RTX 2060,因为只有rtx系列有Tensor Core。从性价比、可靠性多方面看,使用台式机更好。 对于深度学习显卡,显存比频率核心更重要。比如Titan X有12G的显存,不仅可接受一般任务,而且也可参加Kaggle、天池比赛,需要6G左右。若要实现一下网络,
阅读全文
摘要:显示PCA中主成分方差占比情况: from numpy import * import numpy as np import matplotlib.pyplot as plt from matplotlib.pyplot import MultipleLocator def pca(dataMat,
阅读全文
摘要:pca中所获得的特征值取值规则:距离最大值在e-02之内,即可。e.g:5.0e-05到1.0e-03的级别即可
阅读全文
摘要:头文件:import numpy as np isnan,~isnan:判断数据或数组中元素的属性是否为NaN, isnan:若是NaN返回True ~isnan:若是非NaN返回True nonzero:判断是否为True,并返回对应的索引值。该索引值可用于matrix取值。 linspace:在
阅读全文
摘要:pip install opencv-python 运行demo: import cv2 img = cv2.imread(r"C:\\Users\\wucj\\Desktop\\lion.jpg", 1) cv2.imshow("1", img) cv2.waitKey()
阅读全文
摘要:官方文档:https://numpy.org/doc/stable/reference/generated/numpy.matrix.html?highlight=matrix#numpy.matrix numpy开源项目:https://github.com/ddbourgin/numpy-ml
阅读全文