摘要:
# -*- coding:utf-8 -*- __Author__ = "KrianJ wj_19" __Time__ = "2020/3/17 12:23" __doc__ = """ """ import numpy as np def data_initialize(A, B, pai, O) 阅读全文
摘要:
1. 一般laplacian矩阵(ordinary laplacian matrix) 对于给定n个顶点的简单图G, 它的Laplacian matrix 定义如下 L = D - A D是图G的度矩阵,A为图G的邻接矩阵。(例子来源:wikipedia) 2. laplacian matrix的几 阅读全文
摘要:
1. 直推式的PCA 基本步骤: 对样本数据进行中心化处理(这步操作比较重要,特别是对推导公式) 求样本的协方差矩阵; 对样本的协方差矩阵进行特征值分解,并通过前k个特征值对应的特征向量进行映射: PCA的优化目标是: X = D + N,即低秩矩阵D和独立同分布的Gaussian噪声; 1 def 阅读全文
摘要:
1. 归一化和标准化 1 import numpy as np 2 from numpy import sqrt 3 4 5 def normalize(mtx, a=0, b=1): 6 """ 7 normalization: remove dimensional effects 8 range 阅读全文
摘要:
1.百度搜索关键词提交 百度的搜索路径格式是:http://www.baidu.com/s?wd=keyword import requests keyword = "Python" try: kv = {'wd': keyword} url = "http://www.baidu.com/s" r 阅读全文
摘要:
requests库主要方法 import requests requests.request(method, url, **kwargs) """构造一个请求,支撑下面各种基础方法""" # **kwarg包括params, data, json, headers, cookies, auth, f 阅读全文
摘要:
一、基本形式 设定由n个属性描述的示例X = (x1; x2; x3; ...; xn),xi是X第i个属性的取值。线性模型尝试通过属性的线性组合来进行描述和预测 f(X) = w1*x1 + w2*x2 + ...+wn*xn + b, 其中w是各属性的组合系数。f(X)也可以用向量形式表达。学得 阅读全文
摘要:
模型评估是对学习器泛化能力有效可行的实验估计方法。而性能度量是衡量模型泛化能力的评价标准。性能度量反应了任务需求,在对比不同模型能力时,使用不同的性能度量往往会导致不同的评估结果。模型的好坏不仅取决于算法和数据,还有任务需求。 1.错误率与精度 最常用的两种性能度量,对于样例集D={(x1,y1), 阅读全文
摘要:
一.经验误差和过拟合 错误率 E=a/m, a分类错误的样本数,m样本总数 精度 = 1 - E。 学习器在训练集上的误差:训练误差;在新样本上的误差:泛化误差。好的学习器应在新样本上表现优秀,因此学习器应尽可能掌握样本的潜在规律,提升泛化性能。 过拟合:学习能力过于强大,样本训练时将样本“自身特点 阅读全文
摘要:
一、学习任务的分类 1。监督学习(supervised learning):分类、回归等。监督指标签,监督学习通过已知训练样本得到最优训练模型,适用于新数据上。反复这样的过程,模型就有了预测能力。 2.无监督学习(unsupervised learning):聚类等,不通过训练直接对数据进行建模分析 阅读全文