摘要: 数据来源:House Prices - Advanced Regression Techniques 参考文献: Comprehensive data exploration with Python 1. 导入数据 import pandas as pd import warnings warnin 阅读全文
posted @ 2023-09-11 20:16 October- 阅读(193) 评论(0) 推荐(0) 编辑
摘要: Semi-Supervised Domain Adaptation with Source Label Adaptation 具有源标签适应的半监督域适应 原文链接 Abstract 文章指出当前的半监督域适应(Semi-Supervised Domain Adaptation, SSDA)方法通常 阅读全文
posted @ 2023-09-06 10:49 October- 阅读(885) 评论(0) 推荐(0) 编辑
摘要: 何为强化学习 机器学习的一大分支 强化学习(Reinforcement Learning)是机器学习的一种,它通过与环境不断地交互,借助环境的反馈来调整自己的行为,使得累计回报最大。 强化学习要解决的是决策问题——求取当前状态下最优行为或行为概率。 强化学习包括智能体和环境两大对象,智能体是算法本身 阅读全文
posted @ 2023-07-13 10:55 October- 阅读(255) 评论(0) 推荐(1) 编辑
摘要: ## 1. 决策树 ### 熵 在热力学中,熵(entropy)被用来衡量系统的不稳定程度。香农在论文《通信的数学原理》中提出信息熵的概念,目的是*量化数字信息的价值*。 #### 信息熵的定义 香农提出的量化信息方式: $$H(P_1,P_2,\cdots P_n)=-\sum^n_{i=1}P_ 阅读全文
posted @ 2023-03-26 16:51 October- 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 1. 高斯过程 高斯过程(Gaussian Process)是一种假设训练数据来自无限空间且各特征都符合高斯分布(高斯分布又称“正态分布”)的有监督学习。 高斯过程是一种概率模型,在回归或分类预测都以高斯分布标准差的方式给出预测置信区间估计。 随机过程 高斯过程应用于机器学习已有数十年历史,,它来源 阅读全文
posted @ 2023-03-18 16:49 October- 阅读(467) 评论(0) 推荐(0) 编辑
摘要: 1. 支持向量机 支持向量机(Support Vector Machine, SVM)最初被用来解决线性问题,加入核函数后能够解决非线性问题。主要优点是能适应小样本数量 高维度特征的数据集,甚至是特征维度数高于训练样本数的情况。 先介绍几个概念: 最优超平面:Hyperplane,SVM通过学习数据 阅读全文
posted @ 2023-03-15 20:43 October- 阅读(455) 评论(0) 推荐(0) 编辑
摘要: 1. 梯度下降 梯度下降(Gradient Descent)是计算机计算能力有限的条件下启用的逐步逼近、迭代求解方法,在理论上不保证下降求得最优解。 e.g. 假设有三维曲面表达函数空间,长(x)、宽(y)轴为子变量,高(z)是因变量,若使用梯度下降法求解因变量最低点的步骤如下: 任取一点作为起始点 阅读全文
posted @ 2023-03-11 15:25 October- 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 1. 线性模型 有监督学习是通过已知的样本产生预测模型的学习方法,任何有监督学习模型都可被想象成一个函数: $$y=f(x_1,x_2,x_3,...x_n) \tag{1-1}$$ 其中,$x_1,x_2,x_3...x_n$是模型的n维的特征值,$y$是要预测的目标值/分类,当$y$是可枚举的类 阅读全文
posted @ 2023-03-10 17:04 October- 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 前言 对中文标题使用余弦相似度算法和编辑距离相似度分析进行相似度分析。 准备数据集part1 本次使用的数据集来源于前几年的硕士学位论文,可根据实际需要更换。结构如下所示: 学位论文题名 基于卷积神经网络的人脸识别研究 P2P流媒体视频点播系统设计和研究 校园网安全体系的设计与实现 无线传感器网络中 阅读全文
posted @ 2023-02-16 22:22 October- 阅读(573) 评论(1) 推荐(1) 编辑
摘要: 前言 之前尝试写过一个爬虫,那时对网页请求还不够熟练,用的原理是:爬取整个html文件,然后根据标签页筛选有效信息。 现在看来这种方式无疑是吃力不讨好,因此现在重新写了一个爬取天气的程序。 准备工作 网上能轻松找到的是 101010100 北京这种编号,而查看中国气象局URL,他们使用的是北京545 阅读全文
posted @ 2023-02-07 16:25 October- 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 检验 在概率论中,检验是一种方法,用于判断一个假设是否成立。 这个假设通常被称为“零假设”,它表示不存在显著的差异或关联。在检验中,我们收集样本数据,并计算出一个检验统计量,以检验这个假设的真实性。如果检验统计量的值超出了我们预先设定的“显著性水平”,我们就会拒绝零假设,并认为假设不成立。 通常,我 阅读全文
posted @ 2023-01-09 13:10 October- 阅读(679) 评论(0) 推荐(0) 编辑
摘要: 同步和异步 同步和异步是指程序的执行方式。在同步执行中,程序会按顺序一个接一个地执行任务,直到当前任务完成。而在异步执行中,程序会在等待当前任务完成的同时,执行其他任务。 同步执行意味着程序会阻塞,等待任务完成,而异步执行则意味着程序不会阻塞,可以同时执行多个任务。 同步和异步的选择取决于你的程序需 阅读全文
posted @ 2023-01-03 22:31 October- 阅读(104) 评论(0) 推荐(0) 编辑