Fork me on GitHub

随笔分类 -  AI人工智能 / 机器学习

机器学习
摘要:8. 数据科学的几种分布 出发点 如果我的数据有足够多的可利用的信息,那么我可以直接做我喜欢的事了, 但是现在如果没有那么多的信息,我可不可以在数学上进行一些投机呢? 低维(比如我只知道一个人的年龄,性别,那我能对她多了解吗?) 高维(比如我知道他从出生开始,做过哪些事,赚过哪些钱等) 如果我们对数 阅读全文
posted @ 2023-05-16 09:56 kris12 阅读(36) 评论(0) 推荐(0) 编辑
摘要:1. 高等数学基础 函数的定义 量和量之间的关系如:A = π r2 ; y = f(x) 其中x是自变量,y是因变量; 函数在x0处取得的函数值y0 = y|x=x0 = f(x0) 符号只是一种表示,也可以 y = g(x)等 几种函数 分段函数: 几种特性 数列 极限 函数的连续型 导数 梯度 阅读全文
posted @ 2023-05-16 09:55 kris12 阅读(221) 评论(0) 推荐(0) 编辑
摘要:隐⻢尔科夫模型 1. 隐⻢尔科夫模型定义 解决的是从序列到序列的任务, 2. 概率计算算法 3. 学习算法 4. 预测算法 期望最大算法 阅读全文
posted @ 2023-05-15 19:55 kris12 阅读(38) 评论(0) 推荐(0) 编辑
摘要:1. 常见的聊天机器人种类及技术架构 聊天机器人的种类 聊天机器人的分类 对于聊天机器人,通常有两种类型:一种是闲聊型的,另外一种是任务导向型的。从上述图中可以看出,第一个聊天机器人显然没有什么任何目的性,不是为了完成某一个任务而设计的。相反,第二个聊 天机器人是为了完成某特定的任务而设计的。在本章 阅读全文
posted @ 2022-05-09 09:17 kris12 阅读(529) 评论(0) 推荐(0) 编辑
摘要:支持向量机的核心思想 支持向量机在机器学习领域中扮演着举足轻重的角色,应该算是前深度学习时代最重要的产物。即便现在,对于很多分类问题我们也倾向于使用支持向量机如文本分类、疾病分类等等。之所以支持向量 机受到如此的关注,主要原因归类为以下几点: 从模型的效果来说确实比较优秀,甚至很多时候可以媲美比它更 阅读全文
posted @ 2022-05-08 18:42 kris12 阅读(377) 评论(0) 推荐(0) 编辑
摘要:1. Pytorch介绍 常见深度学习框架 近几年深度学习崛起,它的崛起背后最大的功臣-深度学习框架。如果没有这些深度学习框架,深度学习绝对不会像现在一样“平民化”,很多人可能陷入在茫茫的数学深渊中。有了可方便使用的深度学习 框架,我们可以把所有精力花在如何设计模型本身上,而不用再去关注模型优化的细 阅读全文
posted @ 2021-11-13 10:06 kris12 阅读(2037) 评论(0) 推荐(0) 编辑
摘要:提升树 1. 提升树的核心思想 Bagging与Boosting的区别 集成模型--随机森林,且也了解到随机森林属于Bagging的成员。另外一种集成模型叫作Boosting。什么叫Bagging? 比如在随机森林里,针对于样本数据,我们同时训练了多棵决策树,然后让这些决策树 通过投票的方式来参与预 阅读全文
posted @ 2021-11-06 18:39 kris12 阅读(478) 评论(0) 推荐(0) 编辑
摘要:1. 神经网络 神经网络与深度学习 在过去的10年,AI不仅在学术界同时也在工业界取得了飞速的发展,背后离不开深度学习的贡献。就是因为深度学习的崛起,人工智能逐步进入了人们的视野,也有了今天各种AI的落地场景。特别是, ImageNet竞赛和AlphaGo事件正好也起到了催化剂的作用,迅速引起了全球 阅读全文
posted @ 2021-11-06 18:24 kris12 阅读(737) 评论(0) 推荐(0) 编辑
摘要:决策树的应用 决策树 决策树与 if-then 规则 决策树可以看作一个 if-then 规则的集合 由决策树的根节点到叶节点的每一条路径,构建一条规则:路径上内部节点的特征对应着规则的条件(condition),叶节点对应规则的结论 决策树的 if-then 规则集合有一个重要性质:互斥并且完备。 阅读全文
posted @ 2021-10-31 22:02 kris12 阅读(1581) 评论(0) 推荐(0) 编辑
摘要:随机森林 1. 集成模型和它的优势 什么是集成模型 对于几乎所有的分类问题(图像识别除外,因为对于图像识别问题,目前深度学习是标配),集成模型很多时候是我们的首选。比如构建一个评分卡系统,业界的标配是GBDT或者XGBoost等集成模型,主 要因为它的效果确实好,而且稳定。还有一点是这些模型的可解释 阅读全文
posted @ 2021-10-31 09:18 kris12 阅读(1310) 评论(0) 推荐(0) 编辑
摘要:K-Means 最常用的机器学习聚类算法,且为典型的基于距离的聚类算法 K均值: 基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇 以欧式距离作为相似度测度 K均值算法需要输入待聚类的数据和欲聚类的簇数k,主要的聚类过程有3步: 随机生成k个初始点作为质心; 将数据集中的数据按照距离质心 阅读全文
posted @ 2021-10-30 15:58 kris12 阅读(900) 评论(0) 推荐(0) 编辑
摘要:主成分分析-PCA 聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术 >> 将观测对象的群体按照相似性和相异性进行不同群组的划分,划分后每个群组内部各对象相似度很高,而不同群组之间的对象彼此相异度很高。 Principal Compon 阅读全文
posted @ 2021-10-30 15:57 kris12 阅读(681) 评论(0) 推荐(0) 编辑
摘要:情感分析系统 情感分析任务 情感分析是一个经典的文本分析任务,在工业界有着非常广泛的应用。从任务的角度来讲,它的输入为一段文本,输出为某一个特定的情感分类如正面、负面或者中性。 任务本身属于文本分类任务,所 以需要使用分类算法。 情感分析的一个经典的应用场景为舆情监控。比如一个公司推出了一款产品,然 阅读全文
posted @ 2021-09-27 22:13 kris12 阅读(1229) 评论(0) 推荐(0) 编辑
摘要:朴素贝叶斯模型 1. 理解朴素贝叶斯 贝叶斯公式是一种基于条件概率的分类算法,如果我们已经知道 A 和 B 的发生概率,并且知道了 B 发生情况下 A 发生的概率,可以用贝叶斯公式计算 A 发生的情况下 B 发生的概率。事实上,我们可以 根据 A 的情况,即输入数据,判断 B 的概率,即 B 的可能 阅读全文
posted @ 2021-09-27 21:44 kris12 阅读(642) 评论(0) 推荐(0) 编辑
摘要:广告点击率(CTR)预测项目 点击率(Click through rate)预估用来判断一条广告被用户点击的概率,对每次广告的点击做出预测,把用户最有可能点击的广告找出来,是广告技术最重要的算法之一。 https://www.kaggle.com/c/avazu-ctr-prediction Dat 阅读全文
posted @ 2021-08-29 17:06 kris12 阅读(1070) 评论(0) 推荐(0) 编辑
摘要:逻辑回归 Logistic Regression 是一个非常经典的二分类算法 ,也可以用于多分类(只需做个转换即可) 1. 逻辑回归中的条件概率 谈到分类,也许没有比逻辑回归更简单的方法了,受到工业界的极大的欢迎。逻辑回归的基本概念,以及如何一步步来构建逻辑回归中起到最核心作用的条件概率。 逻辑回归 阅读全文
posted @ 2021-08-28 09:44 kris12 阅读(2515) 评论(0) 推荐(0) 编辑
摘要:模型的泛化 1. 过拟合 在机器学习建模中面临一个极其重要的问题 - “过拟合”。 基于逻辑回归模型来剖析什么是过拟合,如何正确地理解过拟合现象,减轻过拟合现象的几种方法。 逻辑回归的参数 即便是一个简单的逻辑回归模型,当我们去调用模型时需要选择性地设置它的一些参数,这些参数的设定对模型训练后的结果 阅读全文
posted @ 2021-08-08 16:25 kris12 阅读(1155) 评论(0) 推荐(0) 编辑
摘要:1. 人工智能 所谓人工智能就是利用数学统计方法,统计数据中的规律,然后利用这些统计规律进行自动化数据处理,使计算机表现出某种智能的特性,而各种数学统计方法,就是大数据算法。 人工智能(AI),几乎的行业跟AI息息相关。谈到AI,很多人的脑海里第一个浮现出的可能是当年火遍全球的 AlphaGo 的事 阅读全文
posted @ 2021-07-27 08:45 kris12 阅读(2675) 评论(0) 推荐(0) 编辑
摘要:线性回归 在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间互相依赖的定量关系的一种统计分析方法。 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 所有机器学习方法论里,线性回归绝对是最简单且最实用的方法。只要涉及到回归问题,第一时间 阅读全文
posted @ 2021-07-25 17:58 kris12 阅读(535) 评论(0) 推荐(0) 编辑
摘要:1. 自然语言处理应用 自然语言处理(Natural Language Processing, NLP),通过理解人类语言来解决实际问题的一门学科。 自然语言处理不仅是学术界的研究热点,在工业界也有许多成果,如谷歌的文本搜索引擎、苹果的Siri、微软小冰等。 对自然语言处理问题的研究可以追溯到二十世 阅读全文
posted @ 2021-05-23 15:43 kris12 阅读(392) 评论(0) 推荐(0) 编辑

levels of contents
点击右上角即可分享
微信分享提示