上一页 1 ··· 7 8 9 10 11
摘要: 贝叶斯定理是关于随机事件A和B的条件概率的一则定理(比如常见的:P(A|B)是在B发生的情况下A发生的可能性)。朴素的含义是各特征相互独立,且同等重要。某些分类算法均以贝叶斯定理为基础。由此产生了朴素贝叶斯分类算法。 朴素贝叶斯分类算法的思想基础是:对于给出的待分类项,求解在此项出现的条件下各个类别 阅读全文
posted @ 2019-10-22 13:54 数之美 阅读(1737) 评论(0) 推荐(0) 编辑
摘要: OLAP工具是从过去数据中得知结果,无法像数据挖掘一样告诉你结果发生的原因。 OLAP产生背景 OLAP:On line Analysis Processing 联机分析处理 OLTP:On line Transaction Processing 联机事务处理 联机分析处理 (OLAP) 的概念最早 阅读全文
posted @ 2019-10-22 13:46 数之美 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 示例: 在信贷数据中,征信认证是用户的属性之一,值域是:已认证、未认证。逾期也是属性之一,值域是:已逾期、未逾期。 要查看不同征信情况对逾期的影响。 计算方式1: 已认证占比=sum(已认证and已逾期)/sum(已逾期) 未认证占比=sum(未认证and已逾期)/sum(已逾期) 即在已逾期的范围 阅读全文
posted @ 2019-10-21 13:33 数之美 阅读(3384) 评论(0) 推荐(0) 编辑
摘要: 大数据技术本质上解决4个核心问题:存储、计算、查询、挖掘。本文主要针对前三点经常出现的相关名词进行释义。 背景 大数据技术先驱Google发表了:《Google file system》《Google MapReduce》《Google BigTable》。Apache软件基金会根据这三本秘籍研究出 阅读全文
posted @ 2019-10-21 13:30 数之美 阅读(461) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_19528953/article/details/78785818 一 介绍 对于数据处理来说,整个处理的流程如下图所示: 数据预处理——通常包括特征选择、维规约、规范化等方法。 数据挖掘——这部分的方法和技术非常多,在处理时主要根据自己的目的来选择 阅读全文
posted @ 2019-10-21 13:24 数之美 阅读(10178) 评论(0) 推荐(0) 编辑
摘要: 所谓“机器学习”就是利用计算机将纷繁复杂的数据处理成有用的信息,这样就可以发掘出数据带来的意义以及隐藏在数据背后的规律。现如今,“机器学习”和“大数据”可以说是IT行业中最热点的两个词汇,而无论是“机器学习”还是“大数据”最终要解决的问题本质上是一样的,用最为直白的话来说就是用现有的数据去预测将来的 阅读全文
posted @ 2019-10-21 13:22 数之美 阅读(270) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/nxld/p/6168380.html 本文,主要想简单介绍下数据挖掘中的算法,以及它包含的类型。然后,通过现实中触手可及的、活生生的案例,去诠释它的真实存在。 一般来说,数据挖掘的算法包含四种类型,即分类、预测、聚类、关联。前两种属于有监督学习,后两 阅读全文
posted @ 2019-10-21 13:18 数之美 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 人工智能元年来临,大数据在这里充当什么角色?数据分析是什么定位?职业区分? https://blog.csdn.net/blueheart20/article/details/71036779 https://blog.csdn.net/zw0pi8g5c1x/article/details/807 阅读全文
posted @ 2019-10-21 13:15 数之美 阅读(476) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11