随笔分类 -  数据挖掘

数据处理,数据挖掘,智能算法
摘要:Pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。鉴于Google的巨大成功和PageRank的巨大作用,已经入学了机器学习的十大算法之一。今天就带大家走近PageRank,简述其原理以及应用的C#实现。由于个人是专业做足球赛事预测,所以应用就拿足球胜平负的预测作为例子了。原理和过程都差不多,看大家如何分析问题了。 阅读全文
posted @ 2015-05-07 07:43 数据之巅 阅读(6315) 评论(3) 推荐(12) 编辑
摘要:写博客这么久,保持着高效和高产的习惯,青春年少的时光错过了,现在开始还未晚。下面这些文章都是非常经典,阅读量和推荐以及评论都非常高,大部分文章都上过博客园头条。特意开辟专栏目录。按照时间降序吧,最新的文章显示在前面。17.分享一个Visual Studio的背景插件,让堆码更富情趣;16..NET平台机器学习资源汇总,有你想要的么?15.白话贝叶斯理论及在足球比赛结果预测中的应用和C#实现【附资料】14.你用过这种奇葩的C#注释吗?如何看待 (2015-04-17 10:04) 阅读全文
posted @ 2015-05-04 06:53 数据之巅 阅读(3789) 评论(2) 推荐(2) 编辑
摘要:1.关于推荐系统中的特征工程 2.Java程序员最喜欢的11款免费IDE编辑器 3.人工智能和机器学习领域的一些有趣的开源项目 阅读全文
posted @ 2015-05-02 11:02 数据之巅 阅读(583) 评论(0) 推荐(2) 编辑
摘要:接触机器学习1年多了,由于只会用C#堆代码,所以只关注.NET平台的资源,一边积累,一边收集,一边学习,所以在本站第100篇博客到来之际,分享给大家。部分用过的 ,会有稍微详细点的说明,其他没用过的,也是我关注的,说不定以后会用上。机器学习并不等于大数据或者数据挖掘,还有有些区别,有些东西可以用来处理大数据的问题或者数据挖掘的问题,他们之间也是有部分想通的,所以这些组件不仅仅可以用于机器学习,也可以用于数据挖掘相关的。那就边看边说,资源给不给力,就看推荐了,哈哈,100篇是个里程碑,大家给个赞吧。我把这些源码和自己收集的文献整理一下,邮件发给大家(很大哦。。。)。因为部分论文涉及到版权,不能公开下载,请见谅。 阅读全文
posted @ 2015-04-24 08:04 数据之巅 阅读(27005) 评论(57) 推荐(202) 编辑
摘要:本文以非常简单的方式介绍了贝叶斯及其公式理论,对其作用和研究现状进行了总结和概述。然后着重的介绍了朴素贝叶斯的概率,预测流程等细节。然后用一个网友的例子,重新对整个过程用手工计算一遍,加深了对朴素贝叶斯的理解。最后我将朴素贝叶斯的预测算法应用到足球彩票的胜平负预测之中,按照基本流程,从头开始,可以非常容易入门和理解,全部是C#代码。希望大家用得上。 阅读全文
posted @ 2015-04-21 09:28 数据之巅 阅读(24185) 评论(57) 推荐(96) 编辑
摘要:数据挖掘与机器学习相关算法文章目录 阅读全文
posted @ 2015-03-11 14:14 数据之巅 阅读(7612) 评论(0) 推荐(5) 编辑
摘要:开源Math.NET基础数学类库使用系列文章总目录,Infer.NET机器学习系列文章目录 阅读全文
posted @ 2015-02-26 18:18 数据之巅 阅读(19610) 评论(5) 推荐(29) 编辑
摘要:本人在09年使用该组件的时候,主要原因也是为了替代Matlab,进行相关数学计算,现在依然有很多人关注Matlab计算,特别是学生,而很多也在使用C#,所以这些人通常由于个人能力有限(无法精通某一个门语言来解决综合问题),无法单纯的通过C#或者Matlab来解决问题,就想通过混合编程来调用完成,其实本人也做过大量的Matlab.NET混合编程研究,而且也个人制作了一套视频教程,编写过很多文章,可以参考如下文章: 阅读全文
posted @ 2015-02-13 20:25 数据之巅 阅读(16386) 评论(7) 推荐(19) 编辑
摘要:矩阵与向量计算是数学计算的核心,因此也是Math.NET Numerics的核心和基础。Math.NET包括对向量(Vector)和矩阵(Matrix)的支持,类型也很多。其主要注意点有:索引是从0开始,不支持空的向量和矩阵,也就是说维数或者长度最少为1。它也支持稀疏矩阵和非稀疏矩阵的向量类型。其矩阵有3种类型:稀疏,非稀疏,对角。这2个类在MathNet.Numerics.LinearAlgebra命名空间。由于一些技术和表示的原因,每一种数据类型都有一个实现,例如MathNet.Numerics.LinearAlgebra.Double有一个DenseMatrix类型,Matrix 是抽象类型, 要通过其他方法去初始化。可以看看源码中的定义: 阅读全文
posted @ 2015-02-13 00:24 数据之巅 阅读(25862) 评论(4) 推荐(24) 编辑
摘要:Math.NET初衷是开源建立一个稳定并持续维护的先进的基础数学工具箱,以满足.NET开发者的日常需求。目前该组件主要分为以下几个子项目,该组件同时也支持Mono,而且支持的平台也非常广泛(PCL Portable Profile 47: Windows 8, Silverlight 5,Xamarin: Android, iOS)。几年前接触这个组件的时候,只需要在.NET平台进行一些常规的微积分计算,功能还比较少,只限于常规的数值计算,现在已经功能越来越多了,应该是目前最好的替代Matlab进行数值计算的.NET组件。本文及接下来的几篇文章将详细的对该组件进行介绍。还有在.NET平台使用相关Matlab混编进行数值计算的朋友该好好了解了解并学习下了。当然这个基础组件的功能很广泛,应该很多都比较喜欢吧。 阅读全文
posted @ 2015-02-09 02:12 数据之巅 阅读(33094) 评论(10) 推荐(26) 编辑
摘要:本文今天介绍的.NET开源组件KwCombinatorics的排列生成功能,它是.NET平台一个高效的生成排列组合序列的开源类库,它提供了4种生成排列与组合序列的方式。虽然原理和功能都很简单,但是这个类库在软件测试、组合数学以及密码学等方面都有很大的用处。很早就接触了这个类库,以前在一些小程序中也使用过,有时候为了遍历所有可能的组合,自己去写循环,生成,的确很繁琐,有了KwCombinatorics 之后,都变得简单写了,接下来将详细介绍该类库的使用 阅读全文
posted @ 2015-02-02 08:00 数据之巅 阅读(3895) 评论(6) 推荐(5) 编辑
摘要:本文今天介绍的.NET开源组件是KwCombinatorics,它是.NET平台一个高效的生成排列组合序列的开源类库,它提供了4种生成排列与组合序列的方式。虽然原理和功能都很简单,但是这个类库在软件测试、组合数学以及密码学等方面都有很大的用处。很早就接触了这个类库,以前在一些小程序中也使用过,有时候为了遍历所有可能的组合,自己去写循环,生成,的确很繁琐,有了KwCombinatorics 之后,都变得简单写了,接下来将详细介绍该类库的使用 阅读全文
posted @ 2015-02-01 09:04 数据之巅 阅读(5021) 评论(5) 推荐(4) 编辑
摘要:刚看到博客园新闻中“108个大数据文档PDF开放下载”,地址: http://news.cnblogs.com/n/514248/ 。对数据挖掘,机器学习,大数据处理比较感兴趣,所有就把108个文件都下载下来了。下载下来是有点手软,就打包给需求的朋友吧。当然有人说可能并不需求全看,的确是的,我刚才也看了几个和我相关的,都是PPT,看起来挺快的。文档是人家的,我只是打包分享一下。 阅读全文
posted @ 2015-01-29 15:10 数据之巅 阅读(9541) 评论(8) 推荐(11) 编辑
摘要:Infer.NET是一个概率图模型中(graphical models)用于运行贝叶斯推理机(Bayesian inference)的框架,本文将介绍一个基于Infer.NET构建贝叶斯机器分类器的例子,并用于根据身高体重预测性别的例子中。 阅读全文
posted @ 2015-01-29 08:08 数据之巅 阅读(5104) 评论(35) 推荐(32) 编辑
摘要:Infer.NET是微软剑桥研究院基于.NET平台开发的一款机器推理组件。Infer.NET是一个概率图模型中(graphical models)用于运行贝叶斯推理机(Bayesian inference)的框架。如果对概率图模型或者贝叶斯推理的意义不了解,你可以参考一下相关资源文件,在Resources and References page页面。Infer.NET为各种应用程序所需要推理提供了先进的消息传递算法和统计程序。Infer.NET 与现有的一些推理软件有下列区别。 阅读全文
posted @ 2015-01-27 15:07 数据之巅 阅读(8261) 评论(11) 推荐(28) 编辑
摘要:已经3个月没写博客了,因为业余时间一直在研究彩票,发现还是有很多乐趣,偶尔买买,娱乐一下。本文的目的是向大家分享一个经典的数学预测算法的思路以及代码。对于这个马尔可夫链模型,我本人以前也只是听说过,研究不深,如有错误,还请赐教,互相学习。 阅读全文
posted @ 2014-01-24 11:54 数据之巅 阅读(100692) 评论(56) 推荐(58) 编辑
摘要:数据挖掘作为一门新兴的多学科交叉应用技术,正在各行各业的决策支持活动中扮演着越来越重要的角色。数据挖掘概念的定义描述有若干版本,本文采用的是一个普遍接受的定义:数据挖掘,又称为数据库中的知识发现(KDD),它是一个从大量数据中抽取出未知的、有价值的模式或规律等知识的复杂过程。一个完整的数据挖掘过程主要包含数据选择、数据预处理、数据挖掘以及知识的表达和解释几个步骤。 阅读全文
posted @ 2013-08-29 18:00 数据之巅 阅读(39644) 评论(51) 推荐(60) 编辑