随笔分类 -  机器学习

机器学习算法,开源代码,数据挖掘,数据分析
摘要:这篇文章开始,将陆续介绍Power BI使用过程中的细节和技巧,今天首先要给大家介绍的是如何在Power BI中连接Oracle数据库,很多做Power BI的不一定都搞过开发,所以这个链接估计还是坑了不少人。由于连接Mysql数据库简单,加上有环境,所以顺便把连接Mysql的过程也简单演示了一下。连接数据库是我们第一步,也是最基本的步骤。 阅读全文
posted @ 2016-08-16 08:33 数据之巅 阅读(27104) 评论(8) 推荐(14) 编辑
摘要:Power BI:Any data,Any where,Any time。 在当前互联网,由于大数据研究热潮,以及数据挖掘,机器学习等技术的改进,各种数据可视化图表层出不穷,如何让大数据生动呈现,也成了一个具有挑战性的可能,随之也出现了大量的商业化软件。今天就给大家介绍一款逆天Power BI可视化工具。逆天的不仅仅是工具,还有其使用门槛和价格。微软早就基于Excel开发了相关BI插件,如Power Query,PowerPrivot,Power View和Power Map等。这些插件让Excel如同装上了装逼的翅膀,瞬间高大上。全新的Power BI呼之欲出,相比Tableau等产品,有着无可比拟的天然优势。 阅读全文
posted @ 2016-08-05 08:39 数据之巅 阅读(8454) 评论(1) 推荐(16) 编辑
摘要:下面是本博客原创的微软Power BI技术相关文章,对于部分转载文章和资源,会注明出处。Power BI Desktop的使用和在线版的相关使用文章,技术资源,学习经验等等。设计到power bi从数据源获取,到建模,以及分析,发布,共享协作等各个方面。 阅读全文
posted @ 2016-06-06 22:01 数据之巅 阅读(19447) 评论(8) 推荐(9) 编辑
摘要:RavenDB是针对Windows/.NET平台而设计的开源文档数据库。RavenDB的出现将.NET应用与非关系数据库连接到一起。数据以Shcema-less方式存储,并直接通过HTTP、RESTful API或更方便的.NET客户端API连接,.NET客户端API使用LINQ操作RavenDB数据库文档存储,所以你懂的,很舒服。RavenDB有.NET和JAVA版本,目前都在3.0。RavenDB具有非常高的可伸缩性。支持Multi-tenancy (多用户数据隔离),以及不同的同步类型,还可以根据需要支持分区分片等等。可以对RavenDB进行扩展,目前已有的插件如:触发器,编码器/解码器,任务调度,编译扩展,分析器,加密,压缩等等。 ACID事务支持,自动批处理,没有锁,客户端和服务器端连接保护等等。 阅读全文
posted @ 2016-05-11 08:17 数据之巅 阅读(7469) 评论(17) 推荐(61) 编辑
摘要:Infer.NET是一个概率图模型中(graphical models)用于运行贝叶斯推理机(Bayesian inference)的框架,本文将介绍一个基于Infer.NET构建贝叶斯机器分类器中数据映射和序列化相关的技术细节。 阅读全文
posted @ 2016-05-06 08:03 数据之巅 阅读(4493) 评论(14) 推荐(11) 编辑
摘要:本文对旅行商问题(TSP)的历史进行了简单的总结,以及相关算法进行了描述,重点介绍了Tsp优化问题的新算法——群蚁算法的原理和过程,详细对算法的理论和过程进行了解释和实例分析,并使用C#语言编写程序实现该算法。整篇论文是学习群蚂算法的基础性文章,同时也是了解TSP问题新动向,编程学习的一个好的例子。TSP问题在实际生活和工作中的出镜率非常高,说不定你就用得上,一起来看看吧。 阅读全文
posted @ 2015-09-14 08:24 数据之巅 阅读(22773) 评论(24) 推荐(78) 编辑
摘要:微软牛津计划(网址:https://cn.projectoxford.ai/#) 提供了一组基于Rest架构的API和SDK工具包,帮助开发者轻轻松松使用微软的自然数据理解能力为自己的解决方案增加智能服务。利用微软牛津计划构建你自己的解决方案,支持任意语言及任意开发平台。主要提供了4个自然语言处理方面的核心问题解决方案: 1)人脸识别:微软最先进的人脸算法,以云平台为基础,检测和识别图片中的人脸。为您的移动应用和桌面应用提供人脸算法的技术支持。 2)语音识别:Speech API为开发者提供最先进的语音处理算法。通过这些API,开发者可以轻松地为自己的应用添加语音操作功能。在一定条件下,这些API还可以实现与用户之间的实时交互。 3)计算机视觉:Computer Vision APIs为开发者提供最顶尖的图像处理算法。通过这些API你可以获得基于图像视觉内容的各种信息并生成理想的缩略 阅读全文
posted @ 2015-08-24 08:06 数据之巅 阅读(11430) 评论(54) 推荐(127) 编辑
摘要:Accord.NET为.NET应用程序提供了统计分析、机器学习、图像处理、计算机视觉相关的算法。Accord.NET框架扩展了AForge.NET框架,提供了一些新功能。同时为.NET环境下的科学计算提供了一个完整的开发环境。该框架被分成了多个程序集,可以直接从官网下载安装文件或者使用NuGet得到。Accord.NET框架主要有三个大的功能性模块。分别为科学技术,信号与图像处理,支持组件。下面将对3个模型的命名空间和功能进行简单介绍。可以让大家更快的接触和了解其功能是否是自己想要的,下面是主要的命名空间介绍。 阅读全文
posted @ 2015-08-17 08:31 数据之巅 阅读(21867) 评论(27) 推荐(59) 编辑
摘要:全国成百上千家互联网彩票公司,都有足球赛事资料库系统,但是他们不共享,都是自己采集,而有大量的业余研究人员,特别是程序员玩足球的,很多都要自己采集数据,多多少少造成了很多浪费,不仅仅是精力时间的浪费,更多的是网络资源,带宽的浪费。所以我开放这些数据的目的,基于以下几点:1.让喜欢足球的程序员,可以直接获取足球赛事资料数据,不用重复采集;2.开放基础数据库,让更多的人可以实现自己的思路和想法,专注业务,而不是这些没有技术含量的数据;3.采集数据,从某些角度上说,只要花时间,都可以做,我就是把自己花时间做的,分享出来,降低大家的门槛。4.我们不仅开源核心的数据库,同时也开放针对数据库的数据访问接口代码(C#版本),大家有数据库,也可以自己写相应代码,但前提是搞清楚数据库的结构,可以参考上面提到的系列文章。 阅读全文
posted @ 2015-07-20 07:57 数据之巅 阅读(10945) 评论(24) 推荐(33) 编辑
摘要:今天要关注就是核心的赔率指数表,由于赔率指数表的内容比较多,所以将分为2篇来进行。赔率指数是赛事预测的重要参考条件,虽然有一定的随机因素,但是根据长期的分析和统计,赔率还是具有很强的指导性。所以赔率指数数据库的设计也尤为重要。一方面要考虑到日益增长的赔率数据越来越多,需要确保查询分析的速度;另外一方面赔率的类型比较复杂,设计要比较合理,才能在后续的统计分析和预测模型中方便使用。 本篇文章是赔率指数表第二篇,因为指数类型比较多,今天要介绍的是几种大家可能接触比较少的,一般在国外用得比较多的,考虑到系统的完善性,而且也不复杂,所以都包括进来了。还是沿用上一篇文章的思路,赔率指数都是继承公共的基类,这里也只贴出不同的字段。 阅读全文
posted @ 2015-06-25 08:15 数据之巅 阅读(3792) 评论(0) 推荐(2) 编辑
摘要:在上一篇文章:机器学习之PageRank算法应用与C#实现(1)算法介绍 中,对PageRank算法的原理和过程进行了详细的介绍,并通过一个很简单的例子对过程进行了讲解。从上一篇文章可以很快的了解PageRank的基础知识。相比其他一些文献的介绍,上一篇文章的介绍非常简洁明了。当然文章主要引用的是[1].上述引用“赵国,宋建成.Google搜索引擎的数学模型及其应用,西南民族大学学报自然科学版.2010,vol(36),3”这篇学术论文。鉴于文献中本身提供了一个案例,所以本文就使用文章的案例和思路,并使用C#进行编程实现,测试。论文中的案例其实是来源于1993年全国大学生数学建模竞赛的B题—足球队排名问题。 阅读全文
posted @ 2015-05-27 08:05 数据之巅 阅读(6179) 评论(1) 推荐(17) 编辑
摘要:今天要关注就是核心的赔率指数表,由于赔率指数表的内容比较多,所以将分为2篇来进行。赔率指数是赛事预测的重要参考条件,虽然有一定的随机因素,但是根据长期的分析和统计,赔率还是具有很强的指导性。所以赔率指数数据库的设计也尤为重要。一方面要考虑到日益增长的赔率数据越来越多,需要确保查询分析的速度;另外一方面赔率的类型比较复杂,设计要比较合理,才能在后续的统计分析和预测模型中方便使用。今天先介绍常规的赔率指数表的设计,主要是胜平负指数,大小盘,半全场,总进球,比分指数的数据库设计。 阅读全文
posted @ 2015-05-24 07:18 数据之巅 阅读(4538) 评论(6) 推荐(4) 编辑
摘要:考虑到足球赛事资料库的复杂性,以及考虑到项目的前瞻性(要考虑到很多还没有发生的事情,便于以后扩展),以及大量数据,查询和计算的速度,本项目经历了3次重构,到目前为止其实也不是很成型,但基本趋于稳定。现在总结起来肯定是很流畅,但这中间的过程非常痛苦,也希望把这些经验写出来,有自己做的朋友可以一起探讨,避免踩坑。数据库很庞大,且采用了XCode非常牛逼的分库技术,秒杀千万级乃至上亿的数据需求。而只需要最基本的C#技术,对我这种数据库文盲来说,真的帮助非常大。 阅读全文
posted @ 2015-05-19 08:04 数据之巅 阅读(4587) 评论(11) 推荐(20) 编辑
摘要:自从2013年10月接触彩票以来,一直坚信技术分析路线,虽然有些经验和心得,但还不足以让自己满意。2014年4月,在@Apex老兄的鼓励下,踏入足球彩票的研究行列中,并开始搭建自己的足球赛事数据库系统,一波三折,在@apex,@阿龙等朋友的支持和帮助下,已经初步成功。但前途艰险,事情越来越多,足球赛事的数据分析和预测算法有大量的研究和测试工作。所以一方面自己在总结,也一方面在博客中不断开放自己的成果,目的也是希望结识更多的朋友。 阅读全文
posted @ 2015-05-09 10:12 数据之巅 阅读(3299) 评论(18) 推荐(12) 编辑
摘要:Pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。鉴于Google的巨大成功和PageRank的巨大作用,已经入学了机器学习的十大算法之一。今天就带大家走近PageRank,简述其原理以及应用的C#实现。由于个人是专业做足球赛事预测,所以应用就拿足球胜平负的预测作为例子了。原理和过程都差不多,看大家如何分析问题了。 阅读全文
posted @ 2015-05-07 07:43 数据之巅 阅读(6343) 评论(3) 推荐(12) 编辑
摘要:写博客这么久,保持着高效和高产的习惯,青春年少的时光错过了,现在开始还未晚。下面这些文章都是非常经典,阅读量和推荐以及评论都非常高,大部分文章都上过博客园头条。特意开辟专栏目录。按照时间降序吧,最新的文章显示在前面。17.分享一个Visual Studio的背景插件,让堆码更富情趣;16..NET平台机器学习资源汇总,有你想要的么?15.白话贝叶斯理论及在足球比赛结果预测中的应用和C#实现【附资料】14.你用过这种奇葩的C#注释吗?如何看待 (2015-04-17 10:04) 阅读全文
posted @ 2015-05-04 06:53 数据之巅 阅读(3801) 评论(2) 推荐(2) 编辑
摘要:接触机器学习1年多了,由于只会用C#堆代码,所以只关注.NET平台的资源,一边积累,一边收集,一边学习,所以在本站第100篇博客到来之际,分享给大家。部分用过的 ,会有稍微详细点的说明,其他没用过的,也是我关注的,说不定以后会用上。机器学习并不等于大数据或者数据挖掘,还有有些区别,有些东西可以用来处理大数据的问题或者数据挖掘的问题,他们之间也是有部分想通的,所以这些组件不仅仅可以用于机器学习,也可以用于数据挖掘相关的。那就边看边说,资源给不给力,就看推荐了,哈哈,100篇是个里程碑,大家给个赞吧。我把这些源码和自己收集的文献整理一下,邮件发给大家(很大哦。。。)。因为部分论文涉及到版权,不能公开下载,请见谅。 阅读全文
posted @ 2015-04-24 08:04 数据之巅 阅读(27136) 评论(57) 推荐(202) 编辑
摘要:本文以非常简单的方式介绍了贝叶斯及其公式理论,对其作用和研究现状进行了总结和概述。然后着重的介绍了朴素贝叶斯的概率,预测流程等细节。然后用一个网友的例子,重新对整个过程用手工计算一遍,加深了对朴素贝叶斯的理解。最后我将朴素贝叶斯的预测算法应用到足球彩票的胜平负预测之中,按照基本流程,从头开始,可以非常容易入门和理解,全部是C#代码。希望大家用得上。 阅读全文
posted @ 2015-04-21 09:28 数据之巅 阅读(24381) 评论(57) 推荐(96) 编辑
摘要:数据挖掘与机器学习相关算法文章目录 阅读全文
posted @ 2015-03-11 14:14 数据之巅 阅读(7638) 评论(0) 推荐(5) 编辑
摘要:本博客所有文章分类的总目录链接:http://www.cnblogs.com/asxinyu/p/4288836.html1.微软Infer.NET机器学习组件目录1.Infer.NET连载(一)介绍2.Infer.NET连载(二)贝叶斯分类器例子后续继续更新中。。如文章链接打开有误,请关注博客,因... 阅读全文
posted @ 2015-03-11 14:14 数据之巅 阅读(3905) 评论(0) 推荐(4) 编辑