随笔分类 -  足球赛事资料库

足球赛事资料库
摘要:今天的主要内容是HtmlAgilityPack的基本介绍、使用,实际代码。最后我们以采集天气数据为例子,来介绍实际的采集分析过程和简单的代码。我们将在下一篇文章中开源该天气数据库和C#操作代码。采集核心就只是在这里介绍,其实核心代码都有了,自己加工下就可以了,同时也免费对有需要的人开放。至于具体详情,请关注下一篇文章。 阅读全文
posted @ 2015-08-31 08:48 数据之巅 阅读(33051) 评论(73) 推荐(144) 编辑
摘要:全国成百上千家互联网彩票公司,都有足球赛事资料库系统,但是他们不共享,都是自己采集,而有大量的业余研究人员,特别是程序员玩足球的,很多都要自己采集数据,多多少少造成了很多浪费,不仅仅是精力时间的浪费,更多的是网络资源,带宽的浪费。所以我开放这些数据的目的,基于以下几点:1.让喜欢足球的程序员,可以直接获取足球赛事资料数据,不用重复采集;2.开放基础数据库,让更多的人可以实现自己的思路和想法,专注业务,而不是这些没有技术含量的数据;3.采集数据,从某些角度上说,只要花时间,都可以做,我就是把自己花时间做的,分享出来,降低大家的门槛。4.我们不仅开源核心的数据库,同时也开放针对数据库的数据访问接口代码(C#版本),大家有数据库,也可以自己写相应代码,但前提是搞清楚数据库的结构,可以参考上面提到的系列文章。 阅读全文
posted @ 2015-07-20 07:57 数据之巅 阅读(10945) 评论(24) 推荐(33) 编辑
摘要:今天要关注就是核心的赔率指数表,由于赔率指数表的内容比较多,所以将分为2篇来进行。赔率指数是赛事预测的重要参考条件,虽然有一定的随机因素,但是根据长期的分析和统计,赔率还是具有很强的指导性。所以赔率指数数据库的设计也尤为重要。一方面要考虑到日益增长的赔率数据越来越多,需要确保查询分析的速度;另外一方面赔率的类型比较复杂,设计要比较合理,才能在后续的统计分析和预测模型中方便使用。 本篇文章是赔率指数表第二篇,因为指数类型比较多,今天要介绍的是几种大家可能接触比较少的,一般在国外用得比较多的,考虑到系统的完善性,而且也不复杂,所以都包括进来了。还是沿用上一篇文章的思路,赔率指数都是继承公共的基类,这里也只贴出不同的字段。 阅读全文
posted @ 2015-06-25 08:15 数据之巅 阅读(3792) 评论(0) 推荐(2) 编辑
摘要:在足球赛事数据库以及统计分析预测平台中,有很多概念,如果不搞懂,很难进行下一步的工作。所以为了配合团队人员的学习和任务进行,特意编写这篇文章。如果有其他问题和不懂的,请留言,将根据情况进行更新。 阅读全文
posted @ 2015-06-07 08:10 数据之巅 阅读(5267) 评论(5) 推荐(3) 编辑
摘要:在上一篇文章:机器学习之PageRank算法应用与C#实现(1)算法介绍 中,对PageRank算法的原理和过程进行了详细的介绍,并通过一个很简单的例子对过程进行了讲解。从上一篇文章可以很快的了解PageRank的基础知识。相比其他一些文献的介绍,上一篇文章的介绍非常简洁明了。当然文章主要引用的是[1].上述引用“赵国,宋建成.Google搜索引擎的数学模型及其应用,西南民族大学学报自然科学版.2010,vol(36),3”这篇学术论文。鉴于文献中本身提供了一个案例,所以本文就使用文章的案例和思路,并使用C#进行编程实现,测试。论文中的案例其实是来源于1993年全国大学生数学建模竞赛的B题—足球队排名问题。 阅读全文
posted @ 2015-05-27 08:05 数据之巅 阅读(6179) 评论(1) 推荐(17) 编辑
摘要:今天要关注就是核心的赔率指数表,由于赔率指数表的内容比较多,所以将分为2篇来进行。赔率指数是赛事预测的重要参考条件,虽然有一定的随机因素,但是根据长期的分析和统计,赔率还是具有很强的指导性。所以赔率指数数据库的设计也尤为重要。一方面要考虑到日益增长的赔率数据越来越多,需要确保查询分析的速度;另外一方面赔率的类型比较复杂,设计要比较合理,才能在后续的统计分析和预测模型中方便使用。今天先介绍常规的赔率指数表的设计,主要是胜平负指数,大小盘,半全场,总进球,比分指数的数据库设计。 阅读全文
posted @ 2015-05-24 07:18 数据之巅 阅读(4538) 评论(6) 推荐(4) 编辑
摘要:由于数据表和业务是直接相关的,没有时间将所有相关业务都简述清楚,所以也只好将需求和表设计一起进行。相辅相成吧,如果思路有问题,大家可以交流提出自己的想法,当然必须要对足球赛事资料库有一定的了解和接触才行,本人也是走了很多弯路的。考虑到系统数据表很多,按照功能不同,分为基础数据表,比赛相关表,赔率相关表,以及特殊数据表4个部分分别进行讲解,请大家关注博客。今天要关注就是比赛信息相关的数据表设计。 阅读全文
posted @ 2015-05-23 07:01 数据之巅 阅读(3496) 评论(0) 推荐(1) 编辑
摘要:由于数据表和业务是直接相关的,没有时间将所有相关业务都简述清楚,所以也只好将需求和表设计一起进行。相辅相成吧,如果思路有问题,大家可以交流提出自己的想法,当然必须要对足球赛事资料库有一定的了解和接触才行,本人也是走了很多弯路的。考虑到系统数据表很多,按照功能不同,分为基础数据表,比赛相关表,赔率相关表,以及特殊数据表4个部分分别进行讲解,请大家关注博客。 阅读全文
posted @ 2015-05-21 08:04 数据之巅 阅读(3770) 评论(0) 推荐(4) 编辑
摘要:考虑到足球赛事资料库的复杂性,以及考虑到项目的前瞻性(要考虑到很多还没有发生的事情,便于以后扩展),以及大量数据,查询和计算的速度,本项目经历了3次重构,到目前为止其实也不是很成型,但基本趋于稳定。现在总结起来肯定是很流畅,但这中间的过程非常痛苦,也希望把这些经验写出来,有自己做的朋友可以一起探讨,避免踩坑。数据库很庞大,且采用了XCode非常牛逼的分库技术,秒杀千万级乃至上亿的数据需求。而只需要最基本的C#技术,对我这种数据库文盲来说,真的帮助非常大。 阅读全文
posted @ 2015-05-19 08:04 数据之巅 阅读(4587) 评论(11) 推荐(20) 编辑
摘要:在本博客的2篇文章足彩基础知识入门(1)概述与介绍和为什么选择玩足球彩票以及玩彩票的心态?详细介绍了选择足彩,以及对足彩的基本看法。今天就介绍足彩的基本玩法,是一个总结性文章,作为足彩入门的必备资料之一。今天进入到对赔率的分析和讨论。这里可能很多人会有不同的看法,我也只是谈一下我对赔率以及相关问题的看法。 在前面的文章中,我也说过,赔率的第一个主要作用就是平衡彩民的投注风险,通过动态的彩票投注倾向,来动态调整赔率,影响后续的投注,从而平衡风险。虽然不可否认庄家已经可以很准确的预测大部分的比赛结果,但庄家的目的是不断的盈利,是不可能和玩家来对赌的,而且还要考虑竞争对手。他们不会每一场比赛都赢钱,但也不会每一场比赛都输钱。 阅读全文
posted @ 2015-05-18 15:27 数据之巅 阅读(9394) 评论(4) 推荐(4) 编辑
摘要:在本博客的2篇文章足彩基础知识入门(1)概述与介绍和为什么选择玩足球彩票以及玩彩票的心态?详细介绍了选择足彩,以及对足彩的基本看法。今天就介绍足彩的基本玩法,是一个总结性文章,作为足彩入门的必备资料之一。中国足彩由于特殊的性质,玩法也很特别。总的来说,目前已经形成足彩,竞彩和北单3个主流玩法。包括了胜平负,让球胜平负,总进球,半全场,比分,上下单双等几个常规玩法,同时也搞了一些具有中国特殊的玩法,如14场胜负,任9,四场进球等。根据总的投注额,拿出奖金,进行平均分配。和北单有些类似,但是实际上这些过关玩法的SP值还是要相对高一些,但是投资也大。下面将对每一个玩法类型进行介绍。 阅读全文
posted @ 2015-05-17 10:54 数据之巅 阅读(15942) 评论(4) 推荐(5) 编辑
摘要:去年4月到现在,一年之中,做了很多事情,所以写博客的时间少了,在利用业余时间搭建的彩票数据库资料库快完工之际,将陆续在博客园开放这一年来的相关成果。一年来重点对数字彩和足球彩票资料库进行数据采集和分析平台的搭建,同时也利用数据挖掘和机器学习的简单知识,对足球比赛进行预测,也小有成果,虽然已经远离数字彩,但软件的结构非常容易扩展,数据也很容易采集。重点还是在足球赛事资料库,目前数据库已经包括了近10年,世界所有的联赛,杯赛和重要赛事的比赛信息,以及赔率盘口信息,对于玩算法和写代码的朋友来说,利用这些数据库可以快速的进行自己的数据分析工作。本系列文章会对数据库架构和结构进行介绍,并逐步开放相关足球数据库和彩票数据库,敬请关注。 阅读全文
posted @ 2015-05-13 09:10 数据之巅 阅读(7197) 评论(44) 推荐(32) 编辑
摘要:自从2013年10月接触彩票以来,一直坚信技术分析路线,虽然有些经验和心得,但还不足以让自己满意。2014年4月,在@Apex老兄的鼓励下,踏入足球彩票的研究行列中,并开始搭建自己的足球赛事数据库系统,一波三折,在@apex,@阿龙等朋友的支持和帮助下,已经初步成功。但前途艰险,事情越来越多,足球赛事的数据分析和预测算法有大量的研究和测试工作。所以一方面自己在总结,也一方面在博客中不断开放自己的成果,目的也是希望结识更多的朋友。 阅读全文
posted @ 2015-05-09 10:12 数据之巅 阅读(3299) 评论(18) 推荐(12) 编辑
摘要:总的来说,由于中国国内的彩票和国外的差距太大,各个方面,从开奖,奖金,文化和市场的有序都存在巨大差距,可以说是中国特色,和垄断有一定的关系。比如被人们长期怀疑的双色球,开奖时间和开奖画面等遭到很多人的唾弃。不进行实时的开奖,给了大家很多的现象空间,从而也降低了其公信力。现在的数字高频彩也是如此,电脑开奖,还时间滞后2-3分钟,让人怎么想。与其说不敢放开,还不如说心里有鬼,找个借口而已。而最近在研究国内的竞彩足球后,也发现一些很尴尬的事情。相比国外的博彩平台,国内竞彩足球赔付率就达到超低的水平(0.65-0.8左右),国外的一般都在0.9-0.95。怪不得经常听说有人去外围平台买,直接不在国内的平台。的确是比较坑。不过话又说回来,谁叫你在国内呢,呵呵,还得接受现实,想玩的朋友要好好控制自己,娱乐一下,也未尝不可,只不过不要财迷心窍而已,这玩意,你信就买一点,不信就不要买。 阅读全文
posted @ 2015-05-07 17:00 数据之巅 阅读(5015) 评论(3) 推荐(3) 编辑
摘要:本文以非常简单的方式介绍了贝叶斯及其公式理论,对其作用和研究现状进行了总结和概述。然后着重的介绍了朴素贝叶斯的概率,预测流程等细节。然后用一个网友的例子,重新对整个过程用手工计算一遍,加深了对朴素贝叶斯的理解。最后我将朴素贝叶斯的预测算法应用到足球彩票的胜平负预测之中,按照基本流程,从头开始,可以非常容易入门和理解,全部是C#代码。希望大家用得上。 阅读全文
posted @ 2015-04-21 09:28 数据之巅 阅读(24380) 评论(57) 推荐(96) 编辑
摘要:智彩足球技术研究团队成员介绍,关于组建“智彩足球技术研究团队”的说明,为什么选择玩足球彩票以及玩彩票的心态?【原创】C#玩高频数字彩快3的一点体会,彩票数据预测算法(一):离散型马尔可夫链模型实现【附C#代码】 阅读全文
posted @ 2015-03-11 14:16 数据之巅 阅读(6070) 评论(8) 推荐(6) 编辑
摘要:开源Math.NET基础数学类库使用系列文章总目录,Infer.NET机器学习系列文章目录 阅读全文
posted @ 2015-02-26 18:18 数据之巅 阅读(19749) 评论(5) 推荐(29) 编辑