随笔分类 -  算法

算法
摘要:知识图谱 阅读全文
posted @ 2018-05-19 18:50 skyme 阅读(4250) 评论(3) 推荐(0) 编辑
摘要:手写体识别与Tensorflow 如同所有语言的hello world一样,手写体识别就相当于深度学习里的hello world。 TensorFlow是当前最流行的机器学习框架,有了它,开发人工智能程序就像Java编程一样简单。 MNIST MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介... 阅读全文
posted @ 2018-03-18 15:34 skyme 阅读(15749) 评论(3) 推荐(9) 编辑
摘要:什么是Anacondaanaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。它是一个用python开发机器学习的必备工具。什么是tensorflow大名鼎鼎,相信不知道tensorflow的人应该不是很多,目前github上最火的项目之一。TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本... 阅读全文
posted @ 2018-03-15 17:34 skyme 阅读(1691) 评论(2) 推荐(3) 编辑
摘要:算法描述 目前在物流,企业用工等领域,都有着大量的通过算法对接到的订单进行智能分配的需求。本文模拟的是用户下订单,然后商家接到订单,由配送人员进行派送的场景。在实际的应用中类似于百度外卖等有着非常多的实际应用。这种问题因为算法的复杂度太高,很难在短的时间周期内求解成功,所以有了像遗传算法,退火算法等 阅读全文
posted @ 2017-06-30 14:54 skyme 阅读(5593) 评论(3) 推荐(2) 编辑
摘要:什么是熵(Entropy)简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化,组织化,复杂化状态的一种度量。熵... 阅读全文
posted @ 2015-07-16 14:52 skyme 阅读(385061) 评论(41) 推荐(280) 编辑
摘要:C4.5简介C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。由于I... 阅读全文
posted @ 2015-03-31 16:22 skyme 阅读(2294) 评论(1) 推荐(0) 编辑
摘要:讨论内容昨天的架构基本确定成如下图所示:针对此架构,大家分别提了不同的看法:【大侠】秦刘 9:53:58 工作节点的爬虫 应该就是普通的一个cmd形式的小程序,对不对? 【大侠】秦刘 9:54:38 webapp的作用应该只是这个 【大侠】大常 9:55:11 这个是什么的... 阅读全文
posted @ 2015-03-27 14:35 skyme 阅读(2198) 评论(0) 推荐(0) 编辑
摘要:SpidermanSpiderman 是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。 Spiderman主要是运用了像XPath、正则、表达式引擎等这些技术来实现数据抽取。项目结构:依赖关系如下:webmagicwebmagic采用完全模块化的设计,功... 阅读全文
posted @ 2015-03-26 19:13 skyme 阅读(15860) 评论(1) 推荐(4) 编辑
摘要:文档分享流程今天在群里与大家讨论,想一个比较合理的分享流程。我想看到流程应该是挺清楚了,就不再多加文字方面的解释了!有想参与的可以一起进来讨论群号 194338168 想深度参与的加,不想参与的就别往里进了,现在需要的主要是开发和文档两类人。群会定期往出清人! (项目会开源出来) 阅读全文
posted @ 2015-03-25 17:51 skyme 阅读(1275) 评论(0) 推荐(0) 编辑
摘要:分布式爬虫架构经过新一轮的投票,项目的范围已经基本确定。大家决定 全力以付,集中攻克“分布式爬虫”。分布式爬虫架构1使用队列,即生产者,消费都模式。由于生产者将规则生成到队列,然后由爬虫集群(消费者)到队列中取规则,然后按优先级等规则进行爬取。分布式爬虫架构2类似于webmagic,webmagic... 阅读全文
posted @ 2015-03-24 11:34 skyme 阅读(8869) 评论(1) 推荐(1) 编辑
摘要:什么是数据仓库?数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反映历史变化( Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理:①数据仓库用于支持决策,面向... 阅读全文
posted @ 2015-03-03 11:36 skyme 阅读(6537) 评论(1) 推荐(7) 编辑
摘要:什么是数据挖掘前两天看到群里有人问,什么是数据挖掘,现在就数据挖掘的概念做一下分析,并且尽量用大白话说一下数据挖掘到底是个啥东西,为啥大数据来了数据挖掘也火了(其实原来就挺火)。先看一上概念:数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowled... 阅读全文
posted @ 2015-02-28 15:32 skyme 阅读(4027) 评论(3) 推荐(4) 编辑
摘要:简介学过概率理论的人都知道条件概率的公式:P(AB)=P(A)P(B|A)=P(B)P(A|B);即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率。由条件概率公式推导出贝叶斯公式:P(B|A)=P(A|B)P(B)/P(A);即,已知P(A|B),P(A)和P(B)可以计算出P(B|A)。假设B是由相互独立的事件组成的概率空间{B1,b2,...bn}。则P(A)可以用全概率公式展开:P(A)=P (A|B1)P(B1)+P(A|B2)P(B2)+..P(A|Bn)P(Bn)。贝叶斯公式表示成:P(Bi|A)=P(A|Bi)P(Bi)/(P(A|B1)P(B1)+P( 阅读全文
posted @ 2014-02-24 14:03 skyme 阅读(92502) 评论(13) 推荐(24) 编辑
摘要:递推算法给定一个数的序列H0,H1,…,Hn,…若存在整数n0,使当n>n0时,可以用等号(或大于号、小于号)将Hn与其前面的某些项Hi(0f(2)-->f(1)-->f(0){f(0)=1}-->f(1)-->f(2)--f(3){f(3)=6} 而递推如下: f(0)-->f(1)-->f(2)-->f(3) 由此可见,递推的效率要高一些,在可能的情况下应尽量使用递推.但是递归作为比较基础的算法,它的作用不能忽视.所以,在把握这两种算法的时候应该特别注意。顺推法所谓顺推法是从已知条件出发,逐步推算出要解决的问题的方法叫顺推。 如斐波拉契数列, 阅读全文
posted @ 2014-02-09 20:33 skyme 阅读(21105) 评论(1) 推荐(4) 编辑

点击右上角即可分享
微信分享提示