算法 - 随笔分类 - skyme

摘要：知识图谱阅读全文

posted @ 2018-05-19 18:50 skyme 阅读(4285) 评论(3) 推荐(0)

摘要：手写体识别与Tensorflow 如同所有语言的hello world一样，手写体识别就相当于深度学习里的hello world。 TensorFlow是当前最流行的机器学习框架，有了它，开发人工智能程序就像Java编程一样简单。 MNIST MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介... 阅读全文

posted @ 2018-03-18 15:34 skyme 阅读(15943) 评论(3) 推荐(9)

Win10下用Anaconda安装TensorFlow

摘要：什么是Anacondaanaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。它是一个用python开发机器学习的必备工具。什么是tensorflow大名鼎鼎，相信不知道tensorflow的人应该不是很多，目前github上最火的项目之一。TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本... 阅读全文

posted @ 2018-03-15 17:34 skyme 阅读(1722) 评论(2) 推荐(3)

智能分单算法

摘要：算法描述目前在物流，企业用工等领域，都有着大量的通过算法对接到的订单进行智能分配的需求。本文模拟的是用户下订单，然后商家接到订单，由配送人员进行派送的场景。在实际的应用中类似于百度外卖等有着非常多的实际应用。这种问题因为算法的复杂度太高，很难在短的时间周期内求解成功，所以有了像遗传算法，退火算法等阅读全文

posted @ 2017-06-30 14:54 skyme 阅读(5696) 评论(3) 推荐(2)

一文搞懂HMM（隐马尔可夫模型）

摘要：什么是熵(Entropy)简单来说，熵是表示物质系统状态的一种度量，用它老表征系统的无序程度。熵越大，系统越无序，意味着系统结构和运动的不确定和无规则；反之，，熵越小，系统越有序，意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化，组织化，复杂化状态的一种度量。熵... 阅读全文

posted @ 2015-07-16 14:52 skyme 阅读(391142) 评论(41) 推荐(281)

跟我一起数据挖掘（23）——C4.5

摘要：C4.5简介C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习：给定一个数据集，其中的每一个元组都能用一组属性值来描述，每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习，找到一个从属性值到类别的映射关系，并且这个映射能用于对新的类别未知的实体进行分类。由于I... 阅读全文

posted @ 2015-03-31 16:22 skyme 阅读(2315) 评论(1) 推荐(0)

众推架构的进一步讨论

摘要：讨论内容昨天的架构基本确定成如下图所示：针对此架构，大家分别提了不同的看法：【大侠】秦刘 9:53:58 工作节点的爬虫应该就是普通的一个cmd形式的小程序，对不对？【大侠】秦刘 9:54:38 webapp的作用应该只是这个【大侠】大常 9:55:11 这个是什么的... 阅读全文

posted @ 2015-03-27 14:35 skyme 阅读(2211) 评论(0) 推荐(0)

分布式爬虫技术架构

摘要：SpidermanSpiderman 是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。 Spiderman主要是运用了像XPath、正则、表达式引擎等这些技术来实现数据抽取。项目结构：依赖关系如下：webmagicwebmagic采用完全模块化的设计，功... 阅读全文

posted @ 2015-03-26 19:13 skyme 阅读(15904) 评论(1) 推荐(4)

众推项目的文档分享流程

摘要：文档分享流程今天在群里与大家讨论，想一个比较合理的分享流程。我想看到流程应该是挺清楚了，就不再多加文字方面的解释了！有想参与的可以一起进来讨论群号 194338168 想深度参与的加，不想参与的就别往里进了，现在需要的主要是开发和文档两类人。群会定期往出清人！（项目会开源出来）阅读全文

posted @ 2015-03-25 17:51 skyme 阅读(1290) 评论(0) 推荐(0)

众推平台架构——分布式爬虫

摘要：分布式爬虫架构经过新一轮的投票，项目的范围已经基本确定。大家决定全力以付，集中攻克“分布式爬虫”。分布式爬虫架构1使用队列，即生产者，消费都模式。由于生产者将规则生成到队列，然后由爬虫集群（消费者）到队列中取规则，然后按优先级等规则进行爬取。分布式爬虫架构2类似于webmagic，webmagic... 阅读全文

posted @ 2015-03-24 11:34 skyme 阅读(8921) 评论(1) 推荐(1)

跟我一起数据挖掘（19）——什么是数据挖掘（2）

摘要：什么是数据仓库？数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反映历史变化( Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理：①数据仓库用于支持决策,面向... 阅读全文

posted @ 2015-03-03 11:36 skyme 阅读(6587) 评论(1) 推荐(7)

跟我一起数据挖掘（18）——什么是数据挖掘（1）

摘要：什么是数据挖掘前两天看到群里有人问，什么是数据挖掘，现在就数据挖掘的概念做一下分析，并且尽量用大白话说一下数据挖掘到底是个啥东西，为啥大数据来了数据挖掘也火了（其实原来就挺火）。先看一上概念：数据挖掘（英语：Data mining），又译为资料探勘、数据采矿。它是数据库知识发现（英语：Knowled... 阅读全文

posted @ 2015-02-28 15:32 skyme 阅读(4072) 评论(3) 推荐(4)

算法——贝叶斯

摘要：简介学过概率理论的人都知道条件概率的公式：P(AB)=P(A)P(B|A)=P(B)P(A|B)；即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率。由条件概率公式推导出贝叶斯公式：P(B|A)=P(A|B)P(B)/P(A)；即,已知P(A|B)，P(A)和P(B)可以计算出P(B|A)。假设B是由相互独立的事件组成的概率空间{B1,b2，...bn}。则P(A)可以用全概率公式展开：P(A)=P （A|B1)P(B1)+P（A|B2)P(B2)+..P（A|Bn)P(Bn)。贝叶斯公式表示成：P(Bi|A)=P(A|Bi)P(Bi)/(P(A|B1)P(B1)+P( 阅读全文

posted @ 2014-02-24 14:03 skyme 阅读(93212) 评论(13) 推荐(25)

算法——递推算法

摘要：递推算法给定一个数的序列H0,H1,…,Hn,…若存在整数n0，使当n>n0时,可以用等号(或大于号、小于号)将Hn与其前面的某些项Hi(0f(2)-->f(1)-->f(0){f(0)=1}-->f(1)-->f(2)--f(3){f(3)=6} 而递推如下: f(0)-->f(1)-->f(2)-->f(3) 由此可见,递推的效率要高一些,在可能的情况下应尽量使用递推.但是递归作为比较基础的算法,它的作用不能忽视.所以,在把握这两种算法的时候应该特别注意。顺推法所谓顺推法是从已知条件出发，逐步推算出要解决的问题的方法叫顺推。如斐波拉契数列，阅读全文

posted @ 2014-02-09 20:33 skyme 阅读(21440) 评论(1) 推荐(4)

cloudsky

QQ群交流：微服务架构实战 181942601 nlp研究与讨论 1群598640522
大数据_人工智能交流621943289

随笔分类 - 算法

公告

cloudsky

QQ群交流：微服务架构实战 181942601 nlp研究与讨论 1群598640522 大数据_人工智能交流621943289

随笔分类 - 算法

公告

QQ群交流：微服务架构实战 181942601 nlp研究与讨论 1群598640522
大数据_人工智能交流621943289