05 2019 档案

摘要:无论是XGBoost还是其他的Boosting Tree,使用的Tree都是cart回归树,这也就意味着该类提升树算法只接受数值特征输入,不直接支持类别特征,默认情况下,xgboost会把类别型的特征当成数值型。事实上,对于类别特征的处理,参考XGBoost PPT如下: xgboost 树模型其实 阅读全文
posted @ 2019-05-22 12:12 Django's blog 阅读(737) 评论(0) 推荐(0) 编辑
摘要:AI 科技评论编者按:现在,越来越多的企业、高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学领域的优秀人才,并借此激励他们为某一数据领域或应用场景找到具有突破性意义的方案,也为之后的数据研究者留下有价值的经验。 Smilexuhc 在 GitHub 社区对各大数据竞赛名列前茅的解决方 阅读全文
posted @ 2019-05-14 11:22 Django's blog 阅读(4441) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/chengcheng1394/article/details/78940565 原创文章,转载请注明出处: http://blog.csdn.net/chengcheng1394/article/details/78940565 请安装TensorFlow 阅读全文
posted @ 2019-05-14 10:46 Django's blog 阅读(2098) 评论(0) 推荐(0) 编辑
摘要:https://zhuanlan.zhihu.com/p/35046241 包大人 深度学习炼丹劝退师 包大人 深度学习炼丹劝退师 包大人 深度学习炼丹劝退师 包大人 包大人 包大人 深度学习炼丹劝退师 深度学习炼丹劝退师 深度学习炼丹劝退师 278 人赞同了该文章 从最近的比赛学习CTR/CVR 阅读全文
posted @ 2019-05-14 10:40 Django's blog 阅读(1764) 评论(1) 推荐(1) 编辑
摘要:http://c.biancheng.net/view/2004.html 本节以分布式方式训练完整的 MNIST 分类器。 该案例受到下面博客文章的启发:http://ischlag.github.io/2016/06/12/async-distributed-tensorflow/,运行在 Te 阅读全文
posted @ 2019-05-13 20:56 Django's blog 阅读(913) 评论(0) 推荐(0) 编辑
摘要:顾名思义,k均值聚类是一种对数据进行聚类的技术,即将数据分割成指定数量的几个类,揭示数据的内在性质及规律。我们知道,在机器学习中,有三种不同的学习模式:监督学习、无监督学习和强化学习: k 均值聚类是一种无监督学习方法。还记得哈利波特故事中的分院帽吗?那就是聚类,将新学生(无标签)分成四类:格兰芬多 阅读全文
posted @ 2019-05-13 18:19 Django's blog 阅读(5324) 评论(0) 推荐(0) 编辑
摘要:http://c.biancheng.net/view/1950.html 本节将介绍如何利用 RNN 预测未来的比特币价格。核心思想是过去观察到的价格时间序列为未来价格提供了一个很好的预估器。给定时间间隔的比特币值通过https://www.coindesk.com/api/的 API 下载,以下 阅读全文
posted @ 2019-05-13 17:32 Django's blog 阅读(788) 评论(0) 推荐(0) 编辑
摘要:http://c.biancheng.net/view/1947.html seq2seq 是一类特殊的 RNN,在机器翻译、文本自动摘要和语音识别中有着成功的应用。本节中,我们将讨论如何实现神经机器翻译,得到类似于谷歌神经机器翻译系统得到的结果(https://research.googleblo 阅读全文
posted @ 2019-05-13 16:32 Django's blog 阅读(3602) 评论(0) 推荐(0) 编辑
摘要:http://c.biancheng.net/view/1938.html 前面我们介绍了如何将卷积网络应用于图像。本节将把相似的想法应用于文本。文本和图像有什么共同之处?乍一看很少。但是,如果将句子或文档表示为矩阵,则该矩阵与其中每个单元是像素的图像矩阵没有什么区别。接下来的问题是,如何能够将文本 阅读全文
posted @ 2019-05-13 15:59 Django's blog 阅读(1748) 评论(0) 推荐(0) 编辑
摘要:来自:开源最前线(ID:OpenSourceTop) 综合自:AI前线、https://github.com/sql-machine-learning/sqlflow 5月6日,蚂蚁金服副 CTO 胡喜正式宣布开源机器学习工具 SQLFlow:“未来三年,AI 能力会成为每一位技术人员的基本能力。我 阅读全文
posted @ 2019-05-13 11:19 Django's blog 阅读(4257) 评论(0) 推荐(0) 编辑
摘要:http://c.biancheng.net/view/1924.html Hornik 等人的工作(http://www.cs.cmu.edu/~bhiksha/courses/deeplearning/Fall.2016/notes/Sonia_Hornik.pdf)证明了一句话,“只有一个隐藏 阅读全文
posted @ 2019-05-10 16:34 Django's blog 阅读(962) 评论(0) 推荐(0) 编辑
摘要:http://c.biancheng.net/view/1911.html 每个神经元都必须有激活函数。它们为神经元提供了模拟复杂非线性数据集所必需的非线性特性。该函数取所有输入的加权和,进而生成一个输出信号。你可以把它看作输入和输出之间的转换。使用适当的激活函数,可以将输出值限定在一个定义的范围内 阅读全文
posted @ 2019-05-10 15:49 Django's blog 阅读(2144) 评论(0) 推荐(0) 编辑
摘要:数据集 DNN 依赖于大量的数据。可以收集或生成数据,也可以使用可用的标准数据集。TensorFlow 支持三种主要的读取数据的方法,可以在不同的数据集中使用;本教程中用来训练建立模型的一些数据集介绍如下: MNIST:这是最大的手写数字(0~9)数据库。它由 60000 个示例的训练集和 1000 阅读全文
posted @ 2019-05-09 15:29 Django's blog 阅读(6947) 评论(0) 推荐(0) 编辑
摘要:https://tech.meituan.com/2016/03/31/spark-in-meituan.html 本文已发表在《程序员》杂志2016年4月期。 前言 美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习 阅读全文
posted @ 2019-05-08 17:36 Django's blog 阅读(580) 评论(0) 推荐(0) 编辑
摘要:如何评价PID optimizer? 论文链接:http://www4.comp.polyu.edu.hk/~cslzhang/paper/CVPR18_PID.pdf作者github:https://github.com/tensorboy/PIDOptimizer论文中只跟Momentum作了比 阅读全文
posted @ 2019-05-08 17:19 Django's blog 阅读(427) 评论(0) 推荐(0) 编辑
摘要:https://www.jianshu.com/p/5585e7fe6062 【编者按】本账号为第四范式智能推荐产品先荐的官方知乎账号。本账号立足于计算机领域,特别是人工智能相关的前沿研究,旨在把更多与人工智能相关的知识分享给公众,从专业的角度促进公众对人工智能的理解;同时也希望为人工智能相关人员提 阅读全文
posted @ 2019-05-08 14:29 Django's blog 阅读(677) 评论(0) 推荐(0) 编辑
摘要:https://www.iyiou.com/p/57849.html [ 亿欧导读 ] 新零售的概念越来越鲜明,可以说它主要是线下体验零售和线上效率零售两部分组成,因为新零售要解决的不仅是购买,核心在于“体验零售”,目前体验零售主要有视觉体验、包装体验、结算体验和交互体验等形式。 图片来自“123r 阅读全文
posted @ 2019-05-05 20:20 Django's blog 阅读(503) 评论(0) 推荐(0) 编辑
摘要:https://www.sohu.com/a/242752605_114819 本文主要从两个维度去介绍新零售行业:新零售背景及概念解读;线下实体店业务运作模式介绍。希望可以帮助大家更好的理解所谓“旧零售”业务场景,从而进行更精准的产品设计。 一、新零售 当下互联网圈子中,新零售俨然已经成为了一个人 阅读全文
posted @ 2019-05-05 20:04 Django's blog 阅读(446) 评论(0) 推荐(0) 编辑
摘要:作者:Xiaoyu Ma链接:https://www.zhihu.com/question/27974418/answer/38965760来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理 阅读全文
posted @ 2019-05-05 11:40 Django's blog 阅读(471) 评论(1) 推荐(1) 编辑

点击右上角即可分享
微信分享提示