数据挖掘及机器学习 - 随笔分类 - Django's blog

NDCG、AUC介绍

摘要：https://blog.csdn.net/u014313009/article/details/38944687 SIGIR的一篇推荐算法论文中提到用NDCG和AUC作为比较效果的指标，之前没了解过这两个指标，便查找相关概念，整理如下。一、NDCG1.DCG 首先，介绍一下DCG。DCG的全称是阅读全文

posted @ 2019-09-09 13:31 Django's blog 阅读(1647) 评论(0) 推荐(0) 编辑

awesome-RecSys

摘要：https://github.com/jihoo-kim/awesome-RecSys?fbclid=IwAR1m6OebmqO9mfLV1ta4OTihQc9Phw8WNS4zdr5IeT1X1OLWQvLk0Wz45f4 awesome-RecSys A curated list of awes 阅读全文

posted @ 2019-09-06 14:03 Django's blog 阅读(448) 评论(0) 推荐(0) 编辑

推荐系统资料整理

摘要：作者：清华阿罗链接：https://zhuanlan.zhihu.com/p/67959931来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。网上看到不错的推荐系统资料整理，分享给大家，包括书籍、会议、相关研究人员、论文和一些开源的代码，如下： 1. 书籍 Recom 阅读全文

posted @ 2019-09-06 13:59 Django's blog 阅读(796) 评论(0) 推荐(0) 编辑

类目特征使用

摘要：无论是XGBoost还是其他的Boosting Tree，使用的Tree都是cart回归树，这也就意味着该类提升树算法只接受数值特征输入，不直接支持类别特征，默认情况下，xgboost会把类别型的特征当成数值型。事实上，对于类别特征的处理，参考XGBoost PPT如下： xgboost 树模型其实阅读全文

posted @ 2019-05-22 12:12 Django's blog 阅读(724) 评论(0) 推荐(0) 编辑

GitHub 干货 | 各大数据竞赛 Top 解决方案开源汇总

摘要：AI 科技评论编者按：现在，越来越多的企业、高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学领域的优秀人才，并借此激励他们为某一数据领域或应用场景找到具有突破性意义的方案，也为之后的数据研究者留下有价值的经验。 Smilexuhc 在 GitHub 社区对各大数据竞赛名列前茅的解决方阅读全文

posted @ 2019-05-14 11:22 Django's blog 阅读(4315) 评论(0) 推荐(0) 编辑

Kaggle实战——点击率预估

摘要：https://blog.csdn.net/chengcheng1394/article/details/78940565 原创文章，转载请注明出处： http://blog.csdn.net/chengcheng1394/article/details/78940565 请安装TensorFlow 阅读全文

posted @ 2019-05-14 10:46 Django's blog 阅读(2072) 评论(0) 推荐(0) 编辑

从最近的比赛学习CTR/CVR

摘要：https://zhuanlan.zhihu.com/p/35046241 包大人深度学习炼丹劝退师包大人深度学习炼丹劝退师包大人深度学习炼丹劝退师包大人包大人包大人深度学习炼丹劝退师深度学习炼丹劝退师深度学习炼丹劝退师 278 人赞同了该文章从最近的比赛学习CTR/CVR 阅读全文

posted @ 2019-05-14 10:40 Django's blog 阅读(1751) 评论(1) 推荐(1) 编辑

TensorFlow分布式训练MNIST分类器

摘要：http://c.biancheng.net/view/2004.html 本节以分布式方式训练完整的 MNIST 分类器。该案例受到下面博客文章的启发：http://ischlag.github.io/2016/06/12/async-distributed-tensorflow/，运行在 Te 阅读全文

posted @ 2019-05-13 20:56 Django's blog 阅读(910) 评论(0) 推荐(0) 编辑

k均值聚类算法原理和（TensorFlow）实现

摘要：顾名思义，k均值聚类是一种对数据进行聚类的技术，即将数据分割成指定数量的几个类，揭示数据的内在性质及规律。我们知道，在机器学习中，有三种不同的学习模式：监督学习、无监督学习和强化学习： k 均值聚类是一种无监督学习方法。还记得哈利波特故事中的分院帽吗？那就是聚类，将新学生（无标签）分成四类：格兰芬多阅读全文

posted @ 2019-05-13 18:19 Django's blog 阅读(5281) 评论(0) 推荐(0) 编辑

RNN循环神经网络实现预测比特币价格过程详解

摘要：http://c.biancheng.net/view/1950.html 本节将介绍如何利用 RNN 预测未来的比特币价格。核心思想是过去观察到的价格时间序列为未来价格提供了一个很好的预估器。给定时间间隔的比特币值通过https://www.coindesk.com/api/的 API 下载，以下阅读全文

posted @ 2019-05-13 17:32 Django's blog 阅读(760) 评论(0) 推荐(0) 编辑

神经机器翻译（seq2seq RNN）实现详解

摘要：http://c.biancheng.net/view/1947.html seq2seq 是一类特殊的 RNN，在机器翻译、文本自动摘要和语音识别中有着成功的应用。本节中，我们将讨论如何实现神经机器翻译，得到类似于谷歌神经机器翻译系统得到的结果（https://research.googleblo 阅读全文

posted @ 2019-05-13 16:32 Django's blog 阅读(3548) 评论(0) 推荐(0) 编辑

TensorFlow实现文本情感分析详解

摘要：http://c.biancheng.net/view/1938.html 前面我们介绍了如何将卷积网络应用于图像。本节将把相似的想法应用于文本。文本和图像有什么共同之处？乍一看很少。但是，如果将句子或文档表示为矩阵，则该矩阵与其中每个单元是像素的图像矩阵没有什么区别。接下来的问题是，如何能够将文本阅读全文

posted @ 2019-05-13 15:59 Django's blog 阅读(1742) 评论(0) 推荐(0) 编辑

TensorFlow多层感知机函数逼近过程详解

摘要：http://c.biancheng.net/view/1924.html Hornik 等人的工作（http://www.cs.cmu.edu/~bhiksha/courses/deeplearning/Fall.2016/notes/Sonia_Hornik.pdf）证明了一句话，“只有一个隐藏阅读全文

posted @ 2019-05-10 16:34 Django's blog 阅读(952) 评论(0) 推荐(0) 编辑

TensorFlow常用激活函数及其特点和用法（6种）详解

摘要：http://c.biancheng.net/view/1911.html 每个神经元都必须有激活函数。它们为神经元提供了模拟复杂非线性数据集所必需的非线性特性。该函数取所有输入的加权和，进而生成一个输出信号。你可以把它看作输入和输出之间的转换。使用适当的激活函数，可以将输出值限定在一个定义的范围内阅读全文

posted @ 2019-05-10 15:49 Django's blog 阅读(2135) 评论(0) 推荐(0) 编辑

tensorflow数据加载、模型训练及预测

摘要：数据集 DNN 依赖于大量的数据。可以收集或生成数据，也可以使用可用的标准数据集。TensorFlow 支持三种主要的读取数据的方法，可以在不同的数据集中使用；本教程中用来训练建立模型的一些数据集介绍如下： MNIST：这是最大的手写数字（0～9）数据库。它由 60000 个示例的训练集和 1000 阅读全文

posted @ 2019-05-09 15:29 Django's blog 阅读(6929) 评论(0) 推荐(0) 编辑

PID optimizer

摘要：如何评价PID optimizer？论文链接：http://www4.comp.polyu.edu.hk/~cslzhang/paper/CVPR18_PID.pdf作者github：https://github.com/tensorboy/PIDOptimizer论文中只跟Momentum作了比阅读全文

posted @ 2019-05-08 17:19 Django's blog 阅读(423) 评论(0) 推荐(0) 编辑

入门推荐系统，你不应该错过的知识清单

摘要：https://www.jianshu.com/p/5585e7fe6062 【编者按】本账号为第四范式智能推荐产品先荐的官方知乎账号。本账号立足于计算机领域，特别是人工智能相关的前沿研究，旨在把更多与人工智能相关的知识分享给公众，从专业的角度促进公众对人工智能的理解；同时也希望为人工智能相关人员提阅读全文

posted @ 2019-05-08 14:29 Django's blog 阅读(672) 评论(0) 推荐(0) 编辑

主流CTR预估模型的演化及对比

摘要：https://zhuanlan.zhihu.com/p/35465875 学习和预测用户的反馈对于个性化推荐、信息检索和在线广告等领域都有着极其重要的作用。在这些领域，用户的反馈行为包括点击、收藏、购买等。本文以点击率（CTR）预估为例，介绍常用的CTR预估模型，试图找出它们之间的关联和演化规律。阅读全文

posted @ 2019-04-25 17:04 Django's blog 阅读(623) 评论(0) 推荐(0) 编辑

tensorflow创建自定义 Estimator

摘要：https://www.tensorflow.org/guide/custom_estimators?hl=zh-cn 创建自定义 Estimator 本文档介绍了自定义 Estimator。具体而言，本文档介绍了如何创建自定义 Estimator 来模拟预创建的 Estimator DNNClas 阅读全文

posted @ 2019-04-25 16:51 Django's blog 阅读(1741) 评论(0) 推荐(0) 编辑

构建分布式Tensorflow模型系列:CVR预估之ESMM

摘要：https://zhuanlan.zhihu.com/p/42214716 本文是“基于Tensorflow高阶API构建大规模分布式深度学习模型系列”的第五篇，旨在通过一个完整的案例巩固一下前面几篇文章中提到的各类高阶API的使用方法，同时演示一下用tensorflow高阶API构建一个比较复杂的阅读全文

posted @ 2019-04-25 16:43 Django's blog 阅读(1368) 评论(0) 推荐(0) 编辑

Django's blog

随笔分类 - 数据挖掘及机器学习

公告