随笔分类 -  数据挖掘及机器学习

上一页 1 2 3 4 5 6 7 8 9 10 ··· 19 下一页
protobuf,log4j,日志处理及挖掘
摘要:AAAI 2018 论文 | 蚂蚁金服公开最新基于笔画的中文词向量算法 2018-01-18 16:13蚂蚁金服/雾霾/人工智能 AAAI 2018 论文 | 蚂蚁金服公开最新基于笔画的中文词向量算法 2018-01-18 16:13蚂蚁金服/雾霾/人工智能 导读:词向量算法是自然语言处理领域的基础 阅读全文
posted @ 2018-04-19 18:12 Django's blog 阅读(478) 评论(0) 推荐(0) 编辑
摘要:http://www.52ml.net/20031.html 【新智元导读】Graph Convolutional Network(GCN)是直接作用于图的卷积神经网络,GCN 允许对结构化数据进行端到端的学习,也即输入可以是任意大小和形状的图。本文介绍 GCN 最新进展,讨论各种方法的优势和缺陷。 阅读全文
posted @ 2018-04-12 17:46 Django's blog 阅读(691) 评论(0) 推荐(0) 编辑
摘要:https://zhuanlan.zhihu.com/p/27216346 本文要介绍的这一篇paper是ICML2016上一篇关于 CNN 在图(graph)上的应用。ICML 是机器学习方面的顶级会议,这篇文章--<< Learning CNNs for Graphs>>--所研究的内容也具有非 阅读全文
posted @ 2018-04-12 17:45 Django's blog 阅读(404) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/sb19931201/article/details/52577592 xgboost入门与实战(实战调参篇) 前言 前面几篇博文都在学习原理知识,是时候上数据上模型跑一跑了。本文用的数据来自kaggle,相信搞机器学习的同学们都知道它,kaggle上有几 阅读全文
posted @ 2018-04-11 20:41 Django's blog 阅读(713) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/sb19931201/article/details/52557382 xgboost入门与实战(原理篇) 前言: xgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。 阅读全文
posted @ 2018-04-11 20:40 Django's blog 阅读(1134) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/u010976453/article/details/78488279 1. 损失函数 损失函数(Loss function)是用来估量你模型的预测值 f(x)f(x) 与真实值 YY 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x))L(Y, 阅读全文
posted @ 2018-04-02 11:40 Django's blog 阅读(3724) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/willduan1/article/details/73618677 集成学习主要分为 bagging, boosting 和 stacking方法。本文主要是介绍stacking方法及其应用。但是在总结之前还是先回顾一下继承学习。 这部分主要转自知乎。 1 阅读全文
posted @ 2018-03-06 20:15 Django's blog 阅读(3327) 评论(0) 推荐(0) 编辑
摘要:http://www.52nlp.cn/fasttext 1条回复 本文首先会介绍一些预备知识,比如softmax、ngram等,然后简单介绍word2vec原理,之后来讲解fastText的原理,并着手使用keras搭建一个简单的fastText分类器,最后,我们会介绍fastText在达观数据的 阅读全文
posted @ 2018-01-29 19:19 Django's blog 阅读(855) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/jerr__y/article/details/53695567 前言:本文主要介绍如何在 ubuntu 系统中配置 GPU 版本的 tensorflow 环境。主要包括: - cuda 安装 - cudnn 安装 - tensorflow 安装 - ker 阅读全文
posted @ 2018-01-13 20:25 Django's blog 阅读(1323) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/jerr__y/article/details/53188573 本文主要参考下面的文章,文中的代码基本是把第二篇文章的代码手写实现了一下。 - pca讲解:http://www.cnblogs.com/jerrylead/archive/2011/04/1 阅读全文
posted @ 2018-01-13 20:15 Django's blog 阅读(831) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/jerr__y/article/details/77751885 关于比赛详情,请戳:2017 知乎看山杯机器学习挑战赛 代码:https://github.com/yongyehuang/zhihu-text-classification 基于:pytho 阅读全文
posted @ 2018-01-13 19:54 Django's blog 阅读(1512) 评论(0) 推荐(1) 编辑
摘要:http://blog.csdn.net/Jerr__y/article/details/70471066 欢迎转载,但请务必注明原文出处及作者信息。 @author: huangyongye @creat_date: 2017-04-19 前言 本例子主要介绍如何使用 TensorFlow 来一步 阅读全文
posted @ 2018-01-13 17:44 Django's blog 阅读(551) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/appleml/article/details/78664824 在理解CRF的时候费了一些功夫,将一些难以理解的地方稍微做了下标注,隔三差五看看加强记忆, 代码是pytorch文档上的example 阅读全文
posted @ 2018-01-13 17:37 Django's blog 阅读(654) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/guixunlong/article/details/8925990 从头开始编写基于隐含马尔可夫模型HMM的中文分词器之一 - 资源篇 首先感谢52nlp的系列博文(http://www.52nlp.cn/),提供了自然语言处理的系列学习文章,让我学习到了 阅读全文
posted @ 2018-01-13 17:01 Django's blog 阅读(509) 评论(0) 推荐(0) 编辑
摘要:http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E8%AF%BE%E7%A8%8B%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%85%AC%E5%BC%80%E8%AF%BE%E8%B5%84%E6% 阅读全文
posted @ 2017-12-11 11:55 Django's blog 阅读(1187) 评论(0) 推荐(0) 编辑
摘要:http://www.jianshu.com/p/d44ce1e3ec2f 1、 前言 本篇主要介绍关键词的向量表示,也就是大家熟悉的word embedding。自Google 2013 年开源word2vec算法程序以后,它的简单、高效、实用,很快引起业界众人的关注和应用,为搜索引擎、[广告系统 阅读全文
posted @ 2017-12-08 15:00 Django's blog 阅读(597) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/baimafujinji/article/details/77836142 一、数学上的“嵌入”(Embedding) Embed这个词,英文的释义为, fix (an object) firmly and deeply in a surrounding m 阅读全文
posted @ 2017-12-07 21:02 Django's blog 阅读(2465) 评论(1) 推荐(2) 编辑
摘要:https://www.zhihu.com/question/48107602 作者:王凯链接:https://www.zhihu.com/question/48107602/answer/159801895来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 从id类特征 阅读全文
posted @ 2017-12-07 20:56 Django's blog 阅读(2080) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/jdbc/article/details/53292414 过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在 阅读全文
posted @ 2017-12-07 20:45 Django's blog 阅读(1175) 评论(1) 推荐(0) 编辑
摘要:http://blog.csdn.net/joshuaxx316/article/details/54926924 最近一直在调研文本摘要,主题,图像标注和视频摘要方面的基础和相关论文,所以mark一下,积累知识的同时,也便于日后进行分析和总结,毕竟不是搞这个的,有点跨方向了,不过好歹也是机器学习。 阅读全文
posted @ 2017-12-07 20:27 Django's blog 阅读(326) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 9 10 ··· 19 下一页