随笔分类 - 数据挖掘及机器学习
protobuf,log4j,日志处理及挖掘
摘要:作者:西瓜军团链接:https://www.zhihu.com/question/58863937/answer/166306236来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 一、传统文本分类方法 文本分类问题算是自然语言处理领域中一个非常经典的问题了,相关研究最
阅读全文
摘要:转载请注明:炼丹实验室新开了一个专栏,为什么叫炼丹实验室呢,因为以后会在这个专栏里分享一些关于深度学习相关的实战心得,而深度学习很多人称它为玄学,犹如炼丹一般。不过即使是炼丹也是可以摸索出一些经验规律的,希望和各位炼丹术士一起多多交流。 训练技巧对深度学习来说是非常重要的,作为一门实验性质很强的科学
阅读全文
摘要:https://zhuanlan.zhihu.com/p/20792837 转载请注明:炼丹实验室 神经网络的代码,比一般的代码要难调试不少,和编译错误以及运行时程序崩溃相比,神经网络比较棘手的地方,往往在于程序运行正常,但是结果无法收敛,这个检查起来可要麻烦多了。下面是根据我平时调试神经网络的经验
阅读全文
摘要:https://zhuanlan.zhihu.com/p/24720954?utm_source=zhihu&utm_medium=social 转载请注明:炼丹实验室 之前曾经写过一篇文章,讲了一些深度学习训练的技巧,其中包含了部分调参心得:深度学习训练心得。不过由于一般深度学习实验,相比普通机器
阅读全文
摘要:http://blog.csdn.net/starzhou/article/details/70602328 用深度学习解决大规模文本分类问题 人工智能头条 2017-03-27 22:14:22 淘宝 阅读(228) 评论(0) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表
阅读全文
摘要:http://www.jianshu.com/p/9dc9f41f0b29# 本文译自 Christopher Olah 的博文 Recurrent Neural Networks 人类并不是每时每刻都从一片空白的大脑开始他们的思考。在你阅读这篇文章时候,你都是基于自己已经拥有的对先前所见词的理解来
阅读全文
摘要:http://www.jianshu.com/p/e112012a4b2d 本文是学习这个视频课程系列的笔记,课程链接是 youtube 上的,讲的很好,浅显易懂,入门首选, 而且在github有代码,想看视频的也可以去他的优酷里的频道找。 Tensorflow 官网 神经网络是一种数学模型,是存在
阅读全文
摘要:http://blog.csdn.net/u010223750/article/details/53334313?locationNum=7&fps=1 引言 学习一段时间的tensor flow之后,想找个项目试试手,然后想起了之前在看Theano教程中的一个文本分类的实例,这个星期就用tenso
阅读全文
摘要:1 I either LOVE Brokeback Mountain or think it’s great that homosexuality is becoming more acceptable!:1 Anyway, thats why I love ” Brokeback Mountain
阅读全文
摘要:http://blog.topspeedsnail.com/archives/10542 主题 TensorFlow http://blog.topspeedsnail.com/archives/10542 主题 TensorFlow RNN不像传统的神经网络-它们的输出输出是固定的,而RNN允许我
阅读全文
摘要:http://www.renwuyi.com/index.php?action=artinfo&id=19036&cat_id=2#top 文本生成是比较学术的说法,通常在媒体上见到的“机器人写作”、“人工智能写作”、“自动对话生成”、“机器人写古诗”等,都属于文本生成的范畴。 2016年里,关于文
阅读全文
摘要:https://mp.weixin.qq.com/s/P-a-n1PsBL5hLZWVxyuLQw 「论文访谈间」是由 PaperWeekly 和中国中文信息学会青工委联合发起的论文报道栏目,旨在让国内优质论文得到更多关注和认可。 这是第 6 期「论文访谈间」 论文作者 | 陈新驰、施展、邱锡鹏、黄
阅读全文
摘要:http://h2ex.com/1282 现有分词介绍 自然语言处理(NLP,Natural Language Processing)是一个信息时代最重要的技术之一,简单来讲,就是让计算机能够理解人类语言的一种技术。在其中,分词技术是一种比较基础的模块。对于英文等拉丁语系的语言而言,由于词之间有空格
阅读全文
摘要:http://magicly.me/2017/04/07/rnn-lstm-generate-name/?utm_source=tuicool&utm_medium=referral 之前翻译了一篇介绍RNN的文章,一直没看到作者写新的介绍LSTM的blog,于是我又找了其他资料学习。本文先介绍一下
阅读全文
摘要:https://medium.com/towards-data-science/lstm-by-example-using-tensorflow-feb0c1968537 在深度学习中,循环神经网络(RNN)是一系列善于从序列数据中学习的神经网络。由于对长期依赖问题的鲁棒性,长短期记忆(LSTM)是
阅读全文
摘要:旅游推荐系统的演进 http://tech.meituan.com/travel-recsys.html 背景 度假业务在整个在线旅游市场中占据着非常重要的位置,如何做好做大这块蛋糕是行业内的焦点。与美食或酒店的用户兴趣点明确(比如找某个确定的餐厅或者找某个目的地附近的酒店)不同,旅游场景中的用户兴
阅读全文
摘要:http://spaces.ac.cn/archives/3924/ 关于字标注法 上一篇文章谈到了分词的字标注法。要注意字标注法是很有潜力的,要不然它也不会在公开测试中取得最优的成绩了。在我看来,字标注法有效有两个主要的原因,第一个原因是它将分词问题变成了一个序列标注问题,而且这个标注是对齐的,也
阅读全文
摘要:http://blog.csdn.net/rockingdingo/article/details/55653279 Github下载完整代码 https://github.com/rockingdingo/deepnlp/tree/master/deepnlp/pos 简介 这篇文章中我们将基于T
阅读全文
摘要:http://spaces.ac.cn/archives/3942/ 暑假期间做了一下百度和西安交大联合举办的核心实体识别竞赛,最终的结果还不错,遂记录一下。模型的效果不是最好的,但是胜在“端到端”,迁移性强,估计对大家会有一定的参考价值。 比赛的主题是“核心实体识别”,其实有两个任务:核心识别 +
阅读全文
摘要:中文分词入门之字标注法3 http://www.52nlp.cn/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%85%A5%E9%97%A8%E4%B9%8B%E5%AD%97%E6%A0%87%E6%B3%A8%E6%B3%953 9条回复 最近要整理一下课程图谱
阅读全文