会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
牛云杰
博客园
首页
新随笔
联系
订阅
管理
[置顶]
Bert模型实现垃圾邮件分类
摘要: 近日,对近些年在NLP领域很火的BERT模型进行了学习,并进行实践。今天在这里做一下笔记。 本篇博客包含下列内容: BERT模型简介 概览 BERT模型结构 BERT项目学习及代码走读 项目基本特性介绍 代码走读&要点归纳 基于BERT模型实现垃圾邮件分类 TREC06语料库 基准模型介绍 BERT
阅读全文
posted @ 2021-06-30 21:09 牛云杰
阅读(1647)
评论(1)
推荐(1)
编辑
[置顶]
基于SKLearn的SVM模型垃圾邮件分类——代码实现及优化
摘要: 一. 前言 由于最近有一个邮件分类的工作需要完成,研究了一下基于SVM的垃圾邮件分类模型。参照这位作者的思路(https://blog.csdn.net/qq_40186809/article/details/88354825),使用trec06c这个公开的垃圾邮件语料库(https://plg.u
阅读全文
posted @ 2021-06-11 21:27 牛云杰
阅读(2129)
评论(0)
推荐(0)
编辑
[置顶]
水电站入库流量预测--基于自定义损失函数的循环神经网络建模方法
摘要: 从志在必得到铩羽而归——记一次大数据竞赛经历 最近参加了一个比赛,在工业大数据产业创新平台上,是一个水电站入库流量预测问题。简单看了一下题目,嚯,这个方向以前有做过啊,不说了~开整。 赛题背景:对进入水电站水库的入库流量进行精准预测,能够帮助水电站对防洪、发电计划调度工作进行合理安排。入库流量受到降
阅读全文
posted @ 2020-11-05 01:15 牛云杰
阅读(995)
评论(3)
推荐(2)
编辑
[置顶]
基于深度学习方法的dota2游戏数据分析与胜率预测(python3.6+keras框架实现)
摘要: 很久以前就有想过使用深度学习模型来对dota2的对局数据进行建模分析,以便在英雄选择,出装方面有所指导,帮助自己提升天梯等级,但苦于找不到数据源,该计划搁置了很长时间。直到前些日子,看到社区有老哥提到说OpenDota网站(https://www.opendota.com/)提供有一整套的接口可以获
阅读全文
posted @ 2019-10-31 22:51 牛云杰
阅读(4619)
评论(4)
推荐(4)
编辑
[置顶]
基于CBOW网络手动实现面向中文语料的word2vec
摘要: 最近在工作之余学习NLP相关的知识,对word2vec的原理进行了研究。在本篇文章中,尝试使用TensorFlow自行构建、训练出一个word2vec模型,以强化学习效果,加深理解。 一.背景知识: 在深度学习实践中,传统的词汇表达方式是使用one-hot向量,其中,向量的维度等于词汇量的大小。这会
阅读全文
posted @ 2018-12-21 00:26 牛云杰
阅读(1760)
评论(0)
推荐(0)
编辑
[置顶]
《Machine Learning Yearing》读书笔记
摘要: ——深度学习的建模、调参思路整合。 写在前面 最近偶尔从师兄那里获取到了吴恩达教授的新书《Machine Learning Yearing》(手稿),该书主要分享了神经网络建模、训练、调节参数时所需要的一些技巧和经验。我在之前的一些深度学习项目中也遇到过模型优化,参数调节之类的问题,由于当时缺少系统
阅读全文
posted @ 2018-10-26 20:57 牛云杰
阅读(913)
评论(0)
推荐(0)
编辑
[置顶]
使用神经网络预测航班起飞准点率
摘要: 前些日子,参加了一个解放号的行业大数据创新应用大赛, https://1024.jfh.com/question/detail?contestId=6 一.问题描述 赛题是根据西安机场上半年的航班起降信息,建立适当预测模型,预测未来七天的航班准点率,(航班实际起飞时间-航班计划起飞时间)< 15 分
阅读全文
posted @ 2018-09-30 23:34 牛云杰
阅读(2575)
评论(11)
推荐(4)
编辑
[置顶]
基于selenium+phantomJS的动态网站全站爬取
摘要: 由于需要在公司的内网进行神经网络建模试验(https://www.cnblogs.com/NosenLiu/articles/9463886.html),为了更方便的在内网环境下快速的查阅资料,构建深度学习模型,我决定使用爬虫来对深度学习框架keras的使用手册进行爬取。 keras中文文档的地址是
阅读全文
posted @ 2018-08-12 21:50 牛云杰
阅读(1792)
评论(1)
推荐(0)
编辑
2021年7月19日
麒麟操作系统上安装docker并加载镜像
摘要: 最近需要在政务云系统中部署深度学习环境,其使用麒麟操作系统并与互联网相互隔离,无法使用常规的指令行方式进行安装。参考docker官方文档并经过多次尝试,使用离线安装的方式完成了环境的部署。这里做一下笔记分享经验。 整个过程大概分为4步: ·操作系统版本信息查询 ·docker官网下载安装文件 ·离线
阅读全文
posted @ 2021-07-19 20:24 牛云杰
阅读(9027)
评论(0)
推荐(0)
编辑
2021年5月27日
sklearn中,数据集划分函数 StratifiedShuffleSplit.split() 使用踩坑
摘要: 在SKLearn中,StratifiedShuffleSplit 类实现了对数据集进行洗牌、分割的功能。但在今晚的实际使用中,发现该类及其方法split()仅能够对二分类样本有效。 一个简单的例子如下: 1 import numpy as np 2 from sklearn.model_select
阅读全文
posted @ 2021-05-27 22:47 牛云杰
阅读(1946)
评论(1)
推荐(0)
编辑
2020年11月19日
Adaboost算法的一个简单实现——基于《统计学习方法(李航)》第八章
摘要: 最近阅读了李航的《统计学习方法(第二版)》,对AdaBoost算法进行了学习。 在第八章的8.1.3小节中,举了一个具体的算法计算实例。美中不足的是书上只给出了数值解,这里用代码将它实现一下,算作一个课后作业。 一、算法简述 Adaboost算法最终输出一个全局分类模型,由多个基本分类模型组成,每个
阅读全文
posted @ 2020-11-19 00:35 牛云杰
阅读(623)
评论(0)
推荐(0)
编辑
2020年8月27日
使用Wasserstein GAN生成小狗图像
摘要: 一.前期学习经过 GAN(Generative Adversarial Nets)是生成对抗网络的简称,由生成器和判别器组成,在训练过程中通过生成器和判别器的相互对抗,来相互的促进、提高。最近一段时间对GAN进行了学习,并使用GAN做了一次实践,在这里做一篇笔记记录一下。 最初我参照JensLee大
阅读全文
posted @ 2020-08-27 00:46 牛云杰
阅读(1242)
评论(0)
推荐(1)
编辑
2020年4月18日
TensorFlow保存、加载模型参数 | 原理描述及踩坑经验总结
摘要: 写在前面 我之前使用的LSTM计算单元是根据其前向传播的计算公式手动实现的,这两天想要和TensorFlow自带的tf.nn.rnn_cell.BasicLSTMCell()比较一下,看看哪个训练速度快一些。在使用tf.nn.rnn_cell.BasicLSTMCell()进行建模的时候,遇到了模型
阅读全文
posted @ 2020-04-18 11:06 牛云杰
阅读(3354)
评论(0)
推荐(0)
编辑
下一页
公告