[置顶] Bert模型实现垃圾邮件分类

摘要：近日，对近些年在NLP领域很火的BERT模型进行了学习，并进行实践。今天在这里做一下笔记。本篇博客包含下列内容： BERT模型简介概览 BERT模型结构 BERT项目学习及代码走读项目基本特性介绍代码走读&要点归纳基于BERT模型实现垃圾邮件分类 TREC06语料库基准模型介绍 BERT 阅读全文

posted @ 2021-06-30 21:09 牛云杰阅读(2110) 评论(1) 推荐(1)

[置顶] 基于SKLearn的SVM模型垃圾邮件分类——代码实现及优化

摘要：一. 前言由于最近有一个邮件分类的工作需要完成，研究了一下基于SVM的垃圾邮件分类模型。参照这位作者的思路（https://blog.csdn.net/qq_40186809/article/details/88354825），使用trec06c这个公开的垃圾邮件语料库（https://plg.u 阅读全文

posted @ 2021-06-11 21:27 牛云杰阅读(2481) 评论(0) 推荐(0)

[置顶] 水电站入库流量预测--基于自定义损失函数的循环神经网络建模方法

摘要：从志在必得到铩羽而归——记一次大数据竞赛经历最近参加了一个比赛，在工业大数据产业创新平台上，是一个水电站入库流量预测问题。简单看了一下题目，嚯，这个方向以前有做过啊，不说了~开整。赛题背景：对进入水电站水库的入库流量进行精准预测，能够帮助水电站对防洪、发电计划调度工作进行合理安排。入库流量受到降阅读全文

posted @ 2020-11-05 01:15 牛云杰阅读(1203) 评论(3) 推荐(2)

[置顶] 基于深度学习方法的dota2游戏数据分析与胜率预测（python3.6+keras框架实现）

摘要：很久以前就有想过使用深度学习模型来对dota2的对局数据进行建模分析，以便在英雄选择，出装方面有所指导，帮助自己提升天梯等级，但苦于找不到数据源，该计划搁置了很长时间。直到前些日子，看到社区有老哥提到说OpenDota网站(https://www.opendota.com/)提供有一整套的接口可以获阅读全文

posted @ 2019-10-31 22:51 牛云杰阅读(5198) 评论(4) 推荐(4)

[置顶] 基于CBOW网络手动实现面向中文语料的word2vec

摘要：最近在工作之余学习NLP相关的知识，对word2vec的原理进行了研究。在本篇文章中，尝试使用TensorFlow自行构建、训练出一个word2vec模型，以强化学习效果，加深理解。一.背景知识：在深度学习实践中，传统的词汇表达方式是使用one-hot向量，其中，向量的维度等于词汇量的大小。这会阅读全文

posted @ 2018-12-21 00:26 牛云杰阅读(1964) 评论(0) 推荐(0)

[置顶] 《Machine Learning Yearing》读书笔记

摘要： ——深度学习的建模、调参思路整合。写在前面最近偶尔从师兄那里获取到了吴恩达教授的新书《Machine Learning Yearing》(手稿)，该书主要分享了神经网络建模、训练、调节参数时所需要的一些技巧和经验。我在之前的一些深度学习项目中也遇到过模型优化，参数调节之类的问题，由于当时缺少系统阅读全文

posted @ 2018-10-26 20:57 牛云杰阅读(952) 评论(0) 推荐(0)

[置顶] 使用神经网络预测航班起飞准点率

摘要：前些日子，参加了一个解放号的行业大数据创新应用大赛， https://1024.jfh.com/question/detail?contestId=6 一.问题描述赛题是根据西安机场上半年的航班起降信息，建立适当预测模型，预测未来七天的航班准点率，(航班实际起飞时间-航班计划起飞时间)< 15 分阅读全文

posted @ 2018-09-30 23:34 牛云杰阅读(2698) 评论(11) 推荐(4)

[置顶] 基于selenium+phantomJS的动态网站全站爬取

摘要：由于需要在公司的内网进行神经网络建模试验(https://www.cnblogs.com/NosenLiu/articles/9463886.html)，为了更方便的在内网环境下快速的查阅资料，构建深度学习模型，我决定使用爬虫来对深度学习框架keras的使用手册进行爬取。 keras中文文档的地址是阅读全文

posted @ 2018-08-12 21:50 牛云杰阅读(1866) 评论(1) 推荐(0)

2021年7月19日

麒麟操作系统上安装docker并加载镜像

摘要：最近需要在政务云系统中部署深度学习环境，其使用麒麟操作系统并与互联网相互隔离，无法使用常规的指令行方式进行安装。参考docker官方文档并经过多次尝试，使用离线安装的方式完成了环境的部署。这里做一下笔记分享经验。整个过程大概分为4步： ·操作系统版本信息查询 ·docker官网下载安装文件 ·离线阅读全文

posted @ 2021-07-19 20:24 牛云杰阅读(9877) 评论(0) 推荐(0)

2021年5月27日

sklearn中，数据集划分函数 StratifiedShuffleSplit.split() 使用踩坑

摘要：在SKLearn中，StratifiedShuffleSplit 类实现了对数据集进行洗牌、分割的功能。但在今晚的实际使用中，发现该类及其方法split()仅能够对二分类样本有效。一个简单的例子如下： 1 import numpy as np 2 from sklearn.model_select 阅读全文

posted @ 2021-05-27 22:47 牛云杰阅读(2164) 评论(1) 推荐(0)

2020年11月19日

Adaboost算法的一个简单实现——基于《统计学习方法(李航)》第八章

摘要：最近阅读了李航的《统计学习方法(第二版)》，对AdaBoost算法进行了学习。在第八章的8.1.3小节中，举了一个具体的算法计算实例。美中不足的是书上只给出了数值解，这里用代码将它实现一下，算作一个课后作业。一、算法简述 Adaboost算法最终输出一个全局分类模型，由多个基本分类模型组成，每个阅读全文

posted @ 2020-11-19 00:35 牛云杰阅读(677) 评论(0) 推荐(0)

2020年8月27日

使用Wasserstein GAN生成小狗图像

摘要：一.前期学习经过 GAN(Generative Adversarial Nets)是生成对抗网络的简称，由生成器和判别器组成，在训练过程中通过生成器和判别器的相互对抗，来相互的促进、提高。最近一段时间对GAN进行了学习，并使用GAN做了一次实践，在这里做一篇笔记记录一下。最初我参照JensLee大阅读全文

posted @ 2020-08-27 00:46 牛云杰阅读(1594) 评论(0) 推荐(1)

2020年4月18日

TensorFlow保存、加载模型参数 | 原理描述及踩坑经验总结

摘要：写在前面我之前使用的LSTM计算单元是根据其前向传播的计算公式手动实现的，这两天想要和TensorFlow自带的tf.nn.rnn_cell.BasicLSTMCell()比较一下，看看哪个训练速度快一些。在使用tf.nn.rnn_cell.BasicLSTMCell()进行建模的时候，遇到了模型阅读全文

posted @ 2020-04-18 11:06 牛云杰阅读(3427) 评论(0) 推荐(0)

2021年7月19日

2021年5月27日

2020年11月19日

2020年8月27日

2020年4月18日

公告