摘要: 在本篇中,我们将展式使用 Python 统计学模型进行时间序列数据分析。* 问题描述 *目标:根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。 原始数据:2017-01-01 到 2019-09-23 期间的每日广告支出。 数据准备:划分训练集和测试集。 df1 = data[[' 阅读全文
posted @ 2020-04-10 13:25 deephub 阅读(2596) 评论(0) 推荐(0) 编辑
摘要: 各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比表示。 阅读全文
posted @ 2020-04-09 13:43 deephub 阅读(1176) 评论(0) 推荐(0) 编辑
摘要: 虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实。但是,虚假新闻仍然会越过我们的防线,在网络上迅速扩散,由于用户的无知和粗心而加剧。正如NBC新闻报道所显示的那样,假新闻不仅会散布恐惧和虚假信息,而且还可能对公司和个人的声誉造成损害。为了减少错误信息的直接和间接 阅读全文
posted @ 2020-04-08 13:44 deephub 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。 在本文中,我们将讨论: 什么是lighting以及为什么要将它应用于RL 标准 阅读全文
posted @ 2020-04-07 13:39 deephub 阅读(1153) 评论(0) 推荐(0) 编辑
摘要: 您可能会感到惊讶,但这是有效的。 ​ 最近,我阅读了arXiv平台上的Jonathan Frankle,David J. Schwab和Ari S. Morcos撰写的论文“Training BatchNorm and Only BatchNorm: On the Expressive Power 阅读全文
posted @ 2020-04-03 12:54 deephub 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 什么是标签平滑?在PyTorch中如何去使用它? 在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。一方面,正则化技术可以解决过拟合问题,其中较为常见的方法有将权重调小,迭代提前停止以及丢弃一些权重等。另一方面,Platt标度法和isot 阅读全文
posted @ 2020-04-02 13:20 deephub 阅读(1516) 评论(0) 推荐(0) 编辑
摘要: 分类模型(分类器)是一种有监督的机器学习模型,其中目标变量是离散的(即类别)。评估一个机器学习模型和建立模型一样重要。我们建立模型的目的是对全新的未见过的数据进行处理,因此,要建立一个鲁棒的模型,就需要对模型进行全面而又深入的评估。当涉及到分类模型时,评估过程变得有些棘手。 在这篇文章中,我会做详细 阅读全文
posted @ 2020-04-01 13:47 deephub 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 本文通过文本的挖掘,对人们在冠状病毒锁定期间正在做什么以及他们的感觉进行的探索性和情感分析 随着越来越多的国家宣布在全国范围内关闭,大多数人被要求留在家里隔离。 我们来看看国外的人们在此“关闭”期间如何度过时间以及感觉如何,所以我分析了本文中的一些推文,看看国外友人到底都干什么。 数据获取和预处理 阅读全文
posted @ 2020-03-30 13:06 deephub 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 前言 神奇宝贝已经是一个家喻户晓的动画了,我们今天来确认是否可以使用深度学习为他自动创建新的Pokemon。我最终成功地使用了生成对抗网络(GAN)生成了类似Pokemon的图像,但是这个图像看起来并不像神奇宝贝。虽然这个尝试失败了,但是我认为其他人可能会喜欢这个过程,现在把他分享出来。 GAN生成 阅读全文
posted @ 2020-03-29 19:06 deephub 阅读(491) 评论(0) 推荐(0) 编辑
摘要: 当只有几个正样本,你如何分类无标签数据 假设您有一个交易业务数据集。有些交易被标记为欺诈,其余交易被标记为真实交易,因此您需要设计一个模型来区分欺诈交易和真实交易。 假设您有足够的数据和良好的特征,这似乎是一项简单的分类任务。 但是,假设数据集中只有15%的数据被标记,并且标记的样本仅属于一类,即训 阅读全文
posted @ 2020-03-28 19:07 deephub 阅读(1669) 评论(0) 推荐(0) 编辑