2023 年 4月随笔档案 - deephub

使用Dino+SAM+Stable diffusion 自动进行图片的修改

摘要：SAM 是Mata发布的“Segment Anything Model”可以准确识别和提取图像中的对象。它可以分割任何的图片，但是如果需要分割特定的物体，则需要需要点、框的特定提示才能准确分割图像。所以本文将介绍一种称为 Grounding Dino 的技术来自动生成 SAM 进行分割所需的框。阅读全文

posted @ 2023-04-30 10:28 deephub 阅读(207) 评论(0) 推荐(0) 编辑

将时间序列转换为分类问题

摘要：本文将以股票交易作为示例。我们用 AI 模型预测股票第二天是涨还是跌。在此背景下，比较了分类算法 XGBoost、随机森林和逻辑分类器。文章的另外一个重点是数据准备。我们必须如何转换数据以便模型可以处理它。在本文中，我们将遵循 CRISP-DM 流程模型，以便我们采用结构化方法来解决业务案例。CR 阅读全文

posted @ 2023-04-29 13:12 deephub 阅读(29) 评论(0) 推荐(0) 编辑

从零开始实现VAE和CVAE

摘要：扩散模型可以看作是一个层次很深的VAE(变分自编码器)，前向（forward，或者译为正向）的过程，通过在多个尺度上添加噪声来逐步扰乱数据分布；然后是反向的过程，去学习如何恢复数据结构，上述的破坏和恢复过程分别对应于VAE中的编码和解码过程。所以VAE是一个重要的概念需要掌握，本文将用python从阅读全文

posted @ 2023-04-28 16:04 deephub 阅读(130) 评论(0) 推荐(0) 编辑

ChatGPT的提示的一些高级知识

摘要：作为一个大型语言模型(LLM)接口，ChatGPT有令人印象深刻的潜力，但是真正能否用好取决与我们的提示（Prompt ），一个好的提示可以让ChatGPT晋升到一个更好的层次。在这篇文章中，我们将介绍关于提示的一些高级知识。无论是将ChatGPT用于客户服务、内容创建，还是仅仅为了好玩，本文都将阅读全文

posted @ 2023-04-27 10:25 deephub 阅读(36) 评论(0) 推荐(0) 编辑

AutoGPT也有Web UI了

摘要：AutoGPT能够在你的电脑上做任何你想做的事情，并且我们在前面的文章中也介绍了其他的一些类似的应用。但是AutoGPT最大的一个问题是只能通过命令行界面(CLI)运行，这样就算是专业的技术人员使用起来也很麻烦，想想Stable Diffusion，他的Web UI就非常好用。但是现在AutoG 阅读全文

posted @ 2023-04-26 09:54 deephub 阅读(89) 评论(0) 推荐(0) 编辑

使用PyTorch和Flower 进行联邦学习

摘要：本文将介绍如何使用 Flower 构建现有机器学习工作的联邦学习版本。我们将使用 PyTorch 在 CIFAR-10 数据集上训练卷积神经网络，然后将展示如何修改训练代码以联邦的方式运行训练。完整文章： https://avoid.overfit.cn/post/8d05a12c208c4f49 阅读全文

posted @ 2023-04-25 10:25 deephub 阅读(110) 评论(0) 推荐(0) 编辑

参数与非参数检验：理解差异并正确使用

摘要：数据科学是一个快速发展的领域，它在很大程度上依赖于统计技术来分析和理解复杂的数据集。这个过程的一个关键部分是假设检验，它有助于确定从样本中获得的结果是否可以推广到总体。在这篇文章中，我们将探讨参数与非参数检验之间的区别，提供示例以更好地理解它们的用例，并总结关键要点。理解假设检验假设检验是一种阅读全文

posted @ 2023-04-24 10:14 deephub 阅读(100) 评论(0) 推荐(0) 编辑

论文推荐：基于联合损失函数的多任务肿瘤分割

摘要：以FFANet为主干，加入分类的分支，将模型扩展为多任务图像分割框架，设计了用于分类和分割的联合损失函数。 FFANet+MTL 完整文章： https://avoid.overfit.cn/post/6a605da56978443bb548e8f342cbda37 阅读全文

posted @ 2023-04-23 10:21 deephub 阅读(21) 评论(0) 推荐(0) 编辑

KL散度和交叉熵的对比介绍

摘要：KL散度（Kullback-Leibler Divergence）和交叉熵（Cross Entropy）是在机器学习中广泛使用的概念。这两者都用于比较两个概率分布之间的相似性，但在一些方面，它们也有所不同。本文将对KL散度和交叉熵的详细解释和比较。完整文章： https://avoid.overf 阅读全文

posted @ 2023-04-22 10:24 deephub 阅读(50) 评论(0) 推荐(0) 编辑

AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL：各种基于GPT-4自治系统总结

摘要：ChatGPT和LLM技术的出现使得这些最先进的语言模型席卷了世界，不仅是AI的开发人员，爱好者和一些组织也在研究探索集成和构建这些模型的创新方法。各种平台如雨后春笋般涌现，集成并促进新应用程序的开发。 AutoGPT的火爆让我们看到越来越多的自主任务和代理利用了GPT-4的API。这些发展不仅增强阅读全文

posted @ 2023-04-21 10:02 deephub 阅读(471) 评论(0) 推荐(0) 编辑

从Pandas快速切换到Polars ：数据的ETL和查询

摘要：对于我们日常的数据清理、预处理和分析方面的大多数任务，Pandas已经绰绰有余。但是当数据量变得非常大时，它的性能开始下降。我们以前的两篇文章来测试Pandas 1.5.3、polar和Pandas 2.0.0之间的性能了，Polars 正好可以解决大数据量是处理的问题，所以本文将介绍如何将日常的阅读全文

posted @ 2023-04-20 10:05 deephub 阅读(62) 评论(0) 推荐(0) 编辑

Grad-CAM的详细介绍和Pytorch代码实现

摘要：Grad-CAM (Gradient-weighted Class Activation Mapping) 是一种可视化深度神经网络中哪些部分对于预测结果贡献最大的技术。它能够定位到特定的图像区域，从而使得神经网络的决策过程更加可解释和可视化。 Grad-CAM 的基本思想是，在神经网络中，最后一个阅读全文

posted @ 2023-04-19 11:11 deephub 阅读(480) 评论(0) 推荐(0) 编辑

生成式模型与辨别式模型

摘要：分类模型可以分为两大类:生成式模型与辨别式模型。本文解释了这两种模型类型之间的区别，并讨论了每种方法的优缺点。完整文章： https://avoid.overfit.cn/post/9dc20966c4824be18ef7e9fd1acabe51 阅读全文

posted @ 2023-04-18 10:00 deephub 阅读(66) 评论(0) 推荐(0) 编辑

TensorFlow 决策森林详细介绍和使用说明

摘要：使用TensorFlow训练、调优、评估、解释和部署基于树的模型的完整教程两年前TensorFlow (TF)团队开源了一个库来训练基于树的模型，称为TensorFlow决策森林(TFDF)。经过了2年的测试，他们在上个月终于宣布这个包已经准备好发布了，也就是说我们可以真正的开始使用了。所以这篇文阅读全文

posted @ 2023-04-17 10:39 deephub 阅读(40) 评论(0) 推荐(0) 编辑

时间序列的平稳性

摘要：你可以用两种方法来测试时间序列的平稳性: 直观的方法：肉眼评估统计方法：单位根检验我们将创建几个示例，使用Hyndman 和 Athanasopoulos的时间序列分析教材《Forecasting: principles and practice》中提到方法解释平稳性的视觉评估，并扩展它们的用法阅读全文

posted @ 2023-04-16 09:53 deephub 阅读(61) 评论(0) 推荐(0) 编辑

用CTGAN生成真实世界的表格数据

摘要：随着CLIP和稳定模型的快速发展，图像生成领域中GAN已经不常见了，但是在表格数据中GAN还是可以看到它的身影。现实世界的复杂性与许多方面相关(例如，缺失数据、不平衡数据、噪声数据)，但最常见的一个问题是包含异构(或“混合”)数据，即包含数字和分类特征的数据。由于每种特征类型都可能具有自己的内在阅读全文

posted @ 2023-04-15 11:07 deephub 阅读(262) 评论(0) 推荐(0) 编辑

神经网络初学者的激活函数指南

摘要：如果你刚刚开始学习神经网络，激活函数的原理一开始可能很难理解。但是如果你想开发强大的神经网络，理解它们是很重要的。但在我们深入研究激活函数之前，先快速回顾一下神经网络架构的基本元素。如果你已经熟悉神经网络的工作原理，可以直接跳到下一节。完整文章： https://avoid.overfit.cn 阅读全文

posted @ 2023-04-14 11:00 deephub 阅读(24) 评论(0) 推荐(0) 编辑

2023年4月的12篇AI论文推荐

摘要：GPT-4发布仅仅三周后，就已经随处可见了。本月的论文推荐除了GPT-4以外还包括、语言模型的应用、扩散模型、计算机视觉、视频生成、推荐系统和神经辐射场。 1、GPT-4 Technical Report https://arxiv.org/abs/2303.08774 Sébastien Bube 阅读全文

posted @ 2023-04-13 11:30 deephub 阅读(163) 评论(0) 推荐(0) 编辑

Pandas 2.0 vs Polars:速度的全面对比

摘要：前几天的文章，我们已经简单的介绍过Pandas 和Polars的速度对比。刚刚发布的Pandas 2.0速度得到了显著的提升。但是本次测试发现NumPy数组上的一些基本操作仍然更快。并且Polars 0.17.0，也在上周发布，并且也提到了性能的改善，所以我们这里做一个更详细的关于速度方面的评测。阅读全文

posted @ 2023-04-12 10:56 deephub 阅读(143) 评论(0) 推荐(0) 编辑

利用强化学习Q-Learning实现最短路径算法

摘要：如果你是一名计算机专业的学生，有对图论有基本的了解，那么你一定知道一些著名的最优路径解，如Dijkstra算法、Bellman-Ford算法和a*算法(A-Star)等。这些算法都是大佬们经过无数小时的努力才发现的，但是现在已经是人工智能的时代，强化学习算法能够为我们提出和前辈一样好的解决方案吗? 阅读全文

posted @ 2023-04-11 11:01 deephub 阅读(224) 评论(0) 推荐(0) 编辑

可视化CNN和特征图

摘要：卷积神经网络(cnn)是一种神经网络，通常用于图像分类、目标检测和其他计算机视觉任务。CNN的关键组件之一是特征图，它是通过对图像应用卷积滤波器生成的输入图像的表示。完整文章： https://avoid.overfit.cn/post/1132e4f9872a490e95bcbd0477d384 阅读全文

posted @ 2023-04-10 10:50 deephub 阅读(37) 评论(0) 推荐(0) 编辑

论文推荐：DCSAU-Net，更深更紧凑注意力U-Net

摘要：这是一篇23年发布的新论文，论文提出了一种更深、更紧凑的分裂注意力的U-Net，该网络基于主特征守恒和紧凑分裂注意力模块，有效地利用了底层和高层语义信息。 DCSAU-Net 1、架构完整文章： https://avoid.overfit.cn/post/80c002a556cf4397aff76 阅读全文

posted @ 2023-04-09 10:42 deephub 阅读(61) 评论(0) 推荐(0) 编辑

7个最新的时间序列分析库介绍和代码示例

摘要：时间序列分析包括检查随着时间推移收集的数据点，目的是确定可以为未来预测提供信息的模式和趋势。我们已经介绍过很多个时间序列分析库了，但是随着时间推移，新的库和更新也在不断的出现，所以本文将分享8个目前比较常用的，用于处理时间序列问题的Python库。他们是tsfresh, autots, darts, 阅读全文

posted @ 2023-04-08 10:12 deephub 阅读(63) 评论(0) 推荐(0) 编辑

常用的ControlNet以及如何在Stable Diffusion WebUI中使用

摘要：上一次我们已经介绍了如何通过代码的方式使用ControlNet，Stable Diffusion WebUI里面包含了很详细的使用设置，我们可以直接在上面进行操作，所以本文将介绍如何以傻瓜的方式直接使用ControlNet。如果你用过Stable Diffusion，可能已经注意到图像的输出有无限阅读全文

posted @ 2023-04-07 11:29 deephub 阅读(300) 评论(0) 推荐(0) 编辑

Pandas 2.0正式版发布： Pandas 1.5，Polars，Pandas 2.0 速度对比测试

摘要：Pandas 2.0正式版在4月3日已经发布了，以后我们pip install默认安装的就是2.0版了，Polars 是最近比较火的一个DataFrame 库，最近在kaggle上经常使用，所以这里我们将对比下 Pandas 1.5，Polars，Pandas 2.0 。看看在速度上 Pandas 阅读全文

posted @ 2023-04-06 11:13 deephub 阅读(309) 评论(0) 推荐(0) 编辑

使用Python实现Hull Moving Average (HMA)

摘要：赫尔移动平均线（Hull Moving Average，简称HMA）是一种技术指标，于2005年由Alan Hull开发。它是一种移动平均线，利用加权计算来减少滞后并提高准确性。 HMA对价格变动非常敏感，同时最大程度地减少短期波动可能产生的噪音。它通过使用加权计算来强调更近期的价格，同时平滑数据。阅读全文

posted @ 2023-04-05 10:47 deephub 阅读(377) 评论(0) 推荐(0) 编辑

用遗传算法寻找迷宫出路

摘要：遗传算法是一种基于达尔文进化论的搜索启发式算法。该算法模拟了基于种群中最适合个体的自然选择遗传算法需要两个参数，即种群和适应度函数。根据适应度值在群体中选择最适合的个体。最健康的个体通过交叉和突变技术产生后代，创造一个新的、更好的种群。这个过程重复几代，直到得到最好的解决方案。完整文章： htt 阅读全文

posted @ 2023-04-04 10:57 deephub 阅读(28) 评论(0) 推荐(0) 编辑

奇异值分解（SVD）和图像压缩

摘要：在本文中，我将尝试解释 SVD 背后的数学及其几何意义，还有它在数据科学中的最常见的用法，图像压缩。奇异值分解是一种常见的线性代数技术，可以将任意形状的矩阵分解成三个部分的乘积：U、S、V。原矩阵A可以表示为：具体来说，A矩阵中的奇异值就是\Sigma矩阵中的对角线元素，它们是矩阵A的特征值的平阅读全文

posted @ 2023-04-03 10:30 deephub 阅读(80) 评论(0) 推荐(0) 编辑

这个ChatGPT插件可以远程运行代码，还生成图表

摘要：ChatGPT的插件使数据科学成为一种简单、愉快的体验我们做数据分析时一般都是使用这样的流程来进行：运行jupyter notebook、安装库、解决依赖关系和版本控制，数据分析，生成图表。ChatGPT的“Code Interpreter”插件可以帮助我们进行数据分析。完整文章： https: 阅读全文

posted @ 2023-04-02 09:41 deephub 阅读(130) 评论(0) 推荐(0) 编辑

基于凸集上投影（POCS）的聚类算法

摘要：POCS：Projections onto Convex Sets。在数学中，凸集是指其中任意两点间的线段均在该集合内的集合。而投影则是将某个点映射到另一个空间中的某个子空间上的操作。给定一个凸集合和一个点，可以通过找到该点在该凸集合上的投影来进行操作。该投影是离该点最近的凸集内的点，可以通过最小化阅读全文

posted @ 2023-04-01 10:15 deephub 阅读(132) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

04 2023 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论