deephub

2023年8月30日

摘要：本文将介绍如何使用卷积操作实现因子分解机器。卷积网络因其局部性和权值共享的归纳偏差而在计算机视觉领域获得了广泛的成功和应用。卷积网络可以用来捕获形状的堆叠分类特征(B, num_cat, embedding_size)和形状的堆叠特征(B, num_features, embedding_size) 阅读全文

posted @ 2023-08-30 10:41 deephub 阅读(43) 评论(0) 推荐(0)

2023年8月29日

Fooocus：一个简单且功能强大的Stable Diffusion webUI

摘要： Stable Diffusion是一个强大的图像生成AI模型，但它通常需要大量调整和提示工程。Fooocus的目标是改变这种状况。 Fooocus的创始人Lvmin Zhang（也是 ControlNet论文的作者）将这个项目描述为对“Stable Diffusion”和“ Midjourney”设阅读全文

posted @ 2023-08-29 09:31 deephub 阅读(345) 评论(0) 推荐(0)

2023年8月28日

Dynamic ReLU：根据输入动态确定的ReLU

摘要：这是我最近才看到的一篇论文，它提出了动态ReLU (Dynamic ReLU, DY-ReLU)，可以将全局上下文编码为超函数，并相应地调整分段线性激活函数。与传统的ReLU相比，DY-ReLU的额外计算成本可以忽略不计，但表示能力明显增强，并且实现简单，所以可以非常简单的对我们现有的模型进行修改。阅读全文

posted @ 2023-08-28 09:19 deephub 阅读(50) 评论(0) 推荐(0)

2023年8月26日

理解图傅里叶变换和图卷积

摘要：图神经网络（GNN）代表了一类强大的深度神经网络架构。在一个日益互联的世界里，因为信息的联通性，大部分的信息可以被建模为图。例如，化合物中的原子是节点，它们之间的键是边。图神经网络的美妙之处在于它们能够在不牺牲重要细节的情况下直接对图结构数据进行操作。这一点在处理复杂的数据集（如化合物）时尤为明显阅读全文

posted @ 2023-08-26 10:09 deephub 阅读(54) 评论(0) 推荐(0)

2023年8月25日

微调llama2模型教程：创建自己的Python代码生成器

摘要：本文将演示如何使用PEFT、QLoRa和Huggingface对新的lama-2进行微调，生成自己的代码生成器。所以本文将重点展示如何定制自己的llama2，进行快速训练，以完成特定任务。 https://avoid.overfit.cn/post/9794c9eef1df4e55adf514b3d 阅读全文

posted @ 2023-08-25 10:51 deephub 阅读(175) 评论(0) 推荐(0)

2023年8月24日

StableVideo：使用Stable Diffusion生成连续无闪烁的视频

摘要：使用Stable Diffusion生成视频一直是人们的研究目标，但是我们遇到的最大问题是视频帧和帧之间的闪烁，但是最新的论文则着力解决这个问题。本文总结了Chai等人的论文《StableVideo: Text-driven consistency -aware Diffusion Video E 阅读全文

posted @ 2023-08-24 11:23 deephub 阅读(235) 评论(0) 推荐(0)

2023年8月23日

Pandas字符串操作的各种方法速度测试

摘要：由于LLM的发展，很多的数据集都是以DF的形式发布的，所以通过Pandas操作字符串的要求变得越来越高了，所以本文将对字符串操作方法进行基准测试，看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制，它们的行为就会很奇怪。我们用Faker创建了一个100,000行阅读全文

posted @ 2023-08-23 10:01 deephub 阅读(36) 评论(0) 推荐(0)

2023年8月22日

使用Pytorch和OpenCV实现视频人脸替换

摘要： DeepFaceLab”项目已经发布了很长时间了，作为研究的目的，本文将介绍他的原理，并使用Pytorch和OpenCV创建一个简化版本。本文将分成3个部分，第一部分从两个视频中提取人脸并构建标准人脸数据集。第二部分使用数据集与神经网络一起学习如何在潜在空间中表示人脸，并从该表示中重建人脸图像。最阅读全文

posted @ 2023-08-22 10:00 deephub 阅读(177) 评论(0) 推荐(0)

2023年8月21日

FlashAttention算法详解

摘要：这篇文章的目的是详细的解释Flash Attention，为什么要解释FlashAttention呢？因为FlashAttention 是一种重新排序注意力计算的算法，它无需任何近似即可加速注意力计算并减少内存占用。所以作为目前LLM的模型加速它是一个非常好的解决方案，本文介绍经典的V1版本，最新的阅读全文

posted @ 2023-08-21 10:29 deephub 阅读(937) 评论(1) 推荐(0)

2023年8月20日

知识图谱入门：使用Python创建知识图，分析并训练嵌入模型

摘要：本文中我们将解释如何构建KG、分析它以及创建嵌入模型。构建知识图谱加载我们的数据。在本文中我们将从头创建一个简单的KG。 https://avoid.overfit.cn/post/7ec9eb11e66c4b44bd2270b8ad66d80d 阅读全文

posted @ 2023-08-20 09:46 deephub 阅读(266) 评论(0) 推荐(0)

overfit深度学习

公告