2023 年 6月随笔档案 - deephub

MidJourney v5.2 、Stable Diffusion XL 0.9 出图对比

摘要：最近两个最流行的AI图像生成器，Midjourney和Stable Diffusion，都发布了重大更新。Midjourney v5.2引入了许多新功能，包括“缩小”功能、“/缩短”命令、改进的图像质量等。 Stable Diffusion XL (SDXL) 0.9则专注于改善图像质量和构图。新模阅读全文

posted @ 2023-06-30 09:47 deephub 阅读(75) 评论(0) 推荐(0) 编辑

LLM-Client一个轻量级的LLM集成工具

摘要：大型语言模型(llm)已经彻底改变了我们与文本交互的方式，OpenAI、Google、AI21、HuggingfaceHub、Anthropic和众多开源模型提供了不同的功能和优势。但是每个模型都有其独特的体系结构、api和兼容性需求，集成这些模型是一项耗时且具有挑战性的任务。所以这时候LangC 阅读全文

posted @ 2023-06-29 09:11 deephub 阅读(106) 评论(0) 推荐(0) 编辑

用于语义图像分割的弱监督和半监督学习：弱监督期望最大化方法

摘要：这时一篇2015年的论文，但是他却是最早提出在语义分割中使用弱监督和半监督的方法，SAM的火爆证明了弱监督和半监督的学习方法也可以用在分割上。这篇论文只有图像级标签或边界框标签作为弱/半监督学习的输入。使用期望最大化(EM)方法，用于弱/半监督下的语义分割模型训练。背景知识 1、符号定义 X是图阅读全文

posted @ 2023-06-28 10:37 deephub 阅读(50) 评论(0) 推荐(0) 编辑

10个图像处理的Python库

摘要：在这篇文章中，我们将整理计算机视觉项目中常用的Python库，如果你想进入计算机视觉领域，可以先了解下本文介绍的库，这会对你的工作很有帮助。 1、PIL/Pillow Pillow是一个通用且用户友好的Python库，提供了丰富的函数集和对各种图像格式的支持，使其成为开发人员在其项目中处理图像的必要阅读全文

posted @ 2023-06-27 10:37 deephub 阅读(88) 评论(0) 推荐(0) 编辑

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

摘要：在过去的几个月里，大型语言模型(llm)获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm)是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使用广泛的数据集进行训练，这些数据集包括书籍、文章、阅读全文

posted @ 2023-06-26 10:16 deephub 阅读(1062) 评论(0) 推荐(0) 编辑

MaskFormer：将语义分割和实例分割作为同一任务进行训练

摘要：目标检测和实例分割是计算机视觉的基本任务，在从自动驾驶到医学成像的无数应用中发挥着关键作用。目标检测的传统方法中通常利用边界框技术进行对象定位，然后利用逐像素分类为这些本地化实例分配类。但是当处理同一类的重叠对象时，或者在每个图像的对象数量不同的情况下，这些方法通常会出现问题。诸如Faster R 阅读全文

posted @ 2023-06-25 09:50 deephub 阅读(143) 评论(0) 推荐(0) 编辑

轻量级的深度学习框架Tinygrad

摘要：Tinygrad是一个轻量级的深度学习库，它提供了一种简化和直观的方法来理解和实现神经网络。在本文中，我们将探讨Tinygrad及其主要功能，以及它如何成为那些开始深度学习之旅的人的有价值的工具。 https://avoid.overfit.cn/post/33edc61f5a414cefa4431 阅读全文

posted @ 2023-06-23 10:05 deephub 阅读(47) 评论(0) 推荐(0) 编辑

PromptBench:大型语言模型的对抗性基准测试

摘要：PromptBench是微软研究人员设计的一个用于测量大型语言模型(llm)对对抗性提示鲁棒性的基准测试。这个的工具是理解LLM的重要一步，随着这些模型在各种应用中越来越普遍，这个主题也变得越来越重要。研究及其方法论 PromptBench采用多种对抗性文本攻击，研究人员生成了4000多个对抗性提阅读全文

posted @ 2023-06-22 16:56 deephub 阅读(47) 评论(0) 推荐(0) 编辑

Video-LLaMa:利用多模态增强对视频内容理解

摘要：在数字时代，视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务，不仅需要视觉和听觉信号的整合，还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的视觉和听觉内容。论文设计了两个分支，即视觉语阅读全文

posted @ 2023-06-21 09:41 deephub 阅读(135) 评论(0) 推荐(0) 编辑

图解transformer中的自注意力机制

摘要：本文将将介绍注意力的概念从何而来，它是如何工作的以及它的简单的实现。注意力机制在整个注意力过程中，模型会学习了三个权重:查询、键和值。查询、键和值的思想来源于信息检索系统。所以我们先理解数据库查询的思想。假设有一个数据库，里面有所有一些作家和他们的书籍信息。现在我想读一些Rabindranat 阅读全文

posted @ 2023-06-20 09:43 deephub 阅读(141) 评论(0) 推荐(0) 编辑

使用PyMC进行时间序列分层建模

摘要：在统计建模领域，理解总体趋势的同时解释群体差异的一个强大方法是分层(或多层)建模。这种方法允许参数随组而变化，并捕获组内和组间的变化。在时间序列数据中，这些特定于组的参数可以表示不同组随时间的不同模式。今天，我们将深入探讨如何使用PyMC(用于概率编程的Python库)构建分层时间序列模型。让我阅读全文

posted @ 2023-06-19 09:07 deephub 阅读(55) 评论(0) 推荐(0) 编辑

6月人工智能论文推荐

摘要：Prompt Space Optimizing Few-shot Reasoning Success with Large Language Models https://arxiv.org/abs/2306.03799 Prompt engineering 是通过提供明确和具体的指令来增强大型语言阅读全文

posted @ 2023-06-18 09:29 deephub 阅读(17) 评论(0) 推荐(0) 编辑

开源大型语言模型(llm)总结

摘要：大型语言模型（LLM）是人工智能领域中的一个重要研究方向，在ChatGPT之后，它经历了快速的发展。这些发展主要涉及以下几个方面：模型规模的增长：LLM的规模越来越大，参数数量显著增加。这种扩展使得模型能够处理更复杂、更长的输入序列，并生成更准确、更具连贯性的输出。同时，更大规模的模型还能够涵盖更阅读全文

posted @ 2023-06-17 11:56 deephub 阅读(357) 评论(0) 推荐(0) 编辑

时间序列异常检测：统计和机器学习方法介绍

摘要：理解时间序列数据在深入研究异常检测技术之前，先简单介绍时间序列数据的特征。时间序列数据通常具有以下属性: 趋势:数据值随时间的长期增加或减少。季节性:以固定间隔重复的模式或循环。自相关:当前观测值与先前观测值之间的相关性。噪声:数据中的随机波动或不规则。让我们可视化下载的时间序列数据 # 阅读全文

posted @ 2023-06-16 09:34 deephub 阅读(90) 评论(0) 推荐(0) 编辑

XGBoost超参数调优指南

摘要：本文将详细解释XGBoost中十个最常用超参数的介绍，功能和值范围，及如何使用Optuna进行超参数调优。对于XGBoost来说，默认的超参数是可以正常运行的，但是如果你想获得最佳的效果，那么就需要自行调整一些超参数来匹配你的数据，以下参数对于XGBoost非常重要: eta num_boost_ 阅读全文

posted @ 2023-06-15 09:11 deephub 阅读(127) 评论(0) 推荐(0) 编辑

预训练、微调和上下文学习

摘要：最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法，了解它们之间的差异，并探讨它们如何有助于语言模型的学习过程。完整文章： https://avoid.overfit.cn/post/6a45189633a9496 阅读全文

posted @ 2023-06-14 10:05 deephub 阅读(23) 评论(0) 推荐(0) 编辑

量子机器学习Variational Quantum Classifier (VQC)简介

摘要：变分量子分类器（Variational Quantum Classifier，简称VQC）是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族，旨在利用量子计算机的计算能力，潜在地提升经典机器学习方法的性能。 VQC的基本思想是使用一个量子电路，也称为变分量子电路，将输入数据阅读全文

posted @ 2023-06-13 09:41 deephub 阅读(169) 评论(0) 推荐(0) 编辑

Segment-Anything的一些相关论文总结

摘要：1、 Segment Anything Model (SAM) Enhanced Pseudo Labels for Weakly Supervised Semantic Segmentation https://avoid.overfit.cn/post/92f50aa2951d4dd89cfc4 阅读全文

posted @ 2023-06-12 10:14 deephub 阅读(52) 评论(0) 推荐(0) 编辑

时间序列预测的20个基本概念总结

摘要：1、时间序列时间序列是一组按时间顺序排列的数据点比如：每小时的气压每年的医院急诊按分钟计算的股票价格 2、时间序列的组成部分完整文章： https://avoid.overfit.cn/post/7bc21f124d284b47becbeca6dc5c07c7 阅读全文

posted @ 2023-06-11 10:56 deephub 阅读(32) 评论(0) 推荐(0) 编辑

使用NLPAUG 进行文本数据的扩充增强

摘要：在机器学习中，训练数据集的质量在很大程度上决定了模型的有效性。我们往往没有足够的多样化数据，这影响了模型的准确性。这时数据增强技术就派上了用场。数据增强可以通过添加对现有数据进行略微修改的副本或从现有数据中新创建的合成数据来增加数据量。这种数据扩充的方式在CV中十分常见，因为对于图像来说可以使用很阅读全文

posted @ 2023-06-10 09:54 deephub 阅读(60) 评论(0) 推荐(0) 编辑

谷歌发布一个免费的生成式人工智能课程

摘要：在过去几周，我们看到的都是AI将如何改变生活，无论是ChatGPT的文本生成，还是SD，Midjourney 的图像生成，这些AI的特点就是都是生成式的AI。而几天前，谷歌推出了一个生成式人工智能学习课程，课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。除了课程外，还有一套实验室和完成阅读全文

posted @ 2023-06-09 09:56 deephub 阅读(20) 评论(0) 推荐(0) 编辑

CAM, Grad-CAM, Grad-CAM++可视化CNN方式的代码实现和对比

摘要：当使用神经网络时，我们可以通过它的准确性来评估模型的性能，但是当涉及到计算机视觉问题时，不仅要有最好的准确性，还要有可解释性和对哪些特征/数据点有助于做出决策的理解。模型专注于正确的特征比模型的准确性更重要。理解CNN的方法主要有类激活图(Class Activation Maps, CAM)、梯阅读全文

posted @ 2023-06-08 10:09 deephub 阅读(30) 评论(0) 推荐(0) 编辑

JupyterLab 4.0 发布了

摘要：JupyterLab 是 Jupyter Notebook 的下一代版本，它提供了更强大的功能和更灵活的用户界面，6月6日，官方发布了JupyterLab 4.0的说明，并且说该版本是下一个主要的版本。 JupyterLab的主要改进是: 用户界面：Jupyter Notebook 使用单个文档界面阅读全文

posted @ 2023-06-07 10:08 deephub 阅读(29) 评论(0) 推荐(0) 编辑

使用Optuna进行PyTorch模型的超参数调优

摘要：Optuna是一个开源的超参数优化框架，Optuna与框架无关，可以在任何机器学习或深度学习框架中使用它。本文将以表格数据为例，使用Optuna对PyTorch模型进行超参数调优。 Optuna可以使用python pip安装，如pip install Optuna。也可以使用conda insta 阅读全文

posted @ 2023-06-06 10:19 deephub 阅读(120) 评论(0) 推荐(0) 编辑

Python中的Time和DateTime

摘要：Python在处理与时间相关的操作时有两个重要模块：time和datetime。在本文中，我们介绍这两个模块并为每个场景提供带有代码和输出的说明性示例。 time 模块主要用于处理时间相关的操作，例如获取当前时间、时间的计算和格式化等。它提供了一些函数和常量，包括： time()：返回当前的时间戳（阅读全文

posted @ 2023-06-05 09:08 deephub 阅读(17) 评论(0) 推荐(0) 编辑

设置和使用DragGAN：搭建非官方的演示版

摘要：DragGAN的官方版还没有发布，但是已经有非官方版的实现了，我们看看如何使用。DragGAN不仅让GAN重新回到竞争轨道上，而且为GAN图像处理开辟了新的可能性。正式版本将于本月发布。但是现在已经可以在一个非官方的演示中试用这个新工具了完整文章 https://avoid.overfit.cn/ 阅读全文

posted @ 2023-06-04 09:52 deephub 阅读(81) 评论(0) 推荐(0) 编辑

七篇深入理解机器学习和深度学习的读物推荐

摘要：在这篇文章中将介绍7篇机器学习和深度学习的论文或者图书出版物，这些内容都论文极大地影响了我对该领域的理解，如果你想深入了解机器学习的内容，哪么推荐阅读。 Attention Is All You Need 在自然语言处理和序列建模领域，Vaswani等人的一篇论文《Attention Is All 阅读全文

posted @ 2023-06-03 09:26 deephub 阅读(9) 评论(0) 推荐(0) 编辑

QLoRa：在消费级GPU上微调大型语言模型

摘要：大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如，650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器，花费的开销也不是所有人都能够承担的。而QLoRa (Dettmers et al.， 2023)，只需使用一个A100 阅读全文

posted @ 2023-06-02 09:25 deephub 阅读(136) 评论(0) 推荐(0) 编辑

这8个NumPy函数可以解决90%的常见问题

摘要：NumPy是一个用于科学计算和数据分析的Python库，也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。NumPy提供了一个强大的多维数组对象，以及广泛的数学函数，可以对大型数据集进行有效的操作。这里的“大”是指数百万行。 Numpy快速而高效的原因是底层的C代码，这比使用阅读全文

posted @ 2023-06-01 09:10 deephub 阅读(18) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

06 2023 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论