deephub

2023年11月3日

摘要： JudgeLM: Fine-tuned Large Language Models are Scalable Judges 由于现有基准和指标的限制，在开放式环境中评估大型语言模型(llm)是一项具有挑战性的任务。为了克服这一挑战，本文引入了微调llm作为可扩展“法官”的概念，称为JudgeLM，这阅读全文

posted @ 2023-11-03 09:46 deephub 阅读(48) 评论(0) 推荐(0)

2023年11月2日

数据抽样技术全面概述

摘要：抽样是研究和数据收集中不可或缺的方法，能够从更大数据中获得有意义的见解并做出明智的决定的子集。不同的研究领域采用了不同的抽样技术，每种技术都有其独特的优点和局限性。本文将深入探讨了最常见的抽样技术，包括随机抽样、分层抽样、系统抽样、聚类抽样和便利抽样，并重点介绍了它们的应用和注意事项。为了介绍我们阅读全文

posted @ 2023-11-02 09:30 deephub 阅读(87) 评论(0) 推荐(0)

2023年11月1日

AutoGen完整教程和加载本地LLM示例

摘要： Autogen是一个卓越的人工智能系统，它可以创建多个人工智能代理，这些代理能够协作完成任务，包括自动生成代码，并有效地执行任务。在本文中，我们将深入探讨Autogen，并介绍如何让AutoGen使用本地的LLM AutoGen Autogen能够设置多个人工智能代理，它们协同工作以实现特定目标。阅读全文

posted @ 2023-11-01 09:40 deephub 阅读(713) 评论(0) 推荐(0)

2023年10月31日

使用Llama index构建多代理 RAG

摘要：检索增强生成(RAG)已成为增强大型语言模型(LLM)能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示，RAG为LLM提供了有用的上下文，以产生基于事实的输出。但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题在限制了真实世界的RAG性能。多代理体系结构提阅读全文

posted @ 2023-10-31 09:12 deephub 阅读(99) 评论(0) 推荐(0)

2023年10月30日

使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习

摘要：强化学习(RL)是一种机器学习方法，它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励，因采取行动导致预期结果而受到惩罚。随着时间的推移，代理学会采取行动，使其预期回报最大化。 RL代理通常使用马尔可夫决策过程(MDP)进行训练，马尔可夫决策过程是为顺序决策问题建模的阅读全文

posted @ 2023-10-30 09:25 deephub 阅读(67) 评论(0) 推荐(0)

2023年10月29日

使用FastAPI部署Ultralytics YOLOv5模型

摘要： YOLO是You Only Look Once(你只看一次)的缩写，它具有识别图像中的物体的非凡能力，在日常应用中会经常被使用。所以在本文中，我们将介绍如何使用FastAPI的集成YOLOv5，这样我们可以将YOLOv5做为API对外提供服务。 Python有几个web框架，其中最突出的两个是Fla 阅读全文

posted @ 2023-10-29 09:35 deephub 阅读(153) 评论(0) 推荐(0)

2023年10月28日

Python时间序列分析库介绍：statsmodels、tslearn、tssearch、tsfresh

摘要：时间序列分析在金融和医疗保健等领域至关重要，在这些领域，理解随时间变化的数据模式至关重要。在本文中，我们将介绍四个主要的Python库——statmodels、tslearn、tssearch和tsfresh——每个库都针对时间序列分析的不同方面进行了定制。这些库为从预测到模式识别的任务提供了强大的阅读全文

posted @ 2023-10-28 09:53 deephub 阅读(340) 评论(0) 推荐(0)

2023年10月26日

Table-GPT:让大语言模型理解表格数据

摘要： llm对文本指令非常有用，但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题，LLM更有可能产生不准确的响应。在这篇文章中，我们将介绍微软发表的一篇研究论文，“Table-GPT: Table- tuning GPT for Diverse Table Tasks”，研究人员介绍了T 阅读全文

posted @ 2023-10-26 10:01 deephub 阅读(326) 评论(0) 推荐(0)

2023年10月25日

VeRA: 性能相当，但参数却比LoRA少10倍

摘要： 2022年的LoRA提高了微调效率，它在模型的顶部添加低秩(即小)张量进行微调。模型的参数被冻结。只有添加的张量的参数是可训练的。与标准微调相比，它大大减少了可训练参数的数量。例如，对于Llama 27b, LoRA通常训练400万到5000万个参数，这比标准微调则训练70亿个参数药效的多。还可以阅读全文

posted @ 2023-10-25 09:47 deephub 阅读(62) 评论(0) 推荐(0)

2023年10月24日

LlamaIndex使用指南

摘要： LlamaIndex是一个方便的工具，它充当自定义数据和大型语言模型(llm)(如GPT-4)之间的桥梁，大型语言模型模型功能强大，能够理解类似人类的文本。LlamaIndex都可以轻松地将数据与这些智能机器进行对话。这种桥梁建设使你的数据更易于访问，为更智能的应用程序和工作流铺平了道路。 Llam 阅读全文

posted @ 2023-10-24 10:54 deephub 阅读(822) 评论(0) 推荐(0)

overfit深度学习

公告