上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 95 下一页
摘要: Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1,训练所用的 token 翻了一倍,已经达到了 2 万亿,对于使用大模型最重要的上下文长度限制,Llama 2 也翻了一倍。 在本文,我们将紧跟趋势介绍如何在本地CPU推理上运行量化版本的开源L 阅读全文
posted @ 2023-07-20 09:45 deephub 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 近年来强化学习(RL)在算法交易领域受到了极大的关注。强化学习算法从经验中学习并基于奖励优化行动使其非常适合交易机器人。在这篇文章,我们将简单介绍如何使用Gym Anytrading环境和GME (GameStop Corp.)交易数据集构建一个基于强化学习的交易机器人。 强化学习是机器学习的一个子 阅读全文
posted @ 2023-07-19 09:55 deephub 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 分析和处理季节性是时间序列分析中的一个关键工作,在本文中我们将描述三种类型的季节性以及常见的8种建模方法。 什么是季节性? 季节性是构成时间序列的关键因素之一,是指在一段时间内以相似强度重复的系统运动。 季节变化可以由各种因素引起,例如天气、日历或经济条件。各种应用程序中都有这样的例子。由于假期和旅 阅读全文
posted @ 2023-07-18 09:59 deephub 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA,我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程,本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face)进行评估。此外还将介绍如何使用grado应用程序部署和测试模型。 阅读全文
posted @ 2023-07-17 10:11 deephub 阅读(87) 评论(0) 推荐(0) 编辑
摘要: CatBoost是顶尖的机器学习模型之一。凭借其梯度增强技术以及内置函数,可以在不做太多工作的情况下生成一些非常好的模型。SHAP (SHapley Additive exPlanation)是旨在解释具有独特视觉效果和性能价值的机器学习模型的输出。CatBoost和SHAP结合在一起构成了一个强大 阅读全文
posted @ 2023-07-16 09:58 deephub 阅读(155) 评论(0) 推荐(0) 编辑
摘要: ChatGPT和Midjournal使得生成式人工智能的应用程序激增。当涉及到生成式AI时,"prompt"通常指的是作为输入给模型的初始提示或指示。它是一个短语、问题、句子或段落,用来引导模型生成相关的响应或文本。 在使用生成式AI模型时,提供一个清晰、具体的prompt非常重要,因为它会直接影响 阅读全文
posted @ 2023-07-14 09:17 deephub 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 注意力机制的掩码允许我们发送不同长度的批次数据一次性的发送到transformer中。在代码中是通过将所有序列填充到相同的长度,然后使用“attention_mask”张量来识别哪些令牌是填充的来做到这一点,本文将详细介绍这个掩码的原理和机制。 我们先介绍下如果不使用掩码,是如何运行的。这里用GPT 阅读全文
posted @ 2023-07-13 10:08 deephub 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 在Pandas 2.0发布以后,我们发布过一些评测的文章,这次我们看看,除了Pandas以外,常用的两个都是为了大数据处理的并行数据框架的对比测试。 本文我们使用两个类似的脚本来执行提取、转换和加载(ETL)过程。 测试内容 这两个脚本主要功能包括: 从两个parquet 文件中提取数据,对于小型数 阅读全文
posted @ 2023-07-08 10:29 deephub 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 本文提供了使用Streamlit和OpenAI创建的视频摘要应用程序的概述。该程序为视频的每个片段创建简洁的摘要,并总结视频的完整内容。 要运行应用程序,需要安装以下依赖项: Python(3.7或更高版本) Streamlit OpenAI API密钥 llama_index youtube_tr 阅读全文
posted @ 2023-07-07 09:48 deephub 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 矢量数据库是为实现高维矢量数据的高效存储、检索和相似性搜索而设计的。使用一种称为嵌入的过程,将向量数据表示为一个连续的、有意义的高维向量。 本文将研究存储/检索向量数据和执行相似性搜索的实用方法,在我们深入研究之前,首先先介绍矢量数据库的两个关键功能: https://avoid.overfit.c 阅读全文
posted @ 2023-07-06 10:43 deephub 阅读(141) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 95 下一页