deephub

2024年4月26日

摘要：时间序列是最流行的数据类型之一。视频，图像，像素，信号，任何有时间成分的东西都可以转化为时间序列。在本文中将在分析时间序列时使用的常见的处理方法。这些方法可以帮助你获得有关数据本身的见解，为建模做好准备并且可以得出一些初步结论。我们将分析一个气象时间序列。利用逐时ERA5 Land[1]研究20 阅读全文

posted @ 2024-04-26 10:15 deephub 阅读(106) 评论(0) 推荐(0)

2024年4月25日

开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate

摘要：语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项艰巨的任务。本文为你提供四个重要的开源向量数据库之间的全面比较，希望你能够选择出最符合自己特定需求的数据库。什么是向量数据库? 向量数据库是一种将数据存储为高维向量的阅读全文

posted @ 2024-04-25 11:22 deephub 阅读(532) 评论(0) 推荐(0)

2024年4月24日

微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

摘要： Phi-3系列 Phi-3是一系列先进的语言模型，专注于在保持足够紧凑以便在移动设备上部署的同时，实现高性能。Phi-3系列包括不同大小的模型： Phi-3-mini（38亿参数） - 该模型在3.3万亿个令牌上进行训练，设计得足够小，可以在现代智能手机上运行。尽管体积紧凑，它的性能却可与更大的模型阅读全文

posted @ 2024-04-24 12:13 deephub 阅读(117) 评论(0) 推荐(0)

2024年4月23日

Barnes-Hut t-SNE:大规模数据的高效降维算法

摘要：在数据科学和分析中，理解高维数据集中的底层模式是至关重要的。t-SNE已成为高维数据可视化的有力工具。它通过将数据投射到一个较低维度的空间，提供了对数据结构的详细洞察。但是随着数据集的增长，标准的t-SNE算法在计算有些困难，所以发展出了Barnes-Hut t-SNE这个改进算法，它提供了一个有效阅读全文

posted @ 2024-04-23 10:52 deephub 阅读(112) 评论(0) 推荐(0)

2024年4月22日

5种搭建LLM服务的方法和代码示例

摘要：在不断发展的大型语言模型（LLMs）领域中，用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中，我们将总结5种搭建开源大语言模型服务的方法，每种都附带详细的操作步骤，以及各自的优缺点。 https://avoid.overfit.cn/post/efad539d09694749 阅读全文

posted @ 2024-04-22 11:02 deephub 阅读(69) 评论(0) 推荐(0)

2024年4月21日

使用ORPO微调Llama 3

摘要： ORPO是一种新的微调技术，它将传统的监督微调和偏好对齐阶段结合到一个过程中。减少了训练所需的计算资源和时间。论文的实证结果表明，ORPO在各种模型大小和基准上都优于其他对齐方法，所以这次我们就来使用最新的Llama 3来测试下ORPO的效果。我们将使用ORPO和TRL库对新的Llama 3 8b 阅读全文

posted @ 2024-04-21 10:04 deephub 阅读(182) 评论(0) 推荐(0)

2024年4月20日

掌握时间序列特征工程：常用特征总结与 Feature-engine 的应用

摘要：时间序列数据的特征工程是一种技术，用于从时间序列数据中提取信息或构造特征，这些特征可用于提高机器学习模型的性能。以下是一些常见的时间序列特征工程技术：滚动统计量：计算时间窗口内的统计量，如平均值、中位数、标准偏差、最小值和最大值。这些统计量可以捕捉到时间序列在不同时间段的行为变化。滞后特征：创建阅读全文

posted @ 2024-04-20 10:46 deephub 阅读(621) 评论(0) 推荐(0)

2024年4月19日

RAG 2.0架构详解：构建端到端检索增强生成系统

摘要：关于检索增强生成（RAG）的文章已经有很多了，如果我们能创建出可训练的检索器，或者说整个RAG可以像微调大型语言模型（LLM）那样定制化的话，那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调，就像一个缝合怪一样，虽然能够工作但各部分并不和谐，所以我们这里介绍RAG 2. 阅读全文

posted @ 2024-04-19 11:55 deephub 阅读(313) 评论(0) 推荐(0)

2024年4月17日

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

摘要：这篇文章将演示如何可视化PyTorch激活层。可视化激活，即模型内各层的输出，对于理解深度神经网络如何处理视觉信息至关重要，这有助于诊断模型行为并激发改进。我们先安装必要的库: https://avoid.overfit.cn/post/c63b9b1130fe425ea5b7d0bedf209b 阅读全文

posted @ 2024-04-17 09:51 deephub 阅读(39) 评论(0) 推荐(0)

2024年4月16日

ORPO偏好优化：性能和DPO一样好并且更简单的对齐方法

摘要：现在有许多方法可以使大型语言模型（LLM）与人类偏好保持一致。以人类反馈为基础的强化学习（RLHF）是最早的方法之一，并促成了ChatGPT的诞生，但RLHF的成本非常高。与RLHF相比，DPO、IPO和KTO的成本明显更低，因为它们不需要奖励模型。虽然DPO和IPO的成本较低，但它们仍需训练两个阅读全文

posted @ 2024-04-16 10:04 deephub 阅读(267) 评论(0) 推荐(0)

overfit深度学习

公告