会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
58
59
60
61
62
63
64
65
66
···
155
下一页
2024年7月10日
统计学入门:时间序列分析基础知识详解
摘要: 时间序列分析中包含了许多复杂的数学公式,它们往往难以留存于记忆之中。为了更好地掌握这些内容,本文将整理并总结时间序列分析中的一些核心概念,如自协方差、自相关和平稳性等,并通过Python实现和图形化展示这些概念,使其更加直观易懂。希望通过这篇文章帮助大家更清楚地理解时间序列分析的基础框架和关键点。
阅读全文
posted @ 2024-07-10 11:16 deephub
阅读(127)
评论(0)
推荐(0)
2024年7月9日
11个提升Python列表编码效率的高级技巧
摘要: Python中关于列表的一些很酷的技巧 https://avoid.overfit.cn/post/8b536231aae54d899b519b4474adc2cb
阅读全文
posted @ 2024-07-09 10:49 deephub
阅读(22)
评论(0)
推荐(0)
2024年7月8日
LLM推理引擎怎么选?TensorRT vs vLLM vs LMDeploy vs MLC-LLM
摘要: LLM擅长文本生成应用程序,如聊天和代码完成模型,能够高度理解和流畅。但是它们的大尺寸也给推理带来了挑战。有很多个框架和包可以优化LLM推理和服务,所以在本文中我将整理一些常用的推理引擎并进行比较。 https://avoid.overfit.cn/post/33f6420c91e74c0eb8d6
阅读全文
posted @ 2024-07-08 10:49 deephub
阅读(622)
评论(0)
推荐(0)
2024年7月7日
PyTorch中的多进程并行处理
摘要: PyTorch是一个流行的深度学习框架,一般情况下使用单个GPU进行计算时是十分方便的。但是当涉及到处理大规模数据和并行处理时,需要利用多个GPU。这时PyTorch就显得不那么方便,所以这篇文章我们将介绍如何利用torch.multiprocessing模块,在PyTorch中实现高效的多进程处理
阅读全文
posted @ 2024-07-07 10:42 deephub
阅读(173)
评论(0)
推荐(0)
2024年7月6日
2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐
摘要: 本文总结了2024年6月后两周发表的一些最重要的大语言模型论文。这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。 LLM进展与基准 1、 BigCodeBench: Benchmarking Code Generation with Diverse Funct
阅读全文
posted @ 2024-07-06 11:44 deephub
阅读(268)
评论(0)
推荐(0)
2024年7月5日
RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡
摘要: 该论文提出了一个新的框架,用于在强模型和弱模型之间进行查询路由选择。通过学习用户偏好数据,预测强模型获胜的概率,并根据成本阈值来决定使用哪种模型处理查询 。该研究主要应用于大规模语言模型(LLMs)的实际部署中,通过智能路由在保证响应质量的前提下显著降低成本。 通过创新的路由框架和算法,有效地在强模
阅读全文
posted @ 2024-07-05 10:54 deephub
阅读(272)
评论(0)
推荐(0)
2024年7月4日
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
摘要: 在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。 字符串相似度 当我们有两个数字
阅读全文
posted @ 2024-07-04 11:25 deephub
阅读(113)
评论(0)
推荐(0)
2024年7月3日
使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型
摘要: Encoder-decoder 模型在序列到序列的自然语言处理任务(如语言翻译等)中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务,可以使用 encoder-decoder 模型来处理。本文提供了一个用于解决 Kaggle 时间序列预测任务的 encoder-decode
阅读全文
posted @ 2024-07-03 14:44 deephub
阅读(114)
评论(0)
推荐(0)
2024年7月2日
图神经网络版本的Kolmogorov Arnold(KAN)代码实现和效果对比
摘要: Kolmogorov Arnold Networks (KAN)最近作为MLP的替代而流行起来,KANs使用Kolmogorov-Arnold表示定理的属性,该定理允许神经网络的激活函数在边缘上执行,这使得激活函数“可学习”并改进它们。 目前我们看到有很多使用KAN替代MLP的实验,但是目前来说对于
阅读全文
posted @ 2024-07-02 11:38 deephub
阅读(245)
评论(0)
推荐(0)
2024年7月1日
DeepMind的新论文,长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?
摘要: 长上下文大型语言模型(LCLLMs)确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为,LCLLMs不需要像RAG这样的外部工具,这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度,并且后来的研究表明,这些模型并没有真正利用长上下文。还有人声
阅读全文
posted @ 2024-07-01 10:48 deephub
阅读(65)
评论(0)
推荐(0)
上一页
1
···
58
59
60
61
62
63
64
65
66
···
155
下一页
公告