会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
75
76
77
78
79
80
81
82
83
···
151
下一页
2023年11月30日
Pandas中选择和过滤数据的终极指南
摘要: Python pandas库提供了几种选择和过滤数据的方法,如loc、iloc、[]括号操作符、query、isin、between等等 本文将介绍使用pandas进行数据选择和过滤的基本技术和函数。无论是需要提取特定的行或列,还是需要应用条件过滤,pandas都可以满足需求。 https://av
阅读全文
posted @ 2023-11-30 09:56 deephub
阅读(58)
评论(0)
推荐(0)
2023年11月29日
使用Accelerate库在多GPU上进行LLM推理
摘要: 大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。 所以本文将在多个gpu上并行执行推理,主要包括:Accelerate库介绍,简单的方法与工作代码示例和使用多个gpu的性能基准测试。 本文
阅读全文
posted @ 2023-11-29 10:07 deephub
阅读(197)
评论(0)
推荐(0)
2023年11月28日
三种常用的风险价值(VaR)计算方法总结
摘要: 风险价值(VaR)是金融领域广泛使用的风险度量,它量化了在特定时间范围内和给定置信度水平下投资或投资组合的潜在损失。它提供了一个单一的数字,代表投资者在正常市场条件下可能经历的最大损失。VaR是风险管理、投资组合优化和法规遵从的重要工具。 在本文中我们将介绍VaR的概念,并使用Python计算它,然
阅读全文
posted @ 2023-11-28 10:00 deephub
阅读(466)
评论(0)
推荐(0)
2023年11月27日
PubMedBERT:生物医学自然语言处理领域的特定预训练模型
摘要: 今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta,这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中,大语言模型并不一定就是最优的解决方案,“小”模型也有一定的用武之地,所以今天我
阅读全文
posted @ 2023-11-27 09:37 deephub
阅读(158)
评论(0)
推荐(0)
2023年11月26日
使用skforecast进行时间序列预测
摘要: 时间序列预测是数据科学和商业分析中基于历史数据预测未来价值的一项重要技术。它有着广泛的应用,从需求规划、销售预测到计量经济分析。由于Python的多功能性和专业库的可用性,它已经成为一种流行的预测编程语言。其中一个为时间序列预测任务量身定制的库是skforecast。 在本文中,将介绍skforec
阅读全文
posted @ 2023-11-26 09:22 deephub
阅读(88)
评论(0)
推荐(0)
2023年11月25日
LLMLingua:集成LlamaIndex,对提示进行压缩,提供大语言模型的高效推理
摘要: 大型语言模型(llm)的出现刺激了多个领域的创新。但是在思维链(CoT)提示和情境学习(ICL)等策略的驱动下,提示的复杂性不断增加,这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理,因此需要高效的解决方案,本文将介绍LLMLingua与专有的LlamaIndex的进行集成执行高效推理。
阅读全文
posted @ 2023-11-25 10:16 deephub
阅读(145)
评论(0)
推荐(0)
2023年11月24日
https://avoid.overfit.cn/post/161e4abfe1fa4e1a98ddf8511c16f2c6
摘要: 评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类,还可以用来确定哪种聚类算法最适合特定的数据集和任务,并调优这些算法的超参数(例如k-means中的聚类数量,或DBSCAN中的密度参数)。 虽然监督学习技术有明确的性能指标,如准确性
阅读全文
posted @ 2023-11-24 11:32 deephub
阅读(59)
评论(0)
推荐(0)
2023年11月23日
斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积
摘要: 斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解,在FLOP和I/O成本之间取得平衡,提高模型质量和效率。并且优于PyTorch和FlashAttention-v2。它可以处理更长的序列,并在人工智能应用程序中打开新的可能性。 处理长序列
阅读全文
posted @ 2023-11-23 10:17 deephub
阅读(49)
评论(0)
推荐(0)
2023年11月22日
使用ExLlamaV2量化并运行EXL2模型
摘要: 量化大型语言模型(llm)是减少这些模型大小和加快推理速度的最流行的方法。在这些技术中,GPTQ在gpu上提供了惊人的性能。与非量化模型相比,该方法使用的VRAM几乎减少了3倍,同时提供了相似的精度水平和更快的生成速度。 ExLlamaV2是一个旨在从GPTQ中挤出更多性能的库。由于新的内核,它还经
阅读全文
posted @ 2023-11-22 10:16 deephub
阅读(255)
评论(0)
推荐(0)
2023年11月21日
对OpenAI CEO奥特曼突然被解雇事件的一些分析
摘要: 今天也来凑个热闹,说说OpenAI的事。本来不想写的,但是看到自媒体又开始胡说八道,所以根据我自己得到的消息和理解说一说我的看法,这篇文章要是有个小姐姐解说录成视频,那肯定火了,但是我现在没资源,人也懒,所以就直接码字吧。 1、奥特曼突然被解雇 奥特曼前天还在APEC会议上还在演讲,第二天就宣布被解
阅读全文
posted @ 2023-11-21 11:31 deephub
阅读(82)
评论(0)
推荐(0)
上一页
1
···
75
76
77
78
79
80
81
82
83
···
151
下一页
公告