deephub

2023年11月14日

摘要：本文将深入研究深度学习中精简模型的技术：量化和蒸馏深度学习模型，特别是那些具有大量参数的模型，在资源受限环境中的部署几乎是不可能的。所以就出现了两种流行的技术，量化和蒸馏，它们都是可以使模型更加轻量级，而不会对性能造成太大影响。但是它们需要什么，它们又如何比较呢? 量化:牺牲精度换取效率量化是关阅读全文

posted @ 2023-11-14 10:08 deephub 阅读(81) 评论(0) 推荐(0)

2023年11月13日

无监督学习的集成方法：相似性矩阵的聚类

摘要：在机器学习中，术语Ensemble指的是并行组合多个模型，这个想法是利用群体的智慧，在给出的最终答案上形成更好的共识。这种类型的方法已经在监督学习领域得到了广泛的研究和应用，特别是在分类问题上，像RandomForest这样非常成功的算法。通常应用一些投票/加权系统，将每个单独模型的输出组合成最终阅读全文

posted @ 2023-11-13 09:45 deephub 阅读(100) 评论(0) 推荐(0)

2023年11月12日

XoT：一种新的大语言模型的提示技术

摘要：这是微软在11月最新发布的一篇论文，题为“Everything of Thoughts: Defying the Law of Penrose Triangle for Thought Generation”，介绍了一种名为XOT的提示技术，它增强了像GPT-3和GPT-4这样的大型语言模型(llm 阅读全文

posted @ 2023-11-12 09:34 deephub 阅读(154) 评论(0) 推荐(0)

2023年11月11日

LoRAShear:微软在LLM修剪和知识恢复方面的最新研究

摘要： LoRAShear是微软为优化语言模型模型(llm)和保存知识而开发的一种新方法。它可以进行结构性修剪，减少计算需求并提高效率。 LHSPG技术（ Lora Half-Space Projected Gradient）支持渐进式结构化剪枝和动态知识恢复。可以通过依赖图分析和稀疏度优化应用于各种llm 阅读全文

posted @ 2023-11-11 11:16 deephub 阅读(63) 评论(0) 推荐(0)

2023年11月10日

线性回归，核技巧和线性核

摘要：在这篇文章中，我想展示一个有趣的结果：线性回归与无正则化的线性核ridge回归是等价的。这里实际上涉及到很多概念和技术，所以我们将逐一介绍，最后用它们来解释这个说法。首先我们回顾经典的线性回归。然后我将解释什么是核函数和线性核函数，最后我们将给出上面表述的数学证明。 https://avoid 阅读全文

posted @ 2023-11-10 09:52 deephub 阅读(52) 评论(0) 推荐(0)

2023年11月9日

使用递归图 recurrence plot 表征时间序列

摘要：在本文中，我将展示如何使用递归图 Recurrence Plots 来描述不同类型的时间序列。我们将查看具有500个数据点的各种模拟时间序列。我们可以通过可视化时间序列的递归图并将其与其他已知的不同时间序列的递归图进行比较，从而直观地表征时间序列。递归图 Recurrence Plots（RP）是阅读全文

posted @ 2023-11-09 14:57 deephub 阅读(372) 评论(0) 推荐(0)

2023年11月8日

使用Streamlit创建AutoGen用户界面

摘要： AutoGen作为一个最大化LLM(如GPT-4)能力的框架而脱颖而出。由微软研究院开发的AutoGen通过提供一种自动化、优化和编排工作流的方法，简化了复杂的、基于多代理llm的应用程序的创建。我们在以前的文章中也有过介绍，你可以与许多GPT交谈，并且GPT和GPT之间也可以互相交谈。每个GPT都阅读全文

posted @ 2023-11-08 10:02 deephub 阅读(185) 评论(0) 推荐(0)

2023年11月7日

使用Python从零实现多分类SVM

摘要：本文将首先简要概述支持向量机及其训练和推理方程，然后将其转换为代码以开发支持向量机模型。之后然后将其扩展成多分类的场景，并通过使用Sci-kit Learn测试我们的模型来结束。 SVM概述支持向量机的目标是拟合获得最大边缘的超平面(两个类中最近点的距离)。可以直观地表明，这样的超平面(A)比没有阅读全文

posted @ 2023-11-07 10:54 deephub 阅读(173) 评论(0) 推荐(0)

2023年11月6日

使用蒙特卡罗模拟的投资组合优化

摘要：在金融市场中，优化投资组合对于实现风险与回报之间的预期平衡至关重要。蒙特卡罗模拟提供了一个强大的工具来评估不同的资产配置策略及其在不确定市场条件下的潜在结果。我们的目标是开发一个蒙特卡罗模拟模型的投资组合优化。参与者将被要求构建和分析由各种资产类别(例如，股票，债券和另类投资)组成的投资组合，以最阅读全文

posted @ 2023-11-06 10:33 deephub 阅读(144) 评论(0) 推荐(0)

2023年11月5日

Spectron: 谷歌的新模型将语音识别与语言模型结合进行端到端的训练

摘要： Spectron是谷歌Research和Verily AI开发的新的模型。与传统的语言模型不同，Spectron直接处理频谱图作为输入和输出。该模型消除归纳偏差，增强表征保真度，提高音频生成质量。它采用预训练的语音编码器和语言解码器，提供文本和语音的延续。但是频谱图帧生成比较费时并且无法并行文本和阅读全文

posted @ 2023-11-05 08:56 deephub 阅读(85) 评论(0) 推荐(0)

overfit深度学习

公告