上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 98 下一页
摘要: 特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。 为什么特征重要性分析很重要? 如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一 阅读全文
posted @ 2023-09-16 09:12 deephub 阅读(199) 评论(0) 推荐(0) 编辑
摘要: Recognize Anything是一种新的图像标记基础模型,与传统模型不同,它不依赖于手动注释进行训练;相反,它利用大规模的图像-文本对。RAM的开发过程包括四个关键阶段: 通过自动文本语义解析获得大规模的无标注图像标签。 结合标题和标注任务,训练一个自动标注的初步模型。该模型由原始文本和解析后 阅读全文
posted @ 2023-09-15 09:42 deephub 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 在人工智能领域,有大量的数据需要有效的处理。随着我们对人工智能应用,如图像识别、语音搜索或推荐引擎的深入研究,数据的性质变得更加复杂。这就是向量数据库发挥作用的地方。与存储标量值的传统数据库不同,向量数据库专门设计用于处理多维数据点(通常称为向量)。这些向量表示多个维度的数据,可以被认为是指向空间中 阅读全文
posted @ 2023-09-14 09:36 deephub 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比较大的模型,经过我的测试,7B的模型可以在3 阅读全文
posted @ 2023-09-13 10:12 deephub 阅读(93) 评论(0) 推荐(0) 编辑
摘要: Technology Innovation Institute最近发布了Falcon 180B大型语言模型(LLM),它击败了Llama-2 70b,与谷歌Bard的基础模型PaLM-2 Large不相上下。 180B是是Falcon 40B模型一个最新版本。以下是该模型的快速概述: 180B参数模 阅读全文
posted @ 2023-09-12 09:34 deephub 阅读(55) 评论(0) 推荐(0) 编辑
摘要: Langchain因其简化大型语言模型(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。 但是Langchain乍一看似乎是一个方便的工具,但是它有时候否更像是一个语言迷宫,而不是一个直截了当的解决方案。在本文中,我们将探讨与Langchain相关的一些问题 阅读全文
posted @ 2023-09-10 09:15 deephub 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 自监督预训练需要大规模数据集吗?这是2021年发布的一篇论文,它在自监督预训练场景中使用小数据集,如Stanford Cars, Sketch或COCO,它们比ImageNet小几个数量级。并提出了一种类似于BEiT的去噪自编码器的变体SplitMask,它对预训练数据的类型和大小具有更强的鲁棒性。 阅读全文
posted @ 2023-09-09 11:42 deephub 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 随着人工智能领域的不断进步,其子领域,包括自然语言处理,自然语言生成,计算机视觉等,由于其广泛的用例而迅速获得了大量的普及。光学字符识别(OCR)是计算机视觉中一个成熟且被广泛研究的领域。它有许多用途,如文档数字化、手写识别和场景文本识别。数学表达式的识别是OCR在学术研究中受到广泛关注的一个领域。 阅读全文
posted @ 2023-09-08 09:36 deephub 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 论文提出了一种基于卷积和VIT的混合网络,利用Transformers捕获远程依赖关系,利用cnn提取局部信息。构建了一系列模型cmt,它在准确性和效率方面有更好的权衡。 CMT:体系结构 CMT块由一个局部感知单元(LPU)、一个轻量级多头自注意模块(LMHSA)和一个反向残差前馈网络(IRFFN 阅读全文
posted @ 2023-09-07 09:23 deephub 阅读(37) 评论(0) 推荐(0) 编辑
摘要: OpenAI在2023年8月22日宣布,现在可以对GPT-3.5 Turbo进行微调了。也就是说,我们可以自定义自己的模型了。然后LlamaIndex就发布了0.8.7版本,集成了微调OpenAI gpt-3.5 turbo的功能 也就是说,我们现在可以使用GPT-4生成训练数据,然后用更便宜的AP 阅读全文
posted @ 2023-09-06 10:46 deephub 阅读(91) 评论(0) 推荐(0) 编辑
上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 98 下一页