上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页
摘要: 概述 主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维和特征提取技术,用于将高维数据转换为低维的特征空间。其目标是通过线性变换将原始特征转化为一组新的互相无关的变量,这些新变量称为主成分,它们按照方差递减的顺序排列,以保留尽可能多的原始数据信息。 主 阅读全文
posted @ 2023-10-03 12:11 又见阿郎 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 概述 随机森林(Random Forest)是一种集成学习(Ensemble Learning)方法,通过构建多个决策树并汇总其预测结果来完成分类或回归任务。每棵决策树的构建过程中都引入了随机性,包括数据采样和特征选择的随机性。 随机森林的基本原理可以概括如下: 随机抽样训练集:随机森林通过有放回抽 阅读全文
posted @ 2023-10-02 15:05 又见阿郎 阅读(408) 评论(0) 推荐(0) 编辑
摘要: 概述 Alink提供了一系列与推荐相关的组件,从组件使用得角度来看,需要重点关注如下三个方面: 算法选择 推荐领域有很多算法,常用的有基于物品/用户的协同过滤、ALS、FM算法等。对于不同的数据场景,算法也会在计算方式上有很大的变化。 推荐方式 输入信息可以有多种选择,输入结果也有多种情况。 同时输 阅读全文
posted @ 2023-09-29 12:49 又见阿郎 阅读(514) 评论(0) 推荐(2) 编辑
摘要: 示例代码及相关内容来源于《Alink权威指南(Java版)》 概述 决策树模型再现了人们做决策的过程,该过程由一系列的判断构成,后面的判断基于前面的判断结果,不断缩小范围,最终推出结果。 如下,基于决策树模型预测天气,是最常见的示例。天气的整个预测过程,就是不断地判断推测的过程。 特征分类 特征(F 阅读全文
posted @ 2023-09-28 22:22 又见阿郎 阅读(337) 评论(0) 推荐(2) 编辑
摘要: 来自《深度学习入门:基于Python的理论与实现》 张量 Numpy、TensorFlow、Pytorch等框架主要是为了计算张量或是基于张量计算。 标量:0阶张量;12,4,3, 向量:一阶张量;[12,4,3] 矩阵:二阶张量;[ [12,4,3], [11,2,3] ] 多阶张量:多维数组; 阅读全文
posted @ 2023-09-14 15:05 又见阿郎 阅读(711) 评论(1) 推荐(1) 编辑
摘要: 最近再看项目代码,发现很多的service里面,喜欢在事务内部再去调用HTTP请求,简单分析下此种方式的利弊与解决策略。 概述 在数据库内部嵌套TCP连接(一般是HTTP调用或是RPC远程调用)。 @Transactional(rollbackFor = Exception.class) publi 阅读全文
posted @ 2023-09-13 10:44 又见阿郎 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 翻译自:[Fine-tuning a model with the Trainer API](https://huggingface.co/learn/nlp-course/chapter3/3?fw=pt "Fine-tuning a model with the Trainer API") `T 阅读全文
posted @ 2023-09-07 09:32 又见阿郎 阅读(768) 评论(0) 推荐(1) 编辑
摘要: 翻译自: [Big data? 🤗 Datasets to the rescue!](https://huggingface.co/learn/nlp-course/chapter5/4?fw=pt#big-data-datasets-to-the-rescue "Big data? 🤗 Dat 阅读全文
posted @ 2023-09-04 10:54 又见阿郎 阅读(2257) 评论(0) 推荐(2) 编辑
摘要: 最近翻译的一篇分享中,主要讲解了多任务学习的各个方面,很多的专业术语与概念都不清楚,因此简单的整理了下相关的知识,做个笔记。 ### 概述 现在大多数机器学习任务都是单任务学习。对于复杂的问题,也可以分解为简单且相互独立的子问题来单独解决,然后再合并结果,得到最初复杂问题的结果。这样做看似合理,其实 阅读全文
posted @ 2023-09-03 17:18 又见阿郎 阅读(109) 评论(0) 推荐(0) 编辑
摘要: ## 概述 参见:[聊聊HuggingFace](https://www.cnblogs.com/zhiyong-ITNote/p/17640835.html) ## 项目组件 一个完整的transformer模型主要包含三部分:Config、Tokenizer、Model。 ### Config 阅读全文
posted @ 2023-08-27 10:40 又见阿郎 阅读(1154) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页