10 2023 档案

聊聊RNN与seq2seq

摘要：seq2seq模型也称为Encoder-Decoder模型。顾名思义，这个模型有两个模块——Encoder（编码器）和Decoder（解码器）。编码器对输入数据进行编码，解码器对被编码的数据进行解码。此时编码器编码的信息浓缩了翻译所必需的信息，解码器基于这个浓缩的信息生成目标文本。这里的数据一般指阅读全文

posted @ 2023-10-31 11:17 又见阿郎阅读(399) 评论(0) 推荐(0) 编辑

聊聊RNN&LSTM

摘要：RNN 用于解决输入数据为，序列到序列(时间序列)数据，不能在传统的前馈神经网络(FNN)很好应用的问题。时间序列数据是指在不同时间点上收集到的数据，这类数据反映了某一事物、现象等随时间的变化状态或程度，即输入内容的上下文关联性强。整体结构 x、o为向量，分别表示输入层、输出层的值；U、V为权重矩阅读全文

posted @ 2023-10-30 11:37 又见阿郎阅读(379) 评论(0) 推荐(0) 编辑

聊聊基于Alink库的特征工程方法

摘要：独热编码 OneHotEncoder 是用于将类别型特征转换为独热编码的类。独热编码是一种常用的特征编码方式，特别适用于处理类别型特征，将其转换为数值型特征。对于每个类别型特征，OneHotEncoder 将其编码成一个长度为类别数量的向量。每个类别对应一个维度，如果样本的该特征值为该类别，则对阅读全文

posted @ 2023-10-17 15:46 又见阿郎阅读(282) 评论(0) 推荐(0) 编辑

聊聊基于Alink库的主成分分析(PCA)

摘要：概述主成分分析（Principal Component Analysis，PCA）是一种常用的数据降维和特征提取技术，用于将高维数据转换为低维的特征空间。其目标是通过线性变换将原始特征转化为一组新的互相无关的变量，这些新变量称为主成分，它们按照方差递减的顺序排列，以保留尽可能多的原始数据信息。主阅读全文

posted @ 2023-10-03 12:11 又见阿郎阅读(338) 评论(0) 推荐(0) 编辑

聊聊基于Alink库的随机森林模型

摘要：概述随机森林（Random Forest）是一种集成学习（Ensemble Learning）方法，通过构建多个决策树并汇总其预测结果来完成分类或回归任务。每棵决策树的构建过程中都引入了随机性，包括数据采样和特征选择的随机性。随机森林的基本原理可以概括如下：随机抽样训练集：随机森林通过有放回抽阅读全文

posted @ 2023-10-02 15:05 又见阿郎阅读(470) 评论(0) 推荐(0) 编辑

公告

昵称：又见阿郎
园龄： 8年8个月
粉丝： 63
关注： 63

+加关注

2025年2月

日

一

二

三

四

五

六

又见阿郎

10 2023 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论