One-hot 编码/TF-IDF 值来提取特征,LAD/梯度下降法(Gradient Descent),Sigmoid

1. 多值无序类数据的特征提取: 多值无序类问题(One-hot 编码)把“耐克”编码为[0,1,0],其中“1”代表了“耐克”的中 间位置,而且是唯一标识。同理我们可以把“中国”标识为[1,0],把“蓝色”标识为[0,1]。 然后把所有的数据编码拼接起来,[“耐克”,“中国”,“蓝色”]的最终编码结果就变为了 [0,1,0,1,0,0,1],这一组数据虽然很稀疏,但是可以带到算法中进行计算

无序类数据的特征提取:One-hot 编码解决多值无序类数据的特征提取问题.

2.文本提取特征:   由多个文本组成的集合,还可以根据TF-IDF 值来提取特征,LAD

3.图像或者语音提取特征:   将图像或者语音转化成矩阵结构:像素点切割的话,每个像素点可以表示成一个数值.

4.梯度下降法(Gradient Descent),是利用一阶梯度信息找到函数局部最优解的一种方 法,是机器学习算法中常用的一种最优化解法.梯度下降法的思路很简单,就是每一步都 向最终的结果前进一点,通过迭代的方式计算直到收敛,得到最优

5.Sigmoid 函数限制在[0,1]的区间中,

线性支持向量机主要: 通过一条线可以进行分类的场

posted @   大树2  阅读(592)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示