机器学习十讲-第一讲
1|0有监督学习
1|1含义
数据集中的样本带有标签,有明确目标
1|2回归和分类
回归模型:线性回归、岭回归、LASSO和回归样条等
分类模型:逻辑回归、K近邻、决策树、支持向量机等
2|0应用场景
垃圾邮件分类、病理切片分类、客户流失预警、客户风险评估、房价预测等。
3|0无监督学习( unsupervised learning )
3|1含义
数据集中的样本没有标签,没有明确目标
无监督学习:根据数据本身的分布特点,挖掘反映数据的内在特性
3|2聚类
将数据集中相似的样本进行分组,使得:
- 同一组对象之间尽可能相似; .
- 不同组对象之间尽可能不相似。
3|3应用场景
基因表达水平聚类:根据不同基因表达的时序特征进行聚类,得到基因表达处于信号通路
上游还是下游的信息
篮球运动员划分:根据球员相关数据,将其划分到不同类型(或者不同等级)的运动员阵
营中
客户分析:把客户细分成不同客户群,每个客户群有相似行为,做到精准营销
4|0强化学习( reinforcement learing )
4|1含义
智慧决策的过程,通过过程模拟和观察来不断学习、提高决策能力
4|2流程
4|3实例
例如: AlphaGo
5|0数学结构
数据也是有数学结构的,没有数学结构我们便无法处理数据。
5|1度量结构
表示数据之间的距离。
5|2网络结构
有些数据本身就有网络结构,如社交网络。如果没有,可以利用度量结构给数据附加一个网络结构。
计算所用的算法如下:
5|3代数结构
将数据看作向量、矩阵或更高阶的张量。
5|4几何结构
流形、对称性等
6|0Scikit-learn
6|1常用函数
6|2 主要模块
7|0 总结
__EOF__
作 者:清风紫雪
出 处:https://www.cnblogs.com/xiaofengzai/p/14332823.html
关于博主:编程路上的小学生,热爱技术,喜欢专研。评论和私信会在第一时间回复。或者直接私信我。
版权声明:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本。
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
2020-01-26 枚举,模拟与排序