随笔分类 - 【025】AIGC
ML、AIGC 与 大模型应用开发
摘要:
本文介绍了Transformer的基本概念和架构,它相对于RNN的优势主要就在于自注意力机制,实现了并行性和可扩展性,进而催生了GPT等大语言模型的诞生。目前我们可以通过对预训练好的大语言模型进行微调,进而让其适应我们的业务任务,节省资源又能保证质量。
阅读全文

摘要:
本文介绍了Microsoft.Extensions.Vector的基本概念 和 基本使用,结合Embedding Model(如all-minilm) 和 VectorStore(如Qdrant),我们可以快速实现语义搜索,而不仅仅是关键字匹配。如果你也是.NET程序员希望参与AI应用的开发,那就快快了解和使用基于Microsoft.Extensioins.AI的生态组件库吧。
阅读全文

摘要:
本文介绍了RNN循环神经网络的基本概念 和 各种神经网络(DNN、CNN、RNN)的对比,最后介绍了如何基于RNN来做时序预测的案例。
阅读全文

摘要:
本文介绍了CNN的基本概念 以及 如何基于预训练的CNN模型对于CIFAR-10数据集做图像分类的案例。基于预训练好的CNN模型作为基线模型,针对你自己的图片数据集做二次训练(迁移学习),通常可以兼顾成本和性能,是值得采用的实践方式。
阅读全文

摘要:
本文介绍了Microsoft.Extensions.AI的基本概念 和 基本使用,如果你也是.NET程序员希望参与AI应用的开发,那就快快了解和使用起来吧。
阅读全文

摘要:
本文介绍了深度学习和神经网络的基本概念,深度学习和传统机器学习的差别,还了解了PyTorch框架,最后通过一个例子演示了如何基于PyTorch使用一个视觉检测模型来快速完成图片的目标检测任务,十分方便。
阅读全文

摘要:
本文介绍了机器学习中的降维场景问题,常用的降维算法 以及 如何选择降维算法,最后通过一个商品品类分析的案例做了一次实战,相信对你理解降维应用应该有所帮助。
阅读全文

摘要:
本文介绍了机器学习中的聚类场景问题,常用的聚类算法 以及 分类和聚类的简单对比,最后再次通过电商订单数据做用户画像的案例做了一次聚类实战,相信对你理解聚类应用应该有所帮助。
阅读全文

摘要:
本文介绍了机器学习中的分类场景问题,常用的分类算法 以及 分类和回归的简单对比,最后通过一个医疗数据诊断分类的案例做了一次实战,相信对你理解分类应用应该有所帮助。
阅读全文

摘要:
本文介绍了机器学习中的起点:回归分析,并进行了一个电商用户生命周期价值(LTV)的分析预测实战,最后还进行了多种回归模型的拟合效果对比,相信你会有一个直观的印象。
阅读全文

摘要:
今天是我们的第4站,了解经典的乳腺癌医疗数据集,并基于该数据集使用Matplotlib和Seaborn做了一些常见的数据可视化图的绘制,有了这些图可以帮助我们做数据分析。
阅读全文

摘要:
今天是我们的第3站,了解下AI项目实践的5大环节,并通过一个预测直播带货销售额的案例来感受下。
阅读全文

摘要:
之前尝试将Coze AI Bot接入到了微信,有朋友问如何接入企业微信,今天有空尝试了下,和你分享一下过程。整体流程和步骤还是基于chatgpt-on-wechat这个开源框架来的,唯一的差别就在于部署chatgpt-on-wechat的时候,需要填写一些企业微信相关的参数和secret。
阅读全文

摘要:
本文快速搭建了Python机器学习的开发环境,并通过一个简单的降维示例学习了scikit-learn的基本用法,完成了一个hello world程序。
阅读全文

摘要:
我最近入坑黄佳老师的《AI应用实战课》,记录下我的学习之旅,也算是总结回顾。今天是我们的第一站,必备的AI基础理论,它是后续应用实践的基础。
阅读全文

摘要:
本文介绍了如何将Coze AI Bot接入微信实现AI对话机器人的过程,相信你的微信群里 有了这样一位AI助手之后,会有不一样的对话体验。需要注意的是:这不是目前微信官方推荐或认可的方式,所以尽量不要使用自己的大号,而且也别让小号一直挂着,玩玩就行了,不要太认真。
阅读全文

摘要:
所谓提示词工程,就是研究怎么写AI易懂的提示词。为了引导大模型给出更好的答案,提示词工程必不可少,本篇我们再探提示词,看看几个必须知道的技巧:样本提示、思维链提示 与 ReAct框架,它们可以应用在不同的任务场景中。
阅读全文

摘要:
本文快速复习了基于统计的语言模型的基本玩法,然后介绍了语言模型发展过程中的三个重要里程碑:神经概率语言模型、词向量模型 和 预训练模型。基于这几个里程碑的发展,开启了NLP处理的新纪元,我们可以基于经过预训练的大模型进行微调,进而处理我们自己业务领域的实际问题。
阅读全文

摘要:
本文简单介绍了语言模型的发展脉络,特别介绍了其发展过程中的关键思路变迁,即从基于规则的方法到基于统计的方法。由于基于统计和数学的方法具有较高的扩展性和自适应性,它逐渐形成了目前业界主流的NLP处理方法。
阅读全文

摘要:
Coze(扣子)是字节跳动公司开发的新一代AI应用开发平台,使用这个AI应用开发平台,无论你是否有编码基础,都可以快速搭建基于大语言模型的各类AI Bot,还可以将Bot发布到其他渠道。本文会通过我所学习实践的一些DEMO来了解一下在AI Agent开发中涉及到一些核心概念如工作流、图像流、记忆能力、知识库等等,相信会对大家在今后的AI Agent开发实践中有所帮助。
阅读全文
