使用ModelArts自动学习完成猫狗声音分类
准备数据
-
点击下载猫狗声音数据集至本地;
-
解压,文件包结构大概如下图所示
data
├── test
│ ├── cats
│ │ ├── cat_20.wav
│ │ ├── ......
│ │ └── cat_29.wav
│ └── dogs
│ ├── dog_20.wav
│ ├── ......
│ └── dog_29.wav
└── train
├── cats
│ ├── cat_0.wav
│ ├── ......
│ └── cat_19.wav
└── dogs
├── dog_0.wav
├── ......
└── dog_19.wav
创建项目
-
登录ModelArts管理控制台,点击左侧导航栏的自动学习,进入自动学习页面;
-
点击右侧项目页面中的声音分类的创建项目按钮;
3. 在创建自动学习项目页面,计费模式默认“按需计费”,填写“名称”并选择“训练数据”的存储路径
在obs路径选择页面上,选择你的obs,在你想要保存数据的路径上新建文件夹,输入名称后,点击确定新建文件夹,然后在训练数据页面点击确定以新建的空文件夹作为你的训练数据源;
4. 点击右下角创建项目。
数据标注
-
在数据标注页面上,点击添加音频
2. 先添加data/train/cats下的数据,点击确定,可以看到界面已经显示音频数据
3. 可以点击音频左侧的播放按钮试听
4. 点击选择音频进行标注,一次可以多选,在这里我们勾选选择当前页直接选取当前页面的所有音频;
5. 右侧输入cat标签,并点击确定
6. 在已标注标签页上可以看到已标注的数据,并可以进行标签更改
7. 同样的方式添加data/train/dogs下的音频并标注为dog
模型训练
-
页面右下角点击开始训练,进入模型训练页面
2. 大概2-3分钟后训练结束,可以在右侧查看训练结果
部署上线
-
点击部署,等待约5分钟左右,部署成功
2. 页面中间是服务测试,点击上传,选择data/test目录下的猫狗音频,然后点击预测,在页面的右侧可以查看预测结果
3. 可以进行多次预测,查看预测结果
4. 结束前,点击版本管理的停止按钮,已避免产生不必要的费用
流程到此为止了,如果你觉得老山的文章不错,不妨点击关注。
作者:山找海味
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南