102102151 黄靖 综合设计——多源异构数据采集与融合应用综合实践
综合设计——多源异构数据采集与融合应用综合实践
[码云地址](多源异构数据采集与融合应用综合实践: 基于图像和文本的宠物识别系统(gitee.com))
这个项目属于哪个课程 | 2024数据采集与融合技术 |
---|---|
组名、项目简介 | 组名:黑吗喽-直面爬虫 项目需求:设计出一个交互友好的多源异构数据的采集与融合的小应用 项目目标:通过在web端输入文本、图片的多源数据进行内容提取并对其进行概括 技术路线:前端3件套(html、css、js)、flask、MobaXterm |
团队成员学号 | 102202103王文豪,102202148路治,102202129林伟宏,102102151黄靖,172209028伊晓,102202102王子聪,102202116李迦勒 |
这个项目目标 | 对获取的多模态信息进行分析概括,判断出最有可能的动物种类,根据用户上传的文本和图像,识别图像内容和文本信息,确定具体的宠物种类(例如:贵宾犬,比熊犬等) |
项目整体介绍
1、项目名称:基于图像和文本的宠物识别系统
2、项目背景:近年来,宠物在人们生活中的地位不断提升,越来越多的家庭开始养宠物,据《2022 年中国宠物行业白皮书》数据显示,中国城镇宠物数量的规模已经超过 1 亿头。大量宠物的出现使得宠物管理变得更加复杂和困难,包括宠物的身份识别、健康管理、走失找回等问题,传统的管理方式已经难以满足需求。
3、项目意义:宠物行业正在经历数字化转型,越来越多的企业开始将信息技术应用于宠物的养殖、销售、服务等环节。基于图像和文本的宠物识别系统可以为宠物企业提供更高效的管理工具,如宠物的品种鉴定、身份认证、健康监测等,提高企业的运营效率和服务质量
- 数据采集
- 采用selenium框架对宠搜网中图片、文本等数据进行爬取
- 前端开发:
- 使用HTML、CSS和JavaScript进行界面设计,实现用户与系统的交互。
- 用于上传文本、图片和视频等文件。
- 后端开发:
- 利用flask框架进行后端搭建。
- 用于接收前端发送的请求,对收到的数据进行保存和处理,最后返回文本结果。
- 数据处理与分析:
- 文本分析:采用星火的接口对输入的文本内容进行分析概括。
- 图片分析:
- 采用星火的接口对输入的图片进行概括,将概括后的文本进行分析概括返回图片概括后的结果。
- 视频分析:对于视频分析,没有找到合适的模型和接口进行概括,因此我们采用提取视频中的音频,对音频内容进行概括。
- 采用百度的接口对输入的视频提取主要内容并返回给用户。
- 服务器部署:
- 在华为云平台上部署了完整项目,使用MobaXterm远程连接服务器,完成相应部署操作
5、项目部分功能展示
①项目页面展示(以外貌相似的贵宾犬和苏格兰梗为例,检验模型准确性)
②图片概括+文字描述综合判断种类
个人分工
项目在服务器上的部署,答辩PPT的制作,小组材料整理及最终汇报
在MobaXterm上安装Anaconda环境
远程连接云服务器
部署并成功运行fuchong项目
云服务器IP下的网页
最终ppt制作