PaddleHub(1)
1、PaddleHub是什么?
PaddleHub是一个深度学习模型开发工具。它基于飞桨领先的核心框架,精选效果优秀的算法,提供了百亿级大数据训练的预训练模型,方便用户不用花费大量精力从头开始训练一个模型。PaddleHub可以便捷地获取这些预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。
2、PaddleHub的功能:
通过PaddleHub,开发者可以便捷地获取飞桨生态下的所有预训练模型,涵盖了图像分类、目标检测、词法分析、语义模型、情感分析、语言模型、视频分类、图像生成八类主流模型40余个。
(1)中科院遥感与地球研究所应用PaddleHub基于遥感数据进行语义分割,从而达到对高尔夫球场的识别,辅助国家对国土资源进行有效管控。
(2)精确的地块识别和分割在农业有非常重要的意义,目前为止的绝大部分地块分割都是靠人力进行的。中科赛诺应用PaddleHub分割农业遥感数据,提取耕地面积,从而进行有效的估产。
(3)精诺数据基于PaddlePaddle平台利用历史配料数据建模,实现智能化计算,优化企业个性化配料方案,达到生产质量和生产成本的平衡点,达到提升熔炼效率、节省原材料的效果。
(4)在害虫病害期对其密度及分布进行监控是林场管理的重要工作内容,传统监测方式对工作专业要求高且周期长,基于PaddlePaddle打造的虫情检测物联网项目,将原本两周的检查任务缩至1小时。
(5)口罩人脸检测与分类。通过飞桨预训练模型管理与迁移学习工具PadddleHub已经提供的预训练模型(pyramidbox_lite_mobile_mask/pyramidbox_lite_server_mask),实现一键检测人们是否佩戴口罩的应用 。该模型可以有效检测在密集人流区域中携带和未携戴口罩的所有人脸,同时判断该者是否佩戴口罩,目前已在众多场景中落地应用。
(6)基于CT影像的肺炎筛查及病情预评估系统该系统。基于连心医疗在医学影像领域积累的核心AI技术,结合飞桨开源框架和视觉领域技术领先的PaddleSeg开发套件研发,可快速检测识别肺炎病灶,为病情诊断提供病灶的数量、体积、肺部占比等定量评估信息。同时辅以双肺密度分布的直方图和病灶勾画叠加显示等可视化手段,为临床医生筛查和预诊断患者肺炎病情提供定性和定量依据,提升医生诊断和评估效率。
(7)PaddleHub-词法分析。基于大数据和用户行为的中文分词、专名识别任务,定位基本语言元素,消除歧义,支撑自然语言的准确理解。
(PaddleHub官方网址:http://www.paddlepaddle.org.cn/hub)
3、我想做:
通过对以上基础知识的查阅,我了解到PaddleHub作为一个深度学习的开发工具正在被广泛的使用中,就其在医疗方面的应用,我对人脸模型这一方向的应用比较感兴趣。就这一方向而言飞桨预训练模型管理中已经给了相关PaddleHub模型,即pyramidbox_lite_mobile_mask。PyramidBox-Lite是基于2018年百度发表于计算机视觉顶级会议ECCV 2018的论文PyramidBox而研发的轻量级模型,模型基于主干网络FaceBoxes,对于光照、口罩遮挡、表情变化、尺度变化等常见问题具有很强的鲁棒性。该PaddleHub Module是针对于移动端优化过的模型,适合部署于移动端或者边缘检测等算力受限的设备上,并基于WIDER FACE数据集和百度自采人脸数据集进行训练,支持预测,可用于检测人脸是否佩戴口罩。