随笔分类 - 深度学习
摘要:YOLOv4: Optimal Speed and Accuracy of Object Detection Abstract 据说有大量的方法可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些方法的组合进行实际测试,并对结果进行理论证明。某些方法只在某些模型上运行,也只在某些问题上运
阅读全文
摘要:End-to-End Object Detection with Transformers Abstract: 提出了一种将目标检测视为直接的集合预测问题的新方法。我们的方法简化了检测管道,有效地消除了对许多手工设计组件的需求,比如非最大抑制程序或anchor生成,它们明确地编码了我们关于任务的先验
阅读全文
摘要:PP-OCR: A Practical Ultra Lightweight OCR System Abstract 光学字符识别(OCR)系统已广泛应用于各种应用场景,如办公自动化(OA)系统、工厂自动化、在线教育、地图制作等。然而,由于文本外观的多样性和计算效率的要求,OCR仍然是一项具有挑战性的
阅读全文
摘要:PP-OCRv2: Bag of Tricks for Ultra Lightweight OCR System Abstract 光学字符识别(OCR)系统已广泛应用于各种应用场合。设计OCR系统仍然是一项具有挑战性的任务。在以前的工作中,我们提出了一个实用的超轻量级OCR系统(PP-OCR),以
阅读全文
摘要:A Survey of Visual Transformers Abstract Transformer是一种基于注意力的编码器-解码器架构,它彻底改变了自然语言处理领域。受这一重大成就的启发,近年来在将类似transformer的架构应用到计算机视觉(CV)领域方面进行了一些开创性的工作,这些工作
阅读全文
摘要:Multi-modal Knowledge Graphs for Recommender Systems ABSTRACT 在各种在线应用中,推荐系统在解决信息爆炸问题和增强用户体验方面显示出了巨大的潜力。为了解决推荐系统中的数据稀疏和冷启动问题,研究人员提出了基于知识图谱(KGs)的推荐,利用有价
阅读全文
摘要:MMGCN: Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video ABSTRACT 个性化推荐在许多在线内容分享平台中扮演着核心角色。为了提供高质量的微视频推荐服务,考虑用户与项目(
阅读全文
摘要:Deep & Cross Network for Ad Click Predictions ABSTRACT 特征工程是许多预测模型成功的关键。然而,这个过程并不简单,经常需要手动的特性工程或穷举搜索。DNNs能够自动学习特征交互;然而,它们隐式地生成了所有的交互,并不能有效地学习所有类型的交叉特征
阅读全文
摘要:Wide & Deep Learning for Recommender Systems ABSTRACT 具有非线性特征变换的广义线性模型被广泛应用于具有稀疏输入的大规模回归和分类问题。通过一系列cross-product特征变换的特征交互的记忆(memorization)是有效且可解释的,而泛化
阅读全文
摘要:DeepFM: A Factorization-Machine based Neural Network for CTR Prediction Abstract 了解用户行为背后复杂的特征交互对于提高推荐系统的点击率(CTR)至关重要。尽管有了很大的进步,现有的方法似乎对低阶或高阶交互有强烈的bia
阅读全文
摘要:Group-CAM: Group Score-Weighted Visual Explanations for Deep Convolutional Networks Abstract 最近,深度卷积神经网络的解释引起了越来越多的关注,因为它有助于理解网络的内部机制和网络做出特定决策的原因。在计算机
阅读全文
摘要:RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for Image Recognition Abstract 我们提出了RepMLP,一个多层感知器风格的图像识别神经网络构建块,它由一系列全连接(FC)层组成。与卷
阅读全文
摘要:Do You Even Need Attention? A Stack of Feed-Forward Layers Does Surprisingly Well on ImageNet Abstract 视觉transformers在图像分类和其他视觉任务上的强大性能通常归因于其multi-hea
阅读全文
摘要:Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks Abstract 注意力机制,尤其是自注意力(self-attention),在视觉任务的深度特征表征中起着越来越重要的作用。自注意力
阅读全文
摘要:Rethinking “Batch” in BatchNorm Abstract BatchNorm是现代卷积神经网络的重要组成部分。它对“batches”而不是单个样本进行操作的独特特性,引入了与深度学习中大多数其他操作显著不同的行为。因此,它会导致许多隐藏的警告,可能以微妙的方式对模型的性能产生
阅读全文
摘要:What Deep CNNs Benefit from Global Covariance Pooling: An Optimization Perspective Abstract 最近的研究表明,全局协方差池化(global covariance pooling, GCP)能够提高深度卷积神经网
阅读全文
摘要:Project page: http://mmlab.ie.cuhk.edu.hk/projects/CDP/ Code: https://github.com/XiaohangZhan/cdp/ Consensus-Driven Propagation in Massive Unlabeled D
阅读全文
摘要:Domain-adversarial training of neural networks Abstract 我们介绍了一种新的用于域自适应的表征学习方法,其中训练和测试时的数据来自相似但不同的分布。我们的方法直接受到域自适应理论的启发,该理论认为,要实现有效的域转移,必须基于不能区分训练(源)域
阅读全文
摘要:When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework 为了在人脸识别中最小化年龄变化的影响,之前的工作要么通过最小化身份和年龄相关特征之间的相关性来提取与身份相关的有区
阅读全文
摘要:Cross-Domain Similarity Learning for Face Recognition in Unseen Domains Abstract 在相同的训练和测试分布假设下训练的人脸识别模型,当面对未知的变化时,例如在测试时如果出现新的种族或不可预测的个人装扮,往往会出现泛化不良的
阅读全文