D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and Localization

题目：D-Unet: A Dual-encoder U-Net for Image Splicing
Forgery Detection and Localization

出处：arxiv 2020.12.3

作者： Snipaste_2020-12-14_14-58-11

Department of Computer Science and Technology,

Chongqing University of Posts and Telecommunications

摘要：存在问题1. 多数检测方法关注于local patches或者local objects。实际上拼接检测是一个全局二分类任务。2. 一些特定的图像内容在基于CNN的方法中很难保留。

解决问题：本文提出一个双编码器U-net（D-unet），包括一个unfixed encoder自动学习image fingerprints，一个fixed encoder提供方向信息。双编码器之后是一个spatial pyramid global-feature extraction module，扩展全局视野。本文方法使用少量训练样本。

网络结构

Snipaste_2020-12-14_15-07-26

unfixed encoder

作者通过实验选择网络深度和下采样方式（最大池化maxpooling、步长为2的卷积下采样）

casia用750张训练，100张测试

columbia使用135张训练，45张测试

用了评价指标和可视化来解释实验

unet-N-C/M 里的N是操作数量，M是最大池化，C是步长为2的卷积

Snipaste_2020-12-14_15-12-04

Snipaste_2020-12-14_15-12-14

实验证明使用 unet-4-C （使用4个步长为2的卷积下采样操作）效果最好

fixed encoder

设计了SRM编码器和DWT编码器（哈尔小波变换），两个编码器的特征融合方式有SF简单融合，HF分级融合。

Snipaste_2020-12-14_15-21-01

Snipaste_2020-12-14_15-21-42

SF是把最后输出拼接，HF是在每一层对应拼接

Snipaste_2020-12-14_15-24-36

作者用实验选择结构，包括可视化和评价指标。

Snipaste_2020-12-14_15-25-14

Snipaste_2020-12-14_15-25-45

根据实验结果，选择DWT编码器，使用分层融合方式。

空间金字塔全局特征提取模块

Snipaste_2020-12-14_15-27-28

使用3，5，7的卷积，从全局视角提取特征。

Unet-4-C是使用4个步长为2的卷积

Unet-4-C-S是使用SPGFE

Unet-4-C-HF-FE是DWT编码器加unet4c加HF融合方式

Unet-4-C-HF-FE-S是本文结构

用实验证明结构有效，使用可视化、评价指标

Snipaste_2020-12-14_15-31-38

对比试验

自己设置数据集划分

casia挑选拼接图像715，35，100分别做训练，验证，测试

columbia划分125，10，45做训练，验证，测试

nist挑出184，12，50做训练，验证，测试

Snipaste_2020-12-14_15-36-05

下图是自己从三个数据集共选了195张做测试

Snipaste_2020-12-14_15-34-43

鲁棒性实验

做了对比方法在噪声，jpeg压缩，缩放的实验

Snipaste_2020-12-14_15-37-13

结论

提出了端到端的结构。D-Unet有global insight。不需大量的训练数据或预处理过程。表现达到SOTA，鲁棒性好

posted @ 2020-12-14 15:56 clownn 阅读(1705) 评论(0) 编辑收藏举报

刷新页面返回顶部