Protecting World Leaders Against Deep Fakes(CVPR 2020)

Protecting World Leaders Against Deep Fakes(CVPR 2020)文章目录IntroductionInnovationMethodExperimentProtectingWorldLeadersAgainstDeepFakes(CVPR2020)paperPDFIntroduction深度学习的应用促使了人脸伪造技术的巨大进步。现有AI-合成的人脸伪造方式可以分为以下三种:faceswap:将视频中出现的人脸替换为其他人的脸,一般对整个面部进行对齐和替换lip-sync:使得视频中的人物口型按照既定音频变化,一般仅伪造目标的唇部区域pupp

大家好,又见面了,我是你们的朋友全栈君。

Protecting World Leaders Against Deep Fakes(CVPR 2020)
paper PDF

Introduction

深度学习的应用促使了人脸伪造技术的巨大进步。现有AI-合成的人脸伪造方式可以分为以下三种:

  1. face swap:将视频中出现的人脸替换为其他人的脸,一般对整个面部进行对齐和替换
  2. lip-sync:使得视频中的人物口型按照既定音频变化,一般仅伪造目标的唇部区域
  3. puppet-master:使视频中人物做出给定的面部表情,包括头部运动,一般需要对视频中人脸建立3D模型,并对唇部区域进行伪造

对图像和视频进行认证是一个悠久的话题,有大量的文献提出各种各样的方式。但利用人工智能合成是一个相对较新的技术,目前对该方面的认证技术还不够完善。现有的一些研究者试图通过发掘伪造过程中出现图像中存在的pixel-level的“痕迹”进行伪造检测。但是这种认证方式无疑对如图像压缩、resize、噪声等渲染攻击十分脆弱。

本文发现不同人在说话时,面部表情和头部运动存在明显的模式差异。而在上述的三种伪造方式中都对这种模式造成了破坏(即视频中的人脸区域发生了篡改,导致人物说话时面部表情和头部运动的模式与人物身份不相符)。利用这种方式,建立国家领导人个人的soft-biometric模型,并使用这些模型来区分视频的真假。

Innovation

  1. 对具体人物说话时面部表情和头部运动模式进行建模(20种面部运动单元的相关性),通过判断视频中人物所表现的说话模式是否与所建立的模型一致来判断是否是伪造视频。这种方式提取的高层特征,对压缩、resize等攻击具有较强的鲁棒性。

Method

利用OpenFace2对视频中的人脸提取以下20种运动单元的强度和发生情况。

inner brow raiser (AU01), outer brow raiser (AU02), brow lowerer (AU04), upper lid raiser (AU05), cheek raiser (AU06), lid tightener (AU07), nose wrinkler (AU09), upper lip raiser (AU10), lip corner puller (AU12), dimpler (AU14), lip cor- ner depressor (AU15), chin raiser (AU17), lip stretcher (AU20), lip tightener (AU23), lip part (AU25), jaw drop (AU26), head rotation about the x-axis (pitch),head rotation about the z-axis (roll),the 3-D horizontal distance between the corners of the mouth (mouthh),the 3-D vertical distance between the lower and upper lip (mouthv).

利用Pearson correlation计算这些运动单元之间的线性关系,以此来表征一个人的头部运动特征。一共有20种运动单元,共产生 C 20 2 = 20 × 19 ÷ 2 = 190 C_{20}^{2}=20 \times 19 \div 2=190 C202=20×19÷2=190维特征。通过某一具体领导人的视频数据集提取的该种特征来训练**one-class support vector machine (SVM)**模型,模型结果反应视频种该领导人是否伪造。对190维特征进行t-SNE可视化显示了这种特征的身份相关性。

在这里插入图片描述

Experiment

下表上半部分显示的是基于190个特征的奥巴马视频的准确度。前四行对应10秒clips的精度,后四行对应全视频片段的精度。10秒clips和完整片段的平均AUC值分别为0.93和0.98。其中lip-sync类型的视频,伪造检测的准确度较低,AUC分别为0.83和0.93,这可能是因为与其他伪造方式相比,lip-sync只篡改了嘴部区域。因此,许多面部表情和动作被保存在这些虚假视频中。作者提出可以考虑加入语言模型,获得特定人物说话时所说语言和唇部运动的相关模式来优化这方面的缺陷。
在这里插入图片描述

为了进一步选择合适的特征来区分不同人物的面部表情和头部运动模型,作者进行了从选择最优的一个特征,到选择全部190个特征进行训练。发现训练的准确率在29个特征时到达稳定水平,如下图:
在这里插入图片描述
鲁棒性研究,作者分别进行了压缩测试、视频长度测试。测试结果表明该种方式能够对视频的压缩和长短具有较强的鲁棒性。考虑到一个人的说话风格和面部行为可能会随着说话的语境而变化 ,作者也进行了不同语境下模型准确率的实验。测试结果显示不同的语境对测试结果有较大的影响,尤其是当说话者没有面对镜头的时候,这种运动单元的可靠性会大大降低。作者也提出扩大训练数据集、寻找更加鲁班的模式特征等方式以进一步改进模型效果。或者通过语言分析抓住说话内容和说话方式之间的相关性来扩充该模型。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141385.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 教你如何使用 chmod 命令「建议收藏」

    教你如何使用 chmod 命令「建议收藏」chmod是Linux中一个关于权限分配的命令。在具体介绍命令使用之前,先介绍一些基础知识。Linux中对于一个文件的权限有三种:拥有者、群组、其他。分别用u、g和o表示。如果是表示所有人,则可以用a表示。那么对于chmod命令的基本语法结构如下:chmod[-cfvR][ugoa…][+-=][rwxX]下面依次介绍,其具体含义。第一部分[-cfvR]不是必选的,是增强其功能的选择。其中-R使用频率较高。 -c:若该档案权限确实已经更改,才显示其更改动作 -f:

    2022年6月18日
    29
  • 看了很多人的面试经验,我也来一段:这段时间的几个面试

    看了很多人的面试经验,我也来一段:这段时间的几个面试
    泉州巴黎婚纱摄影
     
    店门口摆了个牌子,说招聘20名数码师,月薪2000-4000。又在网上也看到招聘启事,投了。
     
    投完,人才网收到个面试通知,不过简历状态竟然是未阅?通知人面试连简历都不看的?打了个电话过去,又给了我个电话,再打过去,电话里跟我说,我们这个职位啊,工作时间长工资低(6+*12+,<=800),你要有心理准备……KAO,牌子上不是写的2000-4000吗?到底打的啥鬼主意?
     
    过阵子在百度PS吧,看到有人发了一个贴

    2022年5月4日
    77
  • docker dockerfile详解_进入docker容器命令

    docker dockerfile详解_进入docker容器命令前言Dockerfile是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。Dockerfile简介Dockerfile是用来构建Docker镜像的构建文件,是由一系列

    2022年7月30日
    8
  • TD—SCDMA_移动TD

    TD—SCDMA_移动TD
    GSM
     globalsystemformobilecommunications全球移动通信系统
     第二代移动电话系统。
         GSM是GlobalSystemofMobilecommunication全球移动通讯系统的英文缩写,是当前应用最为广泛的移动电话标准。全球超过200个国家和地区超过10亿人正在使用GSM电话。所有用户可以在签署了”漫游协定”移动电话运营商之间自由漫游。GSM较之它以前的标准最大的不同是他的信令和语音信道都是数

    2022年10月4日
    4
  • vue3.0中关闭eslint(全部不检测)[通俗易懂]

    vue3.0中关闭eslint(全部不检测)[通俗易懂]前言:在项目中eslint检查是一个很棒的工具,但是在非正式场合,或者某些情况下,他会给我们带来很多不方便,这里分享下如何在新建项目后把他的eslint检查先关掉(正式项目不推荐关闭,因为良好的习惯是从每一行代码的规范开始)方法:打开我们的.eslintrc.js文件,把’@vue/standard’注释,然后把服务重启,重启,重启,重要的事情说三遍.eslintrc.jsmodule.exports={root:true,…

    2022年6月7日
    100
  • 惠普电脑有电脑管家吗_电脑管家检测硬件就蓝屏

    惠普电脑有电脑管家吗_电脑管家检测硬件就蓝屏据海外媒体WindowsLatest的报道,大量的Windows10用户的设备最近频繁出现蓝屏,多家硬件设备厂商均中招。联想电脑管家安全团队已证实暂不涉及联想设备的国内用户。同时提醒广大国内用户,暂停近期微软发布的任何更新业务(包括暂停通过Vantage应用程序进行BIOS更新),等待微软官方给出修复补丁。据悉该蓝屏问题是由于近期的一次更新造成,蓝屏(BSOD)错误将会阻止windows10设备的…

    2022年8月13日
    11

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号