访问:
阿里云推出高校特惠专场:0元体验入门云计算 快速部署创业项目
这篇论文有意思之处,在于它的思路别出心裁:识别人脸面部因心跳血流产生的微弱变化。
血管遍布人体全身,包括脸上。比如在睡觉的时候,你可能会感觉到面部血液流动产生的轻微“跳动”感。
随着心跳导致的血液流动,人体皮肤也会出现区域性颜色变化。常见的脉搏血氧仪,其工作方式其实就是识别这种变化。(学名叫做光体积变化描记法 Photoplethysmography, 简称 PPG。后面还会提到这个词。)
因心跳产生的皮肤颜色变化,在人脸上同样会出现,只是极其微弱,对肉眼不可见,在视频里就更难看出来了。不过对视频进行特定处理,增强颜色变化的效果,肉眼就可以很明显地观察出来了:
你可能想问:这种方法识别心跳准确吗?当然准了,Apple Watch 和一大堆血氧仪都采用的这种方法。它的准确率和心电图基本吻合,如下图所示:
三位分别来自纽约州立大学宾汉顿分校和英特尔公司的研究人员,在这篇新论文里提出了一个重要的主张:无论是在空间维度还是时间维度上,DeepFake 的假人脸都无法还原这种因血液流动造成的微弱变化。
空间维度就是面部区域,时间维度就是心跳频率。DeepFake 的假人脸,不是体现不了这种微弱变化。在进行大量测试后,研究人员发现:DeepFake 视频里的人脸,读取到的 PPG 信号是不稳定的。
这句话的意思是:如果你对 DeepFake 视频进行增强,会发现血流变化产生的颜色变化在人脸上显示非常不自然,变化的频率也完全不像真的心跳。
从下图中你可以看的更清楚:四种 DeepFake 算法生成的视频,产生的 PPG 信号都有很多“杂讯”,而真实视频的“杂讯”很少。
基于这个主张,研究人员设计了一套基于卷积神经网络的模型,命名为 FakeCatcher。
FakeCatcher从不同的 DeepFake 视频中提取 1)关键的人脸区域 2)读取 PPG 信号,将两者组合成一个时空模块(称为一个 PPG 元素)。再对 PPG 元素进行学习,最终就可以给出答案了。
在 Face Forensics++、CelebDF 等常用的假脸数据集上,Fake Catcher 的准确率能够超过90%。
更厉害的是,FakeCatcher 不光能认出视频的真假,还能准确识别出假视频用的是哪种 DeepFake 算法——这是因为每种算法的残差效果的杂讯都有足够明显的特种。研究人员透露,他们在 DeepFakes、Face2Face、FaceSwap 和 NeuralTex 四种主流算法上的识别准确率整体超过了93%。
研究人员认为,这篇论文中提出的 PPG 信号识别思路,对于 DeepFake 的识别和侦测能够开启一个全新的方向。
接下来,他们打算训练一个更复杂的模型,同时对真实视频和 DeepFake 视频的 PPG 信号进行训练。
所谓魔高一尺道高一丈,赶在 DeepFake 算法被大肆滥用之前堵住他们的路,让他们无路可走。
本文素材来自互联网