3D 建模与原视频对比(图自:Carnegie Mellon University)
首先,研究人员使用智能手机拍摄围绕对象头部的 15~20 秒短视频。为收集尽可能多的数据(图像帧数),Lucey 团队还使用了 iPhone X 的慢速摄影功能。
然后,其借助一种被称作视觉同时定位和制图(SLAM)的现有技术,来确定面部的基本几何形状。其通过对面部表征上的点位开展三角剖分,来计算对应的形状和手机相对于面部的距离。
接着,基于深度学习的算法可用于识别对象的面部轮廓,以及眼耳口鼻等“地标”的相对位置。为填补其它“空白”数据,还需要用到传统的“网格拟合”计算机视觉技术。
尽管整个过程需要 30~40 分钟,但其最大的特点是单纯可以依靠一部智能手机来完成。3D 模型不仅看起来逼真、细粒度也达到了亚毫米级,较此前开发的类似装置提升了不少。
最后,研究团队希望这项技术能够应用于诸多领域,比如游戏中玩家化身的创建,医学、或生物特征识别等场景。
有关该团队的工作详情,已在上月初于科罗拉多举办的 IEEE 冬季计算机视觉应用大会上发表。
本文素材来自互联网