DensePose姿态迁移，只用一张照片也能跳起舞|ECCV

原标题：DensePose姿态迁移，只用一张照片也能跳起舞|ECCV

怎样让一个面朝镜头、静止不动的妹子，跳起你为她选的舞蹈，把360度身姿全面呈现？

Facebook团队，把负责感知的多人姿势识别模型DensePose，与负责生成的深度生成网络结合起来。

不管是谁的感人姿势，都能附体到妹子身上，把她单一的静态，变成丰富的动态。

这项研究成果，入选了ECCV 2018。

团队把SMPL多人姿态模型，跟DensePose结合到一起。这样一来，就可以用一个成熟的表面模型来理解一张图片。

这项研究，是用基于表面的神经合成，是在闭环里渲染一张图像，生成各种新姿势。

照片中人需要学习的舞姿，来自另一个人的照片，或者视频截图。

DensePose系统，负责把两张照片关联起来。具体方法是，在一个公共表面UV坐标系 (common surface coordinates) 里，给两者之间做个映射。

但如果单纯基于几何来生成，又会因为DensePose采集数据不够准确，还有图像里的自我遮挡 (比如身体被手臂挡住) ，而显得不那么真实。

那么，团队处理遮挡的方法是，在表面坐标系里，引入一个图像修复 (Impainting) 网络。把这个网络的预测结果，和一个更传统的前馈条件和成模型预测结合起来。

这些预测是各自独立进行的，然后再用一个细化模块来优化预测结果。把重构损失、对抗损失和感知损失结合起来，优势互补，得出最终的生成效果。

完整的网络结构，就如上图这般。

模型的监督学习过程，是这样的：

从输入的源图像开始，先把它的每个像素对应到UV坐标系里。这一步是DensePose驱动的迁移网络完成的。

然后，负责修复图像的自编码器，就来预测照片中人的不同角度会是什么样子。这步预测，也是在扭曲的坐标系里完成的。

从右边开始，就是生成目标，同样要整合到UV坐标系中。再用损失函数来处理 (上图红字部分) 把结果输入自编码器，帮助模型学习。

用同一人物 (同样装扮) 的多个静态姿势来作监督，替代了360度旋转的人体。

先来看一下，新加入的图像修复步骤，生成的效果：

把DensePose的质地纹路，修复一下，还是有明显效果的。

再来看一下多人视频什么样子：

虽然，脸部好像烧焦的样子，但已经很鬼畜了。在下不由得想起：

另外团队用DeepFashion数据集，对比了一下自家算法和其他同行。

结果是，结构相似度 (Structural Similarity) ，以假乱真度 (Inception Score) 以及检测分 (Detection Score) 这三项指标，Facebook家的算法表现都超过了前辈。

各位请持续期待，DensePose更多鬼畜的应用吧。

论文传送门：https://arxiv.org/pdf/1809.01995.pdf

顺便一提，教人学跳舞的算法真的不少。

比如，伯克利舞痴变舞王，优点是逼真，缺点是无法实现多人共舞：

— 完 —

欢迎大家关注我们的专栏：量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

查看原文 >>

DensePose姿态迁移，只用一张照片也能跳起舞|ECCV

热门新闻

周热门

DensePose姿态迁移，只用一张照片也能跳起舞|ECCV

在中国，没有地图能显示你的真正位置

消防员de“强迫症”

种草！我会为Chanel的男士彩妆系列送出我的钱包！

白人奶奶叫孙子回家过感恩节，错发给陌生黑人小伙，三年之后……

泫雅刘星同款pose

泫雅刘星同款pose 网友调侃：刘星真的是走在潮流前端！

巨好玩 | 年终自拍大赛，我和周冬雨都靠它了

几位大妈为照相摆Pose 垃圾桶里翻出银杏叶抛洒

大妈为摆Pose 垃圾桶里翻出银杏叶抛洒

任正非小女儿身材傲人！喜欢在全球风景名胜区摆芭蕾POSE！

2018边缘计算产业峰会 ECC亮出一年成绩单

英特尔如何发力边缘计算？看这一篇就够了

边缘智能边云协同——2018边缘计算产业峰会在京盛大召开

“边缘智能 边云协同”——2018边缘计算产业峰会在京盛大召开

边缘智能边云协同：2018边缘计算产业峰会在京盛大召开

热门新闻

周热门

“边缘智能边云协同”——2018边缘计算产业峰会在京盛大召开