Diffusion-HPC:利用逼真的人类生成合成图像

近期的文本到图像生成模型表现出了惊人的能力,可以生成高保真度和逼真的图片。然而,尽管视觉效果卓越,这些模型经常难以保留生成物中的合理人类结构。由于这个原因,虽然生成模型通过生成大量的合成数据已经显示出帮助下游图像识别任务的良好前景,但它们仍然不可行于改进下游人体姿态感知和理解。在这项工作中,我们提出了一种基于文本条件的方法——Diffusion model with Human Pose Correction(Diffusion HPC),它通过注入关于人体结构的先验知识来生成具有合理姿态人类的逼真照片。我们展示了Diffusion HPC有效地提高了人体生成物的逼真度。此外,由于生成物伴随着3D网络,可以作为基准,Diffusion HPC生成的图像-网格对非常适合下游的人体网格恢复任务,其中长期以来一直存在着3D训练数据不足的问题。

论文链接:http://arxiv.org/pdf/2303.09541v1

更多计算机论文:http://cspaper.cn/

Related posts