作者:Mehmet Aygün Oisin Mac Aodha 我们介绍了SAOR,这是一种从野外拍摄的单个图像中估计关节物体的3D形状、纹理和视点的新方法。与以前依赖预定义的特定…
Read More分类: arxiv
持久的自然:无边界三维世界的生成模型 Persistent Nature: A Generative Model of Unbounded 3D Worlds
作者:Lucy Chai Richard Tucker Zhengqi Li Phillip Isola Noah Snavely 尽管图像质量越来越逼真,但最近的3D图像生成模型…
Read More文本到图像扩散模型中的消融概念 Ablating Concepts in Text-to-Image Diffusion Models
作者:Nupur Kumari Bingliang Zhang Sheng-Yu Wang Eli Shechtman Richard Zhang Jun-Yan Zhu 大规模的…
Read More改进开放式词汇检测特征对齐的三种方法 Three ways to improve feature alignment for open vocabulary detection
作者:Relja Arandjelović Alex Andonian Arthur Mensch Olivier J. Hénaff Jean-Baptiste Alayrac …
Read MoreJWST MIRI Si中的Brighter Fatter效应:作为IBC探测器I.观测、对科学的影响和建模 The Brighter-Fatter Effect in the JWST MIRI Si:As IBC detectors I. Observations, impact on science, and modelling
作者:Ioannis Argyriou Craig Lage George H. Rieke Danny Gasman Jeroen Bouwman Jane Morrison M…
Read More教学视频中任务结构的学习与验证 Learning and Verification of Task Structure in Instructional Videos
作者:Medhini Narasimhan Licheng Yu Sean Bell Ning Zhang Trevor Darrell 鉴于网上有大量的教学视频,从视频中学习一系…
Read More教学视频中任务结构的学习与验证 Learning and Verification of Task Structure in Instructional Videos
作者:Medhini Narasimhan Licheng Yu Sean Bell Ning Zhang Trevor Darrell 鉴于网上有大量的教学视频,从视频中学习一系…
Read MoreVideoXum:视频的跨模态视觉和文本摘要 VideoXum: Cross-modal Visual and Textural Summarization of Videos
视频摘要旨在从源视频中提取最重要的信息,以产生简略的剪辑或文本叙述。传统上,根据输出是视频还是文本,提出了不同的方法,因此忽略了视觉摘要和文本摘要这两个语义相关任务之间的相关性。我…
Read More动作至关重要:神经动作转移以提高相机生理感知能力 Motion Matters: Neural Motion Transfer for Better Camera Physiological Sensing
基于相机的生理测量的机器学习模型可能因缺乏代表性的训练数据而具有弱的泛化能力。在从视频中恢复微弱的心脏脉搏时,身体运动是最显著的噪音来源之一。我们探索了运动转移作为一种数据增强形式…
Read More一种新的方法用于在有限异构化学势条件下识别晶格量子色动力学中无偏指数再求和的破缺。 A new way to identify the breakdown of the unbiased exponential resummation in Lattice QCD at a finite isospin chemical potential
在格点QCD中,无偏指数重求和方法在真实有限异性化学势$\muI$下的有限温度计算不会出现费米符号问题。虽然这表明原则上可以在所有真实有限$\muI$值下继续计算,但是最近的研究表…
Read More