作者:Pei-Xin Shen Vivien Perrin Mircea Trif Pascal Simon 沉积在超导体表面的一系列磁性杂质形成了一个拓扑Shiba带,该带支持M…
Read MoreSAOR:单视图铰接对象重建 SAOR: Single-View Articulated Object Reconstruction
作者:Mehmet Aygün Oisin Mac Aodha 我们介绍了SAOR,这是一种从野外拍摄的单个图像中估计关节物体的3D形状、纹理和视点的新方法。与以前依赖预定义的特定…
Read More持久的自然:无边界三维世界的生成模型 Persistent Nature: A Generative Model of Unbounded 3D Worlds
作者:Lucy Chai Richard Tucker Zhengqi Li Phillip Isola Noah Snavely 尽管图像质量越来越逼真,但最近的3D图像生成模型…
Read More文本到图像扩散模型中的消融概念 Ablating Concepts in Text-to-Image Diffusion Models
作者:Nupur Kumari Bingliang Zhang Sheng-Yu Wang Eli Shechtman Richard Zhang Jun-Yan Zhu 大规模的…
Read More改进开放式词汇检测特征对齐的三种方法 Three ways to improve feature alignment for open vocabulary detection
作者:Relja Arandjelović Alex Andonian Arthur Mensch Olivier J. Hénaff Jean-Baptiste Alayrac …
Read MoreJWST MIRI Si中的Brighter Fatter效应:作为IBC探测器I.观测、对科学的影响和建模 The Brighter-Fatter Effect in the JWST MIRI Si:As IBC detectors I. Observations, impact on science, and modelling
作者:Ioannis Argyriou Craig Lage George H. Rieke Danny Gasman Jeroen Bouwman Jane Morrison M…
Read More教学视频中任务结构的学习与验证 Learning and Verification of Task Structure in Instructional Videos
作者:Medhini Narasimhan Licheng Yu Sean Bell Ning Zhang Trevor Darrell 鉴于网上有大量的教学视频,从视频中学习一系…
Read More教学视频中任务结构的学习与验证 Learning and Verification of Task Structure in Instructional Videos
作者:Medhini Narasimhan Licheng Yu Sean Bell Ning Zhang Trevor Darrell 鉴于网上有大量的教学视频,从视频中学习一系…
Read MoreVideoXum:视频的跨模态视觉和文本摘要 VideoXum: Cross-modal Visual and Textural Summarization of Videos
视频摘要旨在从源视频中提取最重要的信息,以产生简略的剪辑或文本叙述。传统上,根据输出是视频还是文本,提出了不同的方法,因此忽略了视觉摘要和文本摘要这两个语义相关任务之间的相关性。我…
Read More动作至关重要:神经动作转移以提高相机生理感知能力 Motion Matters: Neural Motion Transfer for Better Camera Physiological Sensing
基于相机的生理测量的机器学习模型可能因缺乏代表性的训练数据而具有弱的泛化能力。在从视频中恢复微弱的心脏脉搏时,身体运动是最显著的噪音来源之一。我们探索了运动转移作为一种数据增强形式…
Read More