PyVBMC 是 Variational Bayesian Monte Carlo (VBMC) 算法的 Python 实现,用于后验和模型推断黑盒计算模型(Acerbi,2018…
Read More分类: arxiv
$P+$: 扩展文本条件在文本到图像生成中的应用
我们在文本到图像模型中引入了一个扩展文本调节空间,称为$P+$。该空间由多个文字条件组成,这些条件源自扩散模型的去噪U-Net的每个层的提示,每个条件对应一个层。 我们展示了扩展空…
Read More利用并行处理快速从2D MRI切片进行3D体积图像重建
磁共振成像(MRI)是一种非侵入性成像技术,可以详细描绘解剖特征。它可以帮助对标本器官进行功能分析,但非常昂贵。本文提出了两种方法:(i)从沿单轴的人类脊柱和脑部二维(2D)MRI…
Read More在线和动态算法的几何集合覆盖和命中集
集合覆盖和打点集是组合优化中的基本问题,在离线、在线和动态设置中都有深入研究。我们研究这些问题的几何版本,并提出了新的在线和动态算法。在线版本的集合覆盖(或命中集)中,给出 $m$…
Read More针对连续时间马尔科夫决策过程的Ω正则规范的强化学习
连续时间马尔可夫决策过程(CTMDPs)是用于表示在密集时间和随机环境下的顺序决策的经典模型。当环境的随机演变仅能通过抽样来得知时,无模型强化学习(RL)是计算最优决策序列的选择算…
Read More处理雷达数据中的混乱——使用PointNet++进行标签生成和检测。
雷达传感器用于环境感知,例如在自主车辆中,输出大量不必要的杂波。这些点,没有对应的真实物体存在,是跟随处理步骤(如物体检测或跟踪)中错误的主要来源。因此,我们提出了两种新型神经网络…
Read MoreGLASU:一种用于具有纵向分布图形数据的联邦学习的通信高效算法。
垂直联邦学习(VFL)是一种分布式学习范式,其中计算客户端基于他们共同拥有的样本的部分特征来共同训练模型。当前关于VFL的研究主要集中在样本是独立的情况下,但很少考虑到样本通过图形…
Read MoreInCrowdFormer:基于自我中心视角的地面行人世界模型
我们介绍了一种地面行人世界模型——计算模型,它可以预测行人如何在观察者周围的人群地面上移动,但只需使用观察者的自我中心视角。我们的模型 InCrowdFormer 充分利用了变形器…
Read MoreFateZero: 将注意力融合于零样本文本视频编辑
基于扩散的生成模型在基于文本的图像生成方面取得了显着的成功。然而,由于其在生成过程中包含巨大的随机性,因此在真实世界的视觉内容编辑中仍然具有挑战性,特别是在视频中。在本文中,我们提…
Read More深度度量学习用于无监督遥感变化检测
遥感变化检测(RS-CD)旨在从多时相遥感图像(MT-RSIs)中检测出相关的变化,这有助于各种遥感应用,如土地覆盖、土地利用、人类发展分析和灾害响应。现有的RS-CD方法的表现归…
Read More