这篇论文系统梳理了基于扩散模型的 以人为中心的内容生成(Human-Centric Content Generation) 技术。作者将其定义为:以人类的面部、身体及其行为为核心主体的内容创作过程。这不仅要求视觉上的高保真度,更涉及身份保持、精细控制、时空一致性等多个维度的极高要求。
这确实是个比较取巧的方法,可以同时达成高质量(FID 1.54)+ 高速(1-NFE),不过 No Free Lunch Theorem 就要发问了,那么代价是什么呢? 所有生成模型都有四个评价维度,生成质量、推理速度、训练稳定性、泛化度。 1 肯定是必选的,Diffusion 是 2 不行,GAN 是 3 不行,Drifting 是 4 不行。
传统的医学图像分类模型只学习“边界”——比如这张细胞更像 A 类还是 B 类。但在真实临床中,显微镜、染色方式和医院设备各不相同,细胞形态本身也会有巨大差异,甚至会出现罕见的异常细胞。只学边界的模型在这些情况下往往会失灵。11月19日的《自然· ...
近期,国际顶级学术会议The Web Conference 2025(简称WWW 2025)在澳大利亚悉尼召开,华东师范大学陈岑副教授实验室与魔搭社区合作的论文Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions在该会议中荣获唯一最佳学生论文奖(Best Student Paper ...