选择语言
< 返回主菜单

多模态大模型框架DREAMLLM&通用泛化的手物交互算法GeneOH Diffusion

2024-05-06


1714969433961.jpg

       

       弋力团队提出了多模态大型语言学习框架DREAMLLM,首次实现了兼具多模态内容创作和理解的功能且相互促进的通用多模态大模型,并且是第一个原始数据级的完全自回归多模态大模型。该工作由弋力团队与清华大学马恺声老师团队合作完成。

       该团队还提出了一套通用泛化的手物交互去噪算法GeneOH Diffusion,用于处理手-物交互(HOI)中的去噪问题。该方法通过创新的基于接触的HOI表示GeneOH和一个新的领域泛化去噪方案来解决复杂的交互噪声问题。GeneOH Diffusion在多个基准测试中展示了其优越的有效性和泛化能力,对各种下游应用也显示出了潜力。

弋力.png

论文标题:DreamLLM: Synergistic Multimodal Comprehension and Creation

论文作者:Runpei Dong*, Cunrui Han*, Yuang Peng, Zekun Qi, Zheng Ge, Jinrong Yang, Liang Zhao, Jianjian Sun, Hongyu Zhou, Haoran Wei, Xiangwen Kong, Xiangyu Zhang, Kaisheng Ma, Li Yi

项目链接:https://dreamllm.github.io/

论文标题:GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion.

论文作者:Xueyi Liu, Li Yi

项目链接:https://meowuu7.github.io/GeneOH-Diffusion/