在2024 European Conference on Computer Vision (ECCV, 9.29-10.04,意大利-米兰) 中,上海期智研究院PI弋力、赵行、许华哲各团队共计发布7项
许华哲 成果收录于ECCV 2024
上海期智研究院PI、清华大学助理教授许华哲团队,提出了一种新的机器人操控框架Robo-ABC,使机器人能够泛化地理解和操作在训练时未见过的类别的物体。此外,团队利用视频扩散模型的生成能力,提出了一种从专家视频中提取密集奖励信号的新框架。相关2项成果收录在今年的计算机视觉领域的顶级学术会议之一ECCV 2024。
赵行 成果收录于ECCV 2024
上海期智研究院PI、清华大学助理教授赵行团队,设计了新的感知框架PreSight,使用过去观测信息重建可泛化的城市级先验,为解决自动驾驶在线感知难的问题提供了新的思路。此外,团队利用时序信息在三维空间中构建匹配代价的占据栅格预测方法,显著提升模型的空间理解能力。相关2项成果收录在今年的计算机视觉领域的顶级学术会议之一ECCV 2024。
弋力 成果收录于ECCV 2024
在计算机视觉领域的顶级学术会议2024 European Conference on Computer Vision (ECCV, 9.29-10.04,意大利-米兰) 中,上海期智研究院PI弋力、赵行、许华哲各团队共计发布7项最新科研成果 (录用率~ 18%)。近期将陆续发布ECCV专题学术成果分享。
近期,上海期智研究院人工智能方向的陈建宇、高阳、许华哲三位PI科学家团队,3项突破性的科研成果被机器人领域难度最高的顶会Robotics: Science and Systems (RSS 2024)
陈建宇 成果收录于RSS 2024
陈建宇团队联合星动纪元在具身智能领域取得重要突破,提出了一种新颖的人形机器人学习算法框架DWL,有效去除真实世界噪声扰动,在全球范围内首次通过端到端RL和零样本仿真到真实转换,实现人形机器人通用适应各类复杂的现实世界地形。
高阳 成果收录于RSS 2024
高阳团队提出了策略学习的任意点轨迹模型 (Any-point Trajectory Modeling,ATM),通过预训练轨迹模型来预测视频帧内任意点的未来轨迹,从而利用视频为机器人提供演示。训练完成后,这些轨迹将提供详细的控制指导,实现小样本动作标签演示数据训练鲁棒的机器人操作策略。
许华哲 成果收录于RSS 2024
许华哲团队提出了一种新颖的视觉模仿学习方法 3D扩散策略 (DP3)。在涉及72个模拟任务的实验中,DP3仅通过10条演示数据就成功完成了大多数任务,并且相对于当前SOTA模型有24.2%的成功率相对提升。在4个非常具有挑战性的真机任务中,DP3展示了精确的控制能力。极大地提高了视觉模仿学习的学习效率和泛化能力。
高鸣宇 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授高鸣宇团队在隐私保护的机器学习一系列重要研究成果,成果收录在今年的ICML 2024中。
张景昭 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授张景昭团队在参数高效微调算法取得了重要研究成果,相关成果收录在今年的ICML 2024中。
房智轩 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授房智轩团队,近期在多臂老虎机算法等方面取得了一系列重要研究成果,成果收录在今年的ICML 2024中。
许华哲 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授许华哲团队,近期在强化学习的算法和理论创新方面取得了一系列成果。团队提出了因果感知熵正则化策略、逐点递归结构等方法,提高学习效率、探索效率和整体性能,对强化学习领域及机器人任务等复杂场景具有显著的应用价值。相关3项成果收录在今年的ICML 2024中,其中关于因果感知熵正则化策略ACE的论文被大会选为口头报告(Oral,录取率1.6%)。
袁洋 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授袁洋,近期在聚焦于自监督学习 (Self-Supervised Learning, SSL) 的理论和方法,尤其是在理解不同自监督学习方法的内在机制和提高学习效果方面取得了一系列重要研究成果。将矩阵信息理论应用于自监督学习中,以此来分析和改进学习方法,对自监督学习领域具有重要价值。相关2项成果收录在今年的ICML 2024中。
吴翼 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授吴翼团队,近期在大语言模型对齐、大模型策略智能体框架、自适应梯度策略优化等方面取得了一系列重要研究成果。对大模型与人类偏好对齐,及强化学习领域复杂决策制定具有重要价值。相关3项成果收录在今年的ICML 2024中,其中关于使用PPO算法进行大模型对齐训练的论文被大会选为口头报告 (Oral,录取率1.6%) 。
高阳 成果收录于ICML 2024
上海期智研究院PI、清华大学助理教授高阳团队团队提出EfficientZero V2算法,将EfficientZero的性能扩展到了多种领域,在有限数据设置下在各种任务中均以较大的优势超越了当前的SOTA。研究成果被2024年国际机器学习大会(ICML 2024)收录为Spotlight论文 (Top 3.5%)。