上海期智研究院PI、清华大学助理教授房智轩团队近期在网络系统在线学习与最优决策方面,取得重要进展。团队基于带约束的在线学习方法,设计了一系列算法,使得缺乏先验知识的决策者可以在满足应用需求与资源约束的
房智轩 成果收录于ACM SIGMETRICS 2024
研究了具有收敛动力学的演化系统最优控制,使决策者在缺乏系统稳态反馈先验知识的情况下,能通过使用设计的“乐观-悲观收敛和置信界限算法 (OP-C2B)”,缩减学习与等待的时间,在带有期望约束的在线控制问题中同时实现亚线性的遗憾值和约束违背。该成果对设计和分析用于控制收敛动态系统的算法具有重要价值。
房智轩 成果收录于INFOCOM 2024
房智轩团队针对物联网环境中广泛存在的信息收集调度问题,提出了一种高效的在线调度策略,能够在未知信息价值和信道条件下实现高效的信息收集。在无线网络系统中,多个传感器或信息源持续收集信息并将数据传输给监视器。这一过程中,监视器面临两个主要挑战:一是不同信息源的数据对监视器的价值不同,但监视器对这些数据价值的先验统计知识是未知的;二是无线通信带宽有限且不稳定,信息源与监视器之间的无线信道可靠性(如丢包率)也是未知的。 为了解决监视器缺乏信息源数据价值的先验知识和无线信道不稳定
房智轩 成果收录于AAAI 2024、ICML 2024
研究了具有收敛动力学的演化系统最优控制,使决策者在缺乏系统稳态反馈先验知识的情况下,能通过使用设计的“乐观-悲观收敛和置信界限算法 (OP-C2B)”,缩减学习与等待的时间,在带有期望约束的在线控制问题中同时实现亚线性的遗憾值和约束违背。该成果对设计和分析用于控制收敛动态系统的算法具有重要价值。
弋力 成果收录于CVPR 2024
此外,弋力团队与香港科技大学谭平教授团队合作研究的关于通用NeRF编辑的成果也发表于CVPR 2024。
弋力 成果收录于CVPR 2024
弋力团队近期在手物交互的理解与生成方面取得了卓越的研究成果。团队紧密围绕手物交互的不同层面展开,从数据集构建到去噪方法,再到通用人机交接技能的学习,形成了一个完整的研究链条。不仅拓展了现有的研究范围,更为虚拟现实、机器人操作和人机协作等领域研究提供了新思路。相关3项成果收录在今年的计算机视觉领域的顶级学术会议之一Conference on Computer Vision and Pattern Recognition(CVPR 2024,录用率为23.6%)。
近期,上海期智研究院信息安全方向的郁昱、陈一镭、高鸣宇、宋一凡四位PI科学家团队在信息安全和密码学国际顶会Eurocrypt (European Cryptology Conference)、STOC
郁昱 成果发表于Eurocrypt 2024
郁昱 上海期智研究院PI、上海交通大学教授 LPN问题已在密码学中得到广泛应用,最近被用于设计PCG类相关随机数生成协议,进而被应用在安全多方计算、零知识证明和私有集合交集等密码协议中。郁昱团队系统研究了PCG应用中LPN问题的困难性,获得了以下三方面的研究成果
宋一凡 成果收录于Eurocrypt 2024
对于一类泄露函数L,可容忍泄露的隐私电路要求对于电路内部的任意L范围内的信息泄露可以规约到对于输入和输出的L范围内的信息泄露。可容忍泄露的隐私数据可以被用来设计安全硬件以防范侧信道攻击并提供理论基础。宋一凡团队给出了首个针对计算深度1的全局泄露函数类的可容忍泄露隐私电路的构造,同时团队给出了从无状态隐私电路到有状态隐私电路的一般性构造。
陈一镭 STOC 2024
陈一镭 上海期智研究院PI、清华大学助理教授 最近在理论计算机领域对于显示构造问题的研究中,引入了一种系统性的方法,通过使用元问题(meta problems)来探索显式构造问题的复杂性,即值域规避问题(缩写为Avoid)和远点问题(缩写为RPP)。这些元问题的上限和下限为之前独立研究的特定显式构造问题的复杂性提供了统一的视角。以前的工作很大程度上未解决的一个有趣问题是:Avoid和RPP 对于简单电路(例如低深度电路)是否困难。
郁昱 成果收录于IEEE S&P 2024
设计恶意敌手模型下关于RAM程序实际高效的安全两方计算协议是一个具有挑战性的研究目标。郁昱团队提出了主动安全的分布式点函数协议,允许至多一比特信息泄露,达到了与被动安全协议相同的效率;进一步结合双协议执行技术设计了RAM模型下主动安全的两方计算协议,全局允许至多一比特信息泄露,达到了与被动安全RAM计算协议几乎相同的效率,比之前主动安全的RAM计算协议快约100倍,从而提供了一种效率-安全权衡的实际解决方案。
高鸣宇 成果收录于IEEE S&P 2024
高鸣宇 上海期智研究院PI、清华大学助理教授 可信执行环境的侧信道防御是一个广受关注的课题。高鸣宇团队发现对于最广泛存在的基于内存访问模式的侧信道攻击,其防御方式ORAM的初始化过程很少被研究。经过充分调研,团队发现其过程有着大量的应用场景,并提出使能ORAM的批量化加载算法Bulkor。相较于之前的工作,Bulkor在保证高安全性的情况下实现了大幅度的性能提升。该算法有助于ORAM在更多场景下的应用。
陈建宇 成果收录于ICRA 2024
陈建宇 上海期智研究院PI、清华大学助理教授 人形机器人的全身控制是一个具有挑战性的课题。陈建宇团队提出一种去中心化的复杂机器人控制算法DEMOS,在不牺牲任务性能的前提下,鼓励机器人在强化学习过程中自主发现可以解耦合的模块,同时保留必要合作模块之间的连接。该算法为机器人的设计和开发提供了新的视角,特别是在需要高度自主性和适应性的领域,如搜索和救援、探索和工业自动化。
高阳 成果收录于ICRA 2024
高阳 上海期智研究院PI、清华大学助理教授 高阳团队在机器人任务规划和执行领域取得重要进展,在ICRA 2024 workshop 中将展示2项重要成果—CoPa和VILA算法框架。ViLa侧重于高层任务规划,CoPa侧重低层子任务执行,两个工作都基于视觉语言模型(VLM)GPT-4V。展示了在复杂和开放世界任务中,机器人能够如何利用先进的人工智能技术来提高其自主性和适应性。
吴翼 成果收录于ICRA 2024
吴翼团队在四足机器人执行类人双足运动研究中取得重要进展,在ICRA 2024上发表2项成果。提出了一个分层框架,能够响应人类视频或自然语言指令,实现模仿拳击、芭蕾舞等动作,并与人类进行物理互动。提出了LAGOON系统,它使用预训练模型生成人类动作,然后通过强化学习在模拟环境中训练控制策略,以模仿生成的人类动作,并通过领域随机化将学习到的策略部署到真实世界的四足机器人上,实现了如“后空翻”、“踢球”等复杂行为。
赵行 成果收录于ICRA 2024
赵行团队在离线强化学习能够超越专家性能、无需危险环境交互的特性,提出了HsO-VP框架,实现了纯粹基于离线数据的长程运动规划。框架通过变分自编码器(VAE)从离线演示中学习技能,解决自动驾驶中的长期规划问题。设计了双分支序列编码器,有效应对后验坍塌问题。为自动驾驶车辆规划提供了一种新的强化学习方法。
弋力 成果收录于ICRA 2024
弋力团队在机器人视觉与触觉感知领域研究中取得重要进展,通过自监督学习和多模态数据融合来提升机器人对环境的理解和交互能力,在ICRA 2024上发表2项成果。提出了一种自监督的跨模态对比学习方法CrossVideo,通过模态内和跨模态的对比学习技术,提高点云视频理解的性能。团队提出了一种触觉增强的6D姿态跟踪系统TEG-Track,用于跟踪手中持有的未见过的物体。该方法在合成和真实世界场景中均能一致性地提升最先进的通用6D姿态跟踪器的性能。相关成果可运用推广到机器人导航、增强现实、自动化驾驶等领域。
许华哲 成果收录于ICRA 2024
许华哲团队在机器人学习与操作研究中取得重要进展,在ICRA 2024上发表2项成果。运用强化学习算法实现通用分布式操作的系统ArrayBot,通过触觉传感器进行操作学习,可用于真实世界的多种操作任务,展示了在模拟环境训练后无需领域随机化即可迁移至真实机器人的能力。提出了一种新型的手对手模仿学习可穿戴灵巧手HIRO Hand,它结合了专家数据收集和灵巧操作的实现,使操作者能够利用自己的触觉反馈来确定适当的力量、位置和动作,以执行更复杂的任务。
高阳 成果收录于ICLR 2024
高阳团队主要围绕着模仿学习和机器人感知部分开展了一系列算法攻关研究。三项成果收录于此次ICLR会议。该团队提出了Seer视频预测算法,根据机器人感知的第一帧图像预测未来图像,完成对于所需完成任务的规划。ADS算法根据一个没有动作的演示视频,比如Seer生成的视频去进行模仿学习,为机器人从人类视频中学习铺平了道路。RelatiViT模型则解决了机器人对于物体之间相互关系之间的感知。
吴翼 成果收录于ICLR 2024
吴翼团队在强化学习训练系统抽象层面提出了创新设计方案,自主设计并开发了能够部署在一万个计算核心上进行强化学习的分布式系统SRL。通过创新的数据流抽象和高效的架构设计,在多个核心上实现了可扩展、高效和可扩展的强化学习训练,显著提高了训练吞吐量和学习性能。本系统吞吐量和样本效率能够达到最佳开源系统的21倍,达到OpenAI闭源系统的5倍。
许华哲 成果收录于ICLR 2024
许华哲团队主要围绕强化学习算法领域的数据效率和算法性能等方向,开展了一系列攻关研究,四项成果收录于此次ICLR会议,例如DrM显著提升了视觉强化学习的数据效率,COPlanner 显著提升了基于模型的强化学习的数据效率,LaMo利用预训练模型提升了离线强化学习的能力,Uni-O4则是将离线强化学习与在线强化学习连接,相关成果对自动化控制和机器人学的发展研究具有重要意义。
弋力 成果收录于ICLR 2024
弋力团队提出了多模态大型语言学习框架DREAMLLM和一套通用泛化的手物交互去噪算法GeneOH Diffusion
张景昭 成果收录于ICLR 2024
张景昭团队研究了分布式深度学习中的数据并行训练问题, 提出了Quadratic Synchronization Rule(QSR)的新方法,不仅考虑了通信成本和优化速度之间的权衡,而且还考虑了同步周期H对模型泛化能力的影响,在减少通信量和提高测试准确率方面的显著效果。