上海期智研究院PI,清华大学交叉信息研究院助理教授。
博士毕业于清华大学交叉信息研究院,本科毕业于北京大学物理学院,在加入清华大学之前,曾在香港中文大学任博士后研究员。目前研究兴趣专注于使用博弈论、机器学习、网络优化等方法研究区块链、多智能体等去中心化系统中的通信与协同理论,设计并优化相关的共识、通信、决策机制与算法。
区块链系统:高性能、激励相容的区块链系统设计与分析
多智能体博弈学习:多智能体协作、博弈、学习、决策的基础理论
去中心化计算:去中心化网络系统中的高效可信计算
成果5:具有收敛动力学的演化系统最优控制—OP-C2B(2024年度)
许多复杂系统对决策者的动作具有即时反馈,但其反馈需要较长时间才能收敛到稳态。这给没有先验知识的决策者带来了很大的困难,因为决策者需要精细地控制对系统收敛过程的探索与等待时长,从而保证学习精度与效率的平衡。这种动态系统的决策控制问题在许多现实领域中都可以观察到,如无线网络中的动态调度控制,多阶段的多智能体博弈等。
房智轩团队研究了具有收敛动力学的演化系统最优控制,使决策者在缺乏系统稳态反馈先验知识的情况下,能通过使用设计的“乐观-悲观收敛和置信界限算法Optimistic-Pessimistic Convergence and Confidence Bounds (OP-C2B)”,当等待某个动作接近稳态不值得时就迅速切换行动,来缩减学习与等待的时间。该算法通过利用“收敛界限”来确定系统离稳定状态有多远,并通过在维持对可行的动作集的悲观评估的同时在该集合内进行乐观动作选择来实现的。
图1. OP-C2B 算法
团队证明OP-C2B算法能够在有限动作集的情况下,保证亚线性的遗憾值和约束违背。特别地,当系统的收敛速率是线性或超线性时,OP-C2B可实现对数级的遗憾值和约束违背。此外,团队还将该算法推广到无限的决策者动作集,并证明了在移动众包和资源分配等重要的博弈控制场景中展示了算法的优越性。
图2. 收敛动力学示意图
为算法提供了理论上的性能界限,对设计和分析用于控制收敛动态系统的算法具有重要价值。
论文信息:Learning the Optimal Control for Evolving Systems with Converging Dynamics, Qingsong Liu and Zhixuan Fang, Proceedings of the ACM on Measurement and Analysis of Computing Systems (POMACS), volume 8, 2024. (Accepted directly through ACM SIGMETRICS 2024 as the full version)
------------------------------------------------------------------------------------------------------------------------------
成果4:带有QoS约束的信息采集中的在线调度(2024年度)
房智轩团队针对物联网环境中广泛存在的信息收集调度问题,提出了一种高效的在线调度策略,能够在未知信息价值和信道条件下实现高效的信息收集。在无线网络系统中,多个传感器或信息源持续收集信息并将数据传输给监视器。这一过程中,监视器面临两个主要挑战:一是不同信息源的数据对监视器的价值不同,但监视器对这些数据价值的先验统计知识是未知的;二是无线通信带宽有限且不稳定,信息源与监视器之间的无线信道可靠性(如丢包率)也是未知的。
为了解决监视器缺乏信息源数据价值的先验知识和无线信道不稳定情况下的挑战,房智轩团队假设每个信息源生成的数据包的信息价值是独立的随机变量,并将调度问题建模为受吞吐量约束的组合多臂老虎机问题。其中每个信息源可视为一个“臂”,数据包的信息价值则为奖励。
图1. 系统模型
针对这一模型,他们提出了一种基于线性规划(LP)的高效在线调度策略,并证明了该策略在满足每个信息源的QoS约束的同时,仅产生对数遗憾。对于无线信道丢包率已知的特殊情况,该调度策略还能够进一步保证有界遗憾。
图2. 与静态奖励的性能界限的比较
此外,对于非静态包值情况,房智轩团队应用滑动窗口技术对基于LP的调度策略进行了改进,证明了在满足每个信息源的QoS要求的同时,依然能够保证次线性遗憾。团队还通过数值模拟验证了理论结果,进一步展示了所提策略在各种实际场景中的优越性。
该研究为物联网环境中的在线信息收集提供了新的解决方案,特别是在考虑QoS约束的情况下,对于如何设计和分析高效的调度策略提供了新的视角和工具。
论文信息:Learning-based Scheduling for Information Gathering with QoS Constraints, Qingsong Liu, Weihang Xu, and Zhixuan Fang, INFOCOM 2024.
------------------------------------------------------------------------------------------------------------------------------
成果3:带有QoS约束的分布式调度:基于多人多臂老虎机模型的O(1)遗憾(2024年度)
分布式多人多臂老虎机(MP-MAB)模型在解决网络科学和运筹学中的各种问题方面具有重要应用。 房智轩团队面向去中心化的网络系统,研究了通信受限、缺乏组织的多用户间的资源分配与服务保障问题。
图1. 队列系统模型
团队还进一步揭示了MP-MAB模型与在线队列系统之间的关系,并说明他们的算法还能够保证队列系统的稳定性。通过理论分析和数值模拟,他们验证了算法在实际场景中的有效性和优越性,展示了其在网络优化和资源分配中的广泛应用前景。
图2. AdeQoS 算法
图3. 共识协议
该研究对分布式资源分配和网络优化等领域具有重要的理论和实践意义。
论文信息:Decentralized Scheduling with QoS Constraints: Achieving O(1) QoS regret of Multi-player Bandits, Qingsong Liu and Zhixuan Fang, AAAI 2024.
------------------------------------------------------------------------------------------------------------------------------
成果2:基于弱区块信号的有向无环图区块链交易选择协议(2023年度)
基于有向无环图(DAG)的区块链允许多个区块并发地添加到系统中,从而提高区块链系统的吞吐性能。但现实中并发的区块中可能会包含相同的交易,而这些冗余的交易碰撞会降低系统的利用率,甚至可能还会严重影响系统性能。
基于DAG的区块链由于高并发和网络延迟而面临交易碰撞的关键挑战,房智轩团队提出了“We-TIPS”,一种基于弱区块的交易包含协议,利用弱区块头的信息传递来解决这一关键挑战。在We-TIPS中,矿工可以在挖矿过程中将其弱区块头作为信号提前进行广播,该信号可以指示矿工当前的交易包含情况。通过信号的及时广播,矿工可以有效避免交易选择碰撞,提升吞吐性能。此外,作者在We-TIPS协议中研究了矿工之间的交易选择博弈,并证明该博弈本质就是一个势博弈(Potential Game),并进一步设计了一种可以实现近似纳什均衡的去中心化算法。该方法在实验中最高实现了98%的区块利用率,大幅领先现有方案。
该成果获得了无线网络优化领域顶会WiOpt 2023的最佳论文提名奖(Best paper candidate)。
该成果研究论文:
Canhui Chen and Zhixuan Fang, “We-TIPS: Weak-Block-Based Transaction Inclusion Protocol with Signaling in DAG-based Blockchain,” Proceedings of the 21th International Symposium on Modeling and Optimization in Mobile, Ad hoc, and Wireless Networks (WiOpt), August 2023. (Best Paper Candidate) 查看PDF
------------------------------------------------------------------------------------------------------------------------------
成果1:拍卖视角下的区块链挖矿机制分析(2023年度)
抽卡销售(Gacha Game)是一种特殊的销售方式。与传统的直接出售商品不同,卖方向买方出售抽奖的机会。买方的每次抽取将以一个预设的(可变)概率胜出,从而获得该商品。抽卡销售广泛应用于各类销售中,如彩票和游戏中虚拟商品的销售。
针对这种复杂的销售模式,房智轩团队首次研究提出了严密的数学建模框架,将买方的顺序决策建模为马尔可夫决策过程(MDP),并给出了抽卡销售种卖家收益最大化策略的必要条件。此外,作者展示了抽卡销售与单一物品、单一买家拍卖(single-item single-bidder auction)的等价性,从而导出能够实现最大卖方收益的最优参数。此外,该工作的结果还证实当玩家有预算约束时,抽卡销售可以比拍卖带来更高的卖方收益。
与此同时,房智轩团队解释了抽卡销售模型与区块链挖矿过程的对应关系。其中,卖家对应区块链系统,而买家则对应矿工。区块链系统(卖家)希望最大化系统的安全性(即“销售利润”),而增强系统安全性的方法就是增加买家(矿工)的哈希尝试次数或者资产抵押数量(即卖家的抽取次数)。这种对应关系指出了区块链系统安全性与用户投入的内生关系,从而给出了进一步利用成熟的拍卖理论来指导区块链最优设计的可能。
该成果发表在计算机性能建模与分析的顶级会议ACM SIGMETRICS 2023上。
该研究成果论文:Canhui Chen and Zhixuan Fang,“Gacha Game Analysis and Design,” in Proceedings of the ACM on Measurement and Analysis of Computing Systems (POMACS), 2023. [Accepted directly through ACM SIGMETRICS 2023] 查看PDF
27. On Multi-Armed Bandit with Impatient Arms, Yuming Shao, Zhixuan Fang,http://openreview.net/pdf?id=j35VcooKG8, ICML 2024.
26. Learning the Optimal Control for Evolving Systems with Converging Dynamics, Qingsong Liu and Zhixuan Fang, Proceedings of the ACM on Measurement and Analysis of Computing Systems (POMACS), volume 8, 2024. (Accepted directly through ACM SIGMETRICS 2024 as the full version)
25. Learning-based Scheduling for Information Gathering with QoS Constraints, Qingsong Liu, Weihang Xu, and Zhixuan Fang, INFOCOM 2024.
24. Decentralized Scheduling with QoS Constraints: Achieving O(1) QoS regret of Multi-player Bandits, Qingsong Liu and Zhixuan Fang, AAAI 2024.
23. On Multi-Armed Bandit with Impatient Arms, Yuming Shao and Zhixuan Fang, ICML 2024.
22. Canhui Chen, Zhixuan Fang, We-TIPS: Weak-Block-Based Transaction Inclusion Protocol with Signaling in DAG-based Blockchain, WiOpt, 2023 查看PDF
21. Rongwu Xu, Sen Yang, Fan Zhang, Zhixuan Fang, MISO: Legacy-compatible Privacy-preserving Single Sign-on using Trusted Execution Environments, Euro S&P, 2023 查看PDF
20. Canhui Chen, Zerui Cheng, Shutong Qu, Zhixuan Fang, Crowdsourcing Work as Mining: A Decentralized Computation and Storage Paradigm, APNET, 2023 查看PDF
19. Canhui Chen, Zhixuan Fang, Gacha Game Analysis and Design, ACM SIGMETRICS, 2023 查看PDF
18. Yunshu Liu, Zhixuan Fang, Man Hon Cheung, Wei Cai, Jianwei Huang, Mechanisms Design for Blockchain Storage Sustainability, IEEE Communications Magazine, 2023 查看PDF
17. Qingsong Liu, Zhixuan Fang, Learning to Schedule Tasks with Deadline and Throughput Constraints, INFOCOM, 2023 查看PDF
16. Canhui Chen, Xu Chen, and Zhixuan Fang†, TIPS: Transaction Inclusion Protocol with Signaling in DAG-Based Blockchain, (JSAC) IEEE Journal on Selected Areas in Communications , 2023 查看PDF
15. Yunshu Liu, Shulin Ke, Zhixuan Fang, Man Hon Cheung, Wei Cai, and Jianwei Huang, A Storage Sustainability Mechanism with Heterogeneous Miners in Blockchain, (JSAC) IEEE Journal on Selected Areas in Communications, 2022 查看PDF
14. Yunshu Liu, Zhixuan Fang, Man Hon Cheung, Wei Cai, and Jianwei Huang, An Incentive Mechanism for Sustainable Blockchain Storage, (ToN) IEEE/ACM Transactions on Networking, 2022 查看PDF
13. Qingsong Liu, Weihang Xu, Siwei Wang, and Zhixuan Fang†, Combinatorial Bandits with Linear Constraints: Beyond Knapsacks and Fairness, (NeurIPS) Proceedings of the Thirty-sixth Conference on Neural Information Processing Systems, 2022 查看PDF
12. Yirui Zhang, Siwei Wang, and Zhixuan Fang†, Matching in Multi-arm Bandit with Collision, (NeurIPS) Proceedings of the Thirty-sixth Conference on Neural Information Processing Systems, 2022 查看PDF
11. Jiayuan Liu, Canhui Chen, Lulu Zhou, and Zhixuan Fang†, Real-Time Recursive Routing in Payment Channel Network: A Bidding-based Design, (WiOpt) Proceedings of the 20th International Symposium on Modeling and Optimization in Mobile, Ad Hoc and Wireless Networks, 2022 查看PDF
10. Qingsong Liu, Zhuoran Li, and Zhixuan Fang†, Online Convex Optimization with Switching Costs: Algorithms and Performance, (WiOpt) Proceedings of the 20th International Symposium on Modeling and Optimization in Mobile, Ad Hoc and Wireless Networks, 2022 查看PDF
9. Hongbo Zhang, Sizheng Fan, Zhixuan Fang, and Wei Cai, Economic Analysis of Decentralized Exchange Market with Transaction Fee Mining, (BSCI) In 2022 ACM International Symposium on Blockchain and Secure Critical Infrastructure, 2022 查看PDF
8. Jingfan Yu, Mengqian Zhang, Xi Chen, Zhixuan Fang†, SoK: Play-to-Earn Projects, arxiv, 2022 查看PDF
7. Qingsong Liu, Wenfei Wu, Longbo Huang, Zhixuan Fang†, Simultaneously Achieving Sublinear Regret and Constraint Violations for Online Convex Optimization with Time-varying Constraints, (Performance) ACM SIGMETRICS Performance Evaluation Review (IFIP Performance '21 conference), 2022 查看PDF
6. Qingsong Liu, Wenfei Wu, Longbo Huang, Zhixuan Fang†, Simultaneously Achieving Sublinear Regret and Constraint Violations for Online Convex Optimization with Time-varying Constraints, (PEVA) Performance Evaluation, 2021 查看PDF
5. Ningning Ding; Zhixuan Fang; Lingjie Duan; Jianwei Huang, Optimal Incentive and Load Design for Distributed Coded Machine Learning, (JSAC) IEEE Journal on Selected Areas in Communications, 2021 查看PDF
4. Ningning Ding; Zhixuan Fang; Jianwei Huang, Optimal Contract Design for Efficient Federated Learning With Multi-Dimensional Private Information, (JSAC) IEEE Journal on Selected Areas in Communications, 2021 查看PDF
3. Yihan Du, Siwei Wang, Zhixuan Fang, and Longbo Huang, Continuous Mean-Covariance Bandits, (NeurIPS) Proceedings of the 35th Conference on Neural Information Processing Systems, 2021 查看PDF
2. Ningning Ding; Zhixuan Fang; Lingjie Duan; Jianwei Huang, Incentive Mechanism Design for Distributed Coded Machine Learning, (INFOCOM) Proceedings of IEEE International Conference on Computer Communications, 2021 查看PDF
1. Ningning Ding, Zhixuan Fang, and Jianwei Huang, Information Disclosure Game on Sharing Platforms, (Globecom) Proceedings of The 2020 IEEE Global Communications Conference, 2021 查看PDF