2024-05-24
Innovation Highlights
将多信息源调度问题建模为受服务质量公平性约束的组合多臂老虎机问题。其中每个信息源可视为一个“臂”,数据包的信息价值则为奖励。团队还提出了一种基于线性规划的高效在线调度策略,并证明了该策略在保证每个信息源的采集达到吞吐量目标的同时,仅产生亚线性遗憾。
Achievements Summary
房智轩团队针对物联网环境中广泛存在的信息收集调度问题,提出了一种高效的在线调度策略,能够在未知信息价值和信道条件下实现高效的信息收集。在无线网络系统中,多个传感器或信息源持续收集信息并将数据传输给监视器。这一过程中,监视器面临两个主要挑战:一是不同信息源的数据对监视器的价值不同,但监视器对这些数据价值的先验统计知识是未知的;二是无线通信带宽有限且不稳定,信息源与监视器之间的无线信道可靠性(如丢包率)也是未知的。
为了解决监视器缺乏信息源数据价值的先验知识和无线信道不稳定情况下的挑战,房智轩团队假设每个信息源生成的数据包的信息价值是独立的随机变量,并将调度问题建模为受吞吐量约束的组合多臂老虎机问题。其中每个信息源可视为一个“臂”,数据包的信息价值则为奖励。
图1. 系统模型
针对这一模型,他们提出了一种基于线性规划(LP)的高效在线调度策略,并证明了该策略在满足每个信息源的QoS约束的同时,仅产生对数遗憾。对于无线信道丢包率已知的特殊情况,该调度策略还能够进一步保证有界遗憾。
图2. 与静态奖励的性能界限的比较
此外,对于非静态包值情况,房智轩团队应用滑动窗口技术对基于LP的调度策略进行了改进,证明了在满足每个信息源的QoS要求的同时,依然能够保证次线性遗憾。团队还通过数值模拟验证了理论结果,进一步展示了所提策略在各种实际场景中的优越性。
该研究为物联网环境中的在线信息收集提供了新的解决方案,特别是在考虑QoS约束的情况下,对于如何设计和分析高效的调度策略提供了新的视角和工具。团队在刚结束的INFOCOM 2024会议中报告了该成果。
更多信息请阅读论文:
Learning-based Scheduling for Information Gathering with QoS Constraints, Qingsong Liu, Weihang Xu, and Zhixuan Fang, INFOCOM 2024.