12月3日,星期五,下午3点

所有讲座将于每周五下午三时在网上举行 ODU DL: ECE 731 831研究生研讨会
欲了解更多信息,请联系Dr. 钟浩陈,电话:(757)683-3475或电子邮件 cxchen@0933282516.com.

Seminar Topic:

公平分配资源 & 学习:具有公平约束的组合睡眠强盗

Abstract:

多臂强盗(MAB)模型被广泛用于研究许多实际优化问题(如网络资源分配), ad placement, crowdsourcing, etc.),参数未知. 玩家的目标是什么.e.(即决策者)在面对不确定性时最大化累积回报. However, 在许多实际应用中,基本的MAB模型忽略了系统的几个重要因素, where multiple arms (i.e.(游戏邦注:例如,动作)可以同时进行,手臂有时可以“睡觉”.e., unavailable). 除了奖励最大化之外,确保公平也是实践中的一个关键设计关注点. To that end, 在这次演讲中,我们将首先介绍一个新的具有公平性约束的组合睡眠MAB模型, called CSMAB-F, 旨在解决前面提到的关键建模问题. 现在的目标是最大化奖励,同时满足每个单独手臂的最小选择分数的公平性要求. 解决这个新问题, 我们扩展了一个在线学习算法, 称为上置信界限(UCB), 利用虚拟队列技术处理开发与探索之间的关键权衡,合理处理公平性约束. 通过仔细集成这两种技术, 我们开发了一种新的算法, 名为公平保证学习(LFG), for the CSMAB-F problem. 进一步,我们严格地证明了LFG的可行性-最优性和遗憾上界. Finally, 我们将提供仿真结果来证实所提出算法的有效性. Interestingly, 仿真结果揭示了遗憾和收敛到满足公平性约束的点的速度之间的重要权衡.


Speaker:

Dr. 季波,弗吉尼亚理工大学计算机科学系副教授

Bio:
Dr. Bo Ji received his B.E. and M.E. 毕业于浙江大学信息科学与电子工程专业, Hangzhou, China, in 2004 and 2006, respectively, and his Ph.D. 获得俄亥俄州立大学电气与计算机工程学位, Columbus, OH, USA, in 2012. Dr. 他是弗吉尼亚理工大学计算机科学系副教授, Blacksburg, VA, USA. 在加入弗吉尼亚理工大学之前, 他是天普大学计算机与信息科学系的副教授,也是网络计算中心的教员, 2014年7月至2020年6月担任助理教授. 他也是AT的高级技术人员&2013年1月至2014年6月,任职于加州圣拉蒙的T实验室. 他的研究兴趣是建模, analysis, control, optimization, 以及计算机和网络系统的学习, 比如有线和无线网络, 大规模物联网系统, 高性能计算系统和数据中心, 网络物理系统. 他曾担任WiOpt 2021的联合主席和ITC 2021的技术项目联合主席, 他还曾在各种IEEE/ACM期刊(IEEE/ACM Transactions on Networking)的编辑委员会任职, IEEE网络科学与工程学报, IEEE物联网杂志, 和IEEE通信学会开放杂志). Dr. 他是IEEE的高级会员,也是ACM的会员. 他是美国国家科学基金会(NSF) CAREER奖获得者(2017)和美国国家科学基金会CISE研究启动计划(CRII)获得者(2017)。. 他也是IEEE INFOCOM 2019最佳论文奖的获得者.