首页 | 本学科首页   官方微博 | 高级检索  
     检索      

多智能体通信中的消息聚合策略多样化研究
引用本文:庄水管,庄哲明,翟远钊,戴建生.多智能体通信中的消息聚合策略多样化研究[J].实验室研究与探索,2023(10):136-139+195.
作者姓名:庄水管  庄哲明  翟远钊  戴建生
作者单位:1. 天津大学机械工程学院;2. 福建省同安第一中学;3. 国防科技大学计算机学院
基金项目:国家自然科学基金重点项目(51535008);;福建省教育科学“十四五”规划2022年度立项课题(FJJKZX22-764);
摘    要:通过研究包含通信的多智能体强化学习中通信图的邻接矩阵,发现消息聚合的同质性可通过矩阵的秩来衡量。使用核范数,即以矩阵秩的凸包络代替秩进行优化,进一步提出一种即插即用的正则化器“核范数正则化”以约束邻接矩阵,可主动丰富消息聚合策略的多样性。以交通路口和星际争霸II作为实验场景进行验证,使用核范数正则化增强的图注意力网络进行消息聚合,比较相应的训练效率。实验结果表明,相比于现有的消息聚合方法,该方法可得到更多样的消息聚合策略,获得更好的任务性能。此外,该方法易于集成到现有的图建模多智能体通信方法,而且可有效提高其性能。

关 键 词:人工智能  多智能体强化学习  核范数  图神经网络
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号