排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
通过研究包含通信的多智能体强化学习中通信图的邻接矩阵,发现消息聚合的同质性可通过矩阵的秩来衡量。使用核范数,即以矩阵秩的凸包络代替秩进行优化,进一步提出一种即插即用的正则化器“核范数正则化”以约束邻接矩阵,可主动丰富消息聚合策略的多样性。以交通路口和星际争霸II作为实验场景进行验证,使用核范数正则化增强的图注意力网络进行消息聚合,比较相应的训练效率。实验结果表明,相比于现有的消息聚合方法,该方法可得到更多样的消息聚合策略,获得更好的任务性能。此外,该方法易于集成到现有的图建模多智能体通信方法,而且可有效提高其性能。 相似文献
1