面向Ad-Hoc协作的局部观测重建方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

面向Ad-Hoc协作的局部观测重建方法

作者姓名：	陈皓杨立昆尹奇跃黄凯奇

作者单位：	1. 中国科学院自动化研究所智能系统与工程研究中心;2. 中国科学院大学人工智能学院;3. 中国科学院脑科学与智能技术卓越创新中心

摘要：	在多智能体强化学习的研究中，如何进行Ad-Hoc协作，也就是说如何适应种类和数量变化的队友，是一个关键问题。现有方法或者有很强的先验知识假设，或者使用硬编码的规则进行合作，缺乏通用性，无法泛化到更一般的Ad-Hoc协作场景。为解决该问题，提出一种面向Ad-Hoc协作的局部观测重建算法，利用注意力机制和采样网络对局部观测进行重建，使得算法认识到并充分利用不同局面中的高维状态表征，实现了在Ad-Hoc协作场景下的零样本泛化。在星际争霸微操环境和Ad-Hoc协作场景上与代表性算法的性能进行对比与分析，验证了算法的有效性。
关键词：	多智能体深度强化学习信用分配 Ad-Hoc协作