中国空间科学技术 ›› 2025, Vol. 45 ›› Issue (1): 34-45.doi: 10.16708/j.cnki.1000-758X.2025.0004
• 智能航天器专栏 • 上一篇
郑鑫宇1,曹栋栋1,唐佩佳1,张轶1,彭升人1,*,周杰1,党朝辉2
ZHENG Xinyu1,CAO Dongdong1,TANG Peijia1,ZHANG Yi1,PENG Shengren1,*,ZHOU Jie1,DANG Zhaohui2
摘要: 针对高轨航天器多对多在轨服务任务规划问题,建立了考虑燃料消耗和任务时长两个优化目标的高轨航天器在轨服务任务规划模型,并提出了一种Q学习改进的多目标遗传算法(Q-learning-based Multi-objective Genetic Algorithm , QMGA)。首先,建立了基于四脉冲Lambert转移的多对多目标分配模型,并同时以速度脉冲和任务用时为目标函数,通过将问题解耦为轨道转移优化问题和目标分配优化问题实现了优化变量的降维,简化了计算过程。然后,结合Q学习提出了QMGA算法,采用Q学习在线更新多目标遗传算法的交叉概率与变异概率,提高了算法的寻优能力。最后采用QMGA算法求解模型,并将其计算结果与传统多目标遗传算法计算结果进行对比,发现QMGA算法可以得到更优的任务规划结果,计算得到的总速度增量消耗和总任务时间分别平均比MGA计算得到的结果减少了6.2%和19.7%。这一结果证明强化学习方法可进一步赋能传统智能优化方法,从而提升航天器集群任务能力。