информации мало. не понятно какие вводные данные. Работ по этой тематики очень много.
Опишите задачу точнее, смогу точнее посоветовать в какую сторону копать.
Как пример, могу предложить почитать свою работу.
Reinforcement Learning of Multi-Robot Coordination Based on Resource Spending Velocity
[
read full text: 70pages] [
read presentation]
Adaptive Multi-Robot Coordination: A New Perspective
[
read full text: 8pages 323KB]
Adaptive Game-Theoretic Multi-Robot Coordination Based on Resource Spending Velocity
[http://http://daner.biu.googlepages.com/aamas09dan-EA.pdf -> read EA text: 2pages 156KB] [
see poster: 1.3MB]