In diesem Inhalt wird beschrieben, wie simulierte humanoide Roboter mithilfe von fünf neuen Verstärkungslernpapieren darauf trainiert wurden, zu kämpfen. Die fünf verwendeten Algorithmen sind: Deep Deterministic Policy Gradient (DDPG), Decision Transformer, Soft Actor-Critic (SAC), Imagination-Augmented Agents (I2A) mit Proximal Policy ...