dqn

为什么我的DQN代理的训练效率这么低？

英文: Why is my DQN-agent's training so inefficient? 问题我正在尝试训练一个代理程序，让它作为第二个玩家（第一个玩家随机行动）完美地玩井字游戏...

2023年5月28日136评论

英文: In a DQN for Q-learning, how should I apply high gamma values during experience replay? 问题我正在使用...

2023年5月21日109评论