开发者交流平台
开发者交流平台

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。

bj
登录
  • 友情链接
站内
dqn

dqn

go

为什么我的DQN代理的训练效率这么低?

英文: Why is my DQN-agent's training so inefficient? 问题 我正在尝试训练一个代理程序,让它作为第二个玩家(第一个玩家随机行动)完美地玩井字游戏...
huangapple 2023年5月28日121评论machine-learning tensorflow
go

在DQN用于Q-learning时,如何在经验回放中应用高伽玛值?

英文: In a DQN for Q-learning, how should I apply high gamma values during experience replay? 问题 我正在使用...
huangapple 2023年5月21日87评论dqn reinforcement-learning
name
开发者交流平台
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
文章117266 留言 4 访客17111478

热门标签

pandas c++ go node.js arrays flutter reactjs python c# javascript r spring-boot android html json typescript css java sql spring

悟已往之不谏,知来者之可追!

今日
00%
已00小时
本周
00%
已过00天
本月
00%
已过00天
今年
00%
已是00月

Copyright ©  开发者交流平台 版权所有.

闽 ICP 备 2022019110 号 - 1
  • 开发者交流平台

    本页二维码