强化学习-P11强化深度学习

betball贝博app 强化学习 367 次浏览 没有评论

比如自动玩游戏的实例,对于游戏中的画面,每一帧的象素都是不同的,如果把所有的象素作为一种state,那么数据量非常的大。所以应该与深度学习进行解和,通过深度学习来计算Q-value

1.将图片二值化

发表评论

邮箱地址不会被公开。

Go