强化学习-P11强化深度学习
比如自动玩游戏的实例,对于游戏中的画面,每一帧的象素都是不同的,如果把所有的象素作为一种state,那么数据量非常的大。所以应该与深度学习进行解和,通过深度学习来计算Q-value
1.将图片二值化
比如自动玩游戏的实例,对于游戏中的画面,每一帧的象素都是不同的,如果把所有的象素作为一种state,那么数据量非常的大。所以应该与深度学习进行解和,通过深度学习来计算Q-value
1.将图片二值化