强化学习P1-P2基本概念
https://www.bilibili.com/video/av45015646?p=1
对于普通的学习,决策为二分类问题。强化学习中,对于每一个决策,设定一定的奖励或者惩罚,从而通过历史的经验进行判断如何获得最大化的奖励。
对个体进行定义各项参数
智...
https://www.bilibili.com/video/av45015646?p=1
对于普通的学习,决策为二分类问题。强化学习中,对于每一个决策,设定一定的奖励或者惩罚,从而通过历史的经验进行判断如何获得最大化的奖励。
对个体进行定义各项参数
智...