Beta分布:缘由及推导

什么是Beta分布? Beta分布是一种 连续型概率密度分布 ,通常使用 Beta(α,β)Beta(\alpha,\beta)Beta(α,β) 表示,具有两个参数。Beta分布的定义域为 [0,1][0, 1][0,1] ,一般用于估计伯努利事...

AI / 强化学习

强化学习:基本概念和优化目标

强化学习是指导智能体如何根据环境反馈而选择最佳决策的学习方式,本文主要介绍强化学习的基本概念和优化目标。

AI / 强化学习
- - - - - -