当前位置:柔美女性网 >

绿色生活 >心理 >

自适应动态规划 什么是

自适应动态规划 什么是

什么是 自适应动态规划

是人工智能学术语

自适应动态规划(Adaptive/Approximate Dynamic Programming,ADP),又叫近似动态规划,是人工智能和控制领域发展而交汇形成的新兴学科。

ADP方法主要包括三种基本类型:启发式动态规划(Heuristic Dynamic Programming,HDP),双启发式动态规划(Dual Heuristic Programming,DHP)和全局双启发式动态规划(Globalized Dual heuristic Programming,GDHP)。这三种类型都包含三个模块,如果每个模块都用神经网络来代替,这样我们也称这三个模块为三个网络,即评价网络(Critic Network)、模型网络(Model Network)和执行网络(Action Network)。如果我们省略了模型网络,使得执行网络直接与评价网络相连接,这样的结构称为它们的动作依赖(Action-Dependent)形式,即ADHDP,ADDHP,ADGDHP。

标签: 规划
  • 文章版权属于文章作者所有,转载请注明 https://rmnxw.com/zh-cn/lvse/xinli/y4edz4.html