首页> 中国专利> 基于点的部分可观察马尔可夫决策过程的预处理方法

基于点的部分可观察马尔可夫决策过程的预处理方法

摘要

本发明的基于点的部分可观察马尔可夫决策过程的预处理方法,包括如下步骤:1.迭代之前的预处理:a.通过与环境的随机交互来采样点集;b.计算并存储采样点的奖赏函数;c.计算并存储伪继承点;d.结束;2.每步迭代的预处理:e.计算并存储基向量;f.结束;3.单点单步迭代:g.计算每个采样点的奖赏值表和候选向量表;h.计算最优动作并获取基向量;i.用误差项修正基向量;j、结束。本发明的基于点的部分可观察马尔可夫决策过程的预处理方法对每个样本信念点作预处理,而且提出了基向量的概念,避免了大量重复和无意义计算,将算法速度提升了2~4倍。

著录项

  • 公开/公告号CN101398914A

    专利类型发明专利

  • 公开/公告日2009-04-01

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN200810194868.4

  • 发明设计人 王崇骏;卞爱华;吴骏;赵志宏;

    申请日2008-11-10

  • 分类号G06N7/00;

  • 代理机构南京天翼专利代理有限责任公司;

  • 代理人汤志武

  • 地址 210093 江苏省南京市汉口路22号

  • 入库时间 2023-12-17 21:40:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-03-23

    发明专利申请公布后的视为撤回 IPC(主分类):G06N7/00 公开日:20090401 申请日:20081110

    发明专利申请公布后的视为撤回

  • 2009-05-27

    实质审查的生效

    实质审查的生效

  • 2009-04-01

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号