首页> 外文会议>Algorithmic learning theory >Optimality Issues of Universal Greedy Agents with Static Priors
【24h】

Optimality Issues of Universal Greedy Agents with Static Priors

机译:具有静态先验的通用贪婪代理的最优性问题

获取原文
获取原文并翻译 | 示例

摘要

Finding the universal artificial intelligent agent is the old dream of AI scientists. Solomonoff Induction was one big step towards this, giving a universal solution to the general problem of Sequence Prediction, by defining a universal prior distribution. Hutter defined AIXI which extends the latter to the Reinforcement Learning framework, where almost all if not all AI problems can be formulated. However, new difficulties arise, because the agent is now active, whereas it is only passive in the Sequence Prediction case. This makes proving AIXFs optimality difficult. In fact, we prove that the current definition of AIXI can sometimes be only suboptimal in a certain sense, and we generalize this result to infinite horizon agents and to any static prior distribution. Keywords: AIXI, Universal Artificial Intelligence, Solomonoff Induction, Reinforcement Learning.
机译:寻找通用人工智能代理是AI科学家的古老梦想。 Solomonoff归纳法是迈出的一大步,它通过定义通用先验分布为序列预测的一般问题提供了通用解决方案。 Hutter定义了AIXI,将AIXI扩展到了强化学习框架,该框架可以解决几乎所有(如果不是全部)AI问题。但是,出现了新的困难,因为代理现在是主动的,而仅在序列预测的情况下才是被动的。这使得难以证明AIXF的最优性。实际上,我们证明了AIXI的当前定义有时在某种意义上可能仅是次优的,并且可以将这一结果推广到无限的水平代理和任何静态的先验分布。关键字:AIXI,通用人工智能,所罗门诺夫归纳法,强化学习。

著录项

  • 来源
    《Algorithmic learning theory》|2010年|p.345-359|共15页
  • 会议地点 Canberra(AU);Canberra(AU)
  • 作者

    Laurent Orseau;

  • 作者单位

    UMR AgroParisTech 518 / INRA 16 rue Claude Bernard, 75005 Paris, France;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 人工智能理论;
  • 关键词

  • 入库时间 2022-08-26 13:58:04

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号