首页> 外国专利> DATA-BASED REINFORCEMENT LEARNING DEVICE FOR IMPROVING LIMIT RUN-OUT RATE AND METHOD THEREOF

DATA-BASED REINFORCEMENT LEARNING DEVICE FOR IMPROVING LIMIT RUN-OUT RATE AND METHOD THEREOF

机译：基于数据的强化学习率极限提高率的学习装置及其方法

页面导航

摘要
著录项
相似文献

摘要

Disclosed is a data-based reinforcement learning device for increasing a limit run-out rate. According to the present invention, an agent (100) learns a reinforcement learning model so that a reward for an action selectable according to a current state in an arbitrary environment (200) is maximized, wherein a difference between a total fluctuation rate and an individual fluctuation rate that fluctuates depending on an individual action for each action is provided as the reward for the agent (100).;COPYRIGHT KIPO 2020

机译：公开了一种用于增加极限跳动率的基于数据的强化学习装置。根据本发明，代理（100）学习强化学习模型，以使得针对根据任意环境（200）中的当前状态可选择的动作的奖励最大化，其中总波动率与个体之间的差异。作为代理人的奖励，提供了根据每个操作的波动而波动的波动率（100）.; COPYRIGHT KIPO 2020

著录项

公开/公告号KR102100688B1

专利类型
公开/公告日2020-04-14

原文格式PDF
申请/专利权人 AGILESODA INC.;
展开▼

申请/专利号KR20200020602
发明设计人 CHA YONG;RHO CHEOL KYUN;LEE KWON YEOL;
展开▼

申请日2020-02-19
分类号G06N20;
国家 KR
入库时间 2022-08-21 11:04:52

相似文献

专利
外文文献
中文文献