首页> 外文会议>情報処理学会;情報処理学会全国大会 >負の報酬を獲得する状況を重視した畳み込みニューラルネットワークを用いたProfit Sharing におけるルールの再利用

【24h】

負の報酬を獲得する状況を重視した畳み込みニューラルネットワークを用いたProfit Sharing におけるルールの再利用

机译：使用强调强调获得负面奖励的情况的卷积神经网络重用利润共享中的规则

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

深層学習と強化学習とを組み合わせた手法は深層強化学習と呼ばれる。Q Learning をDeep Learning の代表的な手法である畳み込みニューラルネットワークを用いて実現したDeep Q-Networkは、多くのゲームで人間や従来の手法を上回るスコアを獲得できることが示され、注目されている。また、Q Learningの代わりにProt Sharing を畳み込みニューラルネットワークを用いて実現する手法[4] も提案されている。この手法では、いくつかのゲームにおいてDeep Q-Network よりも高いスコアが獲得できるように学習が行えることが示されている。Deep Q-Network[3]はQ Learning に基づいた手法であるため、多くの報酬を得られるような政策を獲得するように学習が行われることになる。しかし、課題によっては負の報酬を獲得しないことを学習することが重要な場合もある。また、障害物回避問題などにおいては、負の報酬を獲得する状況におけるルールは環境が変わっても再利用できる可能性がある。

机译：深度学习和强化学习相结合的方法是深度学习这称为化学学习。 Q学习深度学习卷积神经网络，这是一种典型的方法通过使用多个实现了深度Q网络您可以获得比人类和常规方法更高的分数已经显示出它正在引起关注。还有Q学习用Prot Sharing代替的卷积神经网络还已经提出了通过使用网络实现的方法[4]。借助这项技术，Deep Q- 学习获得比网络更高的分数已经证明可以做到这一点。深度Q网络[3] 是一种基于Q学习的方法，所以有很多新闻学习是为了获得可以得到奖励的政策将。但是，根据任务的不同，奖励为负数有时候，学会不赚钱很重要。此外，您会因避障问题而获得负面奖励。即使环境发生变化，您遇到的情况下的规则也可以重用有可能可以做到这一点。

著录项

来源
《情報処理学会;情報処理学会全国大会》|2020年|2.559-2.560|共2页
会议地点
作者
名取俊輝; 長名優子;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. 耐滑性のない安全靴シモン（東京都中央区，☎03-5695-1011)は，耐滑性と安定歩行を兼ね備えた安全靴，シモンライトシリーズ「SL28」を開発，販売を開始した。調整域の広い靴紐と，かかとを包み込み，足裏の負担を軽減する中敷きで，作業現場における軽やかなフットワークを可能にする。靴底には，複数パーツの「SX 3層底Fソールシステム（2016年グッドデザィン賞受賞）」を採用しているため，長期保存に強く加水分解しない。地面への接地面積も大きく安定感に優れ，耐滑効果が長く持続する。139-139第23期•東西ァス防水技能員養成所を卒業して目指すべき将来像が見えた学び舎 [J] . 平野　颯真防水ジャ—ナル . 2019,第6期

机译：Simon，防滑安全鞋（东京都中央区，☎03-5695-1011），已开发并开始销售具有防滑和稳定行走功能的安全鞋Simon Light系列“ SL28”。鞋带可调节的范围很广，鞋垫可以包裹脚后跟，减少脚底的压力，使工作场所的脚步轻松。鞋底使用多部分SX 3层鞋底F鞋底系统（2016年最佳设计奖得主），因此长时间水解不会强烈水解。与地面的地面接触面积大，稳定感极佳，并且防滑效果可长时间持续。 139-139第23学期•一栋教学楼，从东西方运动员技术培训学院毕业后，您可以看到将来的目标
2. 耐滑性のない安全靴シモン（東京都中央区，☎03-5695-1011)は，耐滑性と安定歩行を兼ね備えた安全靴，シモンライトシリーズ「SL28」を開発，販売を開始した。調整域の広い靴紐と，かかとを包み込み，足裏の負担を軽減する中敷きで，作業現場における軽やかなフットワークを可能にする。靴底には，複数パーツの「SX 3層底Fソールシステム（2016年グッドデザィン賞受賞）」を採用しているため，長期保存に強く加水分解しない。地面への接地面積も大きく安定感に優れ，耐滑効果が長く持続する。139-139第23期•東西ァス防水技能員養成所を卒業して目指すべき将来像が見えた学び舎 [J] . 平野　颯真防水ジャ—ナル . 2019,第6期

机译：没有光滑光滑的鞋子（Tokyo Chuo Ward，☎03-5695-1011）已经开发出并售出安全鞋，Simon Lat系列“SL28”结合光滑，稳定行走。调整区域的宽鞋带和高跟鞋被包裹并减少了鞋底的负担，使得可以在工作场所进行轻微的习惯。由于在多个部件中，鞋底采用“SX 3层底部F-SOL系统（2016指数奖励）”采用，因此它不会强烈水解它。地面到地面也具有高度稳定性，平滑效果长。第23章第23期•一个学习的建筑，未来雕像旨在瞄准Shozasu防水技术人员培训中心
3. 畳み込みニューラルネットワークを用いた地下鉄トンネルにおける変状検出の高精度化に関する一検討 [J] . 王安, 原川良介, 小川貴弘, 電子情報通信学会技術研究報告. ITS. Intelligent Transport Systems Technology . 2018,第449期

机译：卷积神经网络高精度检测地铁隧道开发检测研究
4. 負の報酬を獲得する状況を重視した畳み込みニューラルネットワークを用いたProt Sharing [C] . 志村成章, 長名優子電子情報通信学会;電子情報通信学会総合大会 . 2019

机译：使用强调强调获得负面奖励的情况的卷积神经网络进行Prot共享
5. 三次元畳み込みニューラルネットワークによる交換相関汎関数の開発利用統計を見る [D] . 堀場貴裕 2019

机译：利用三维卷积神经网络开发交换相关函数查看使用情况统计
6. テレビパソコンをインターネットを介して操作することにより、海外において国内のテレビ番組の録画・視聴を可能とするサービスを提供する業者に対し、同サービスにおける複製の主体であり、放送局の著作隣接権を侵害していると認定した事例 : 録画ネット事件知財高裁決定 [O] . 平田真己, Hirata Masaki 2006

机译：对于通过互联网操作电视个人计算机而能够在海外录制和观看国内电视节目的服务的提供者来说，它是这项服务中重复的主体，也是广播电台的版权邻接权。被发现侵权的案件：记录在案的净案IP高等法院判决

負の報酬を獲得する状況を重視した畳み込みニューラルネットワークを用いたProfit Sharing におけるルールの再利用

摘要

著录项

相似文献

相关主题

期刊订阅