論文紹介清水建設が発表した論文をご紹介します。

マルチエージェント協調問題における2段階報酬配分法を用いた
(深層)強化学習による協調的行動の発現と解析

第98号2020年12月
  • 宮下 裕貴(技術研究所)

本稿では、マルチエージェントの段階的協調タスク問題において、深層強化学習への報酬配分方法がエージェント間の協調行動発現に与える影響を調査した結果を報告する。エージェント間の協調は、マルチエージェント分野において主要な研究課題である。近年、課題の解決に向けてマルチエージェントシステムに深層強化学習を適用する技術が注目を集めるが、エージェントの行動に伴う報酬(評価)が協調行動、特に分業や組織的協調行動の発現に与えるメカニズムは明確化されていない。本研究は、抽象的な協調タスク問題を題材に、報酬分配の割合変化より異なる協調構造の発現を確認した。

Coordinated Behavior for Sequential Task using Two-Stage Reward Assignment in Multi-agent Systems

Yuki Miyashita

Recently, multi-agent deep reinforcement learning (MADRL) has been studied to learn actions to achieve complicated tasks and generate their coordination structure. The reward assignment in MADRL is a crucial factor to guide and produce both their behaviors for their own tasks and coordinated behaviors. However, it has not been sufficiently clarified the reward assignment in MADRL’s effect on learned coordinated behavior. To address this issue, using the sequential tasks coordinated delivery and execution problem, we analyze the effect of various ratios of the reward given for the task that agent is responsible for.

PDFファイルをご覧いただくには、Adobe Readerが必要です。
お持ちでない方は、ダウンロードしてご覧ください。
Adobe Readerをダウンロードする