トピック

ロボットやエージェントのための新しい進化的学習法

◆ 受賞研究:国際会議で最優秀論文賞受賞
◆ 助教 半田 久志
 自律的に意思決定するロボットやソフトウェアエージェントのための学習法には、「パブロフの犬」に代表される強化学習と、「自然選択」を模倣した進化的学習があります。強化学習では単純なタスクしか学習できません。一方、進化的学習は学習に膨大な時間を要する欠点がありました。提案手法では、過去に経験した事例から良好な事例を「選択」し、選択事例から新たな方策を獲得します。この「選択」・「方策獲得」の繰返しにより高度な技能を獲得します。提案手法により、既存手法の問題点を解決し、大規模な問題についても効果的に学習できることを示しました。
 発表論文はACMという世界的な学会の冠のついた、進化計算で最もレベルの高い国際会議において最優秀論文賞を受賞しました。

(11.03.16)