首页 理论教育 海鹰智库:AI学习环境探索

海鹰智库:AI学习环境探索

时间:2023-10-22 理论教育 版权反馈
【摘要】:轻量级“星际争霸”研究环境。美国纽约大学和Facebook AI Research设计了一个简单的2D游戏环境,用强化学习在该环境上部署各种神经模型,在该环境中训练的模型可直接应用于星际争霸游戏[36]。VizDoom是一个以第一人称视角多人射击类3D游戏Doom为基础、可进行以像素信息为输入的强化学习方法研究平台。ALE提供的评估方法可以在超过55个不同的游戏中报告验证结果。由OpenAI开发的强化学习研究环境和工具包[38]。

海鹰智库:AI学习环境探索

(1)轻量级“星际争霸”研究环境

ELF。田渊栋[35]等提出一个覆盖范围广、轻量级和灵活的基础强化学习研究平台——ELF。ELF包含三种游戏环境(微型实时策略、夺旗和塔防)的高度可定制的实时策略引擎。其中“微型实时策略”作为“星际争霸”的微型版本,捕捉了关键的游戏动态,可在笔记本电脑上以每秒40K帧速运行。该系统与现代强化学习方法结合使用时,可用6个CPU和1个GPU的计算硬件在一天时间内完成端到端的完整游戏的自主游戏程序的训练。此外,该平台在环境-智能体通信拓扑、强化学习方法的选择、游戏参数的变化等方面是灵活的,并且可以迁移到现有的基于C/C++的游戏环境,如ALE。

美国纽约大学和Facebook AI Research设计了一个简单的2D游戏环境,用强化学习在该环境上部署各种神经模型,在该环境中训练的模型可直接应用于星际争霸游戏[36]

(2)其他相似研究环境。

VizDoom。VizDoom是一个以第一人称视角多人射击类3D游戏Doom为基础、可进行以像素信息为输入的强化学习方法研究平台。M Kempka[23]等验证了该环境中视觉强化学习的可行性。在一个基本的移动和射击任务和一个更复杂的迷宫导航两种场景中,使用具有Q学习和经验回放的卷积深度神经网络,都能够训练出展现人类行为的有能力的自主游戏程序。(www.xing528.com)

ALE。Bellemare Marc G.[37]介绍了街机游戏学习环境——ALE。ALE为数百个Atari 2 600游戏环境提供界面,并为评估和比较强化学习、模型学习、基于模型的规划和模仿学习、迁移学习等方法提供了一个严格的测试平台。ALE提供的评估方法可以在超过55个不同的游戏中报告验证结果。

Gym。由OpenAI开发的强化学习研究环境和工具包[38]

Minecraft。微软开发了基于Minecraft(我的世界)游戏的人工智能研究平台[39]

另外,有如Deepmind的Psychalab心理学实验室开发的第一人称视角3D强化学习研究环境等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈