Menu

学界 OpenAI Universe加入GTA5在游戏大作中训练人工智能

2018年12月6日 0 Comment

北京时间2018年12月6日,ope体育报道,原标题:学界 OpenAI Universe加入GTA5,在游戏大作中训练人工智能

昨天,OpenAI 宣布旗下的开源人工智能测试环境 Universe 加入了游戏大作《侠盗猎车手 5》。用户只需购买正版游戏,即可使用 Universe 中的人工智能在 Los Santos 中的 3D 环境中纵横驰骋。此次开源的项目让自动驾驶模拟测试平台 DeepDrive 在 GTA 世界中进行测试变得更加简便易行。

如何收集用于训练人工智能的数据一直是各家科技公司面临的难题。在通过各种方法收集真实世界数据的同时,一些公司也在致力于构建虚拟环境——它们可以提供近乎无限的可能性。

OpenAI 一直视图构建各种不同类型的人工智能训练环境。目前,Universe 中包括了大约 2600 种 Atari 游戏,1000 种 flash 游戏和 80 种浏览器环境,可供所有人用于训练人工智能系统。GTA5 的引入是该项目的最新举措,它为训练用于自动驾驶汽车的人工智能打开了又一扇大门。

GTA5 的游戏世界是一个内容丰富的 3D 世界。在以下视频中你们会看到,在 Universe 的新测试环境中,人工智能获取视频信息的帧数被限制在了 8FPS,环境信息和视角管理齐备。同时,在 Universe 中的 GTA5 已经将原版游戏中的所有暴力元素去除。

想让人工智能体进入 GTA5 的世界,你需要安装 Universe 的 Python 库(你不需要为此特意升级到最新版本)。你可以通过加入以下代码来嵌入人工智能体。与其他游戏类似,人工智能收集信息的渠道是基于游戏视频输出的。除键盘和鼠标之外,在此游戏中人工智能体可以使用模拟游戏手柄进行操纵。

DeepDrive 是一个用于开发人工智能自动驾驶系统的开放平台。DeepDrive 使用定制框架和内存检查技术在 GTA5 中的模拟环境测试自动驾驶汽车系统。在本次发布中,OpenAI 同时提供了预先训练好的自动驾驶人工智能,以及用于训练这个系统的数据集以供参考。新的 DeepDrive 环境和人工智能都构建在 Universe 基础之上。

在 DeepDrive 与 Universe 整合之前,这个自动驾驶开放平台已经展现了与现代大型 3D 游戏良好的兼容性。但这次开源的系统使用起来更加方便。原始版本的 DeepDrive 应用需要使用 Windows 系统的电脑在本地运行,需要花费大约一整天的时间调试游戏和人工智能接口。而在新的 DeepDrive 中,人们只需花费大约 20 分钟来进行设置,新的系统也支持在 Linux 和 OS X 平台上运行,同时这一新的功能也与之前已有的 Universe 人工智能互相兼容(当然,使用模拟游戏手柄比键盘鼠标效果更好)。

GTA5 的集成环境支持选择视角与自定义视野。同时也拥有用于强化学习训练的奖励机制,包含避免碰撞、与目的地距离和停留在路面上等等。

Universe 在 VNC 上迁移画面(pixel)、键盘和鼠标,在 websockets 上迁移其他信息。为了支持转向与减速的操纵杆控制,我们把操纵杆控制行为放入了 websockets 的环境。

就像刚发布 Universe 时所说的那样,在公共互联网络上用户能维持到 20 FPS。

GTA V 为研究人员测试、开发人工智能提供了丰富、多样的环境。它的地图设置几乎是洛杉矶的 1/5 大小,为测试系统提供了广阔的范围。还有 257 种不同的车辆、7 种自行车和 14 类天气环境,使用单个模拟器探索大量的不同排列变化也是有可能的。

GTA V 中圣安地列斯 49 平方英里的岛城使得研究人员有能力在忙乱的大都市中、蜿蜒的山路、平坦的沙漠以及高速公路上训练人工智能

在该环境中,也能收集大量的标记数据:你能使用底层 GTA V 引擎来收集 2D 或 3D 边界盒(bounding boxes),并且为汽车、人行道、自行车、动物、路面、交通标志以及其他 GTA V 中超过 7000 类的物体进行标记。该环境也能通过 mods 延展到现实世界的汽车、道路建筑,甚至是整个城市。

此次发布包括一个基线智能体,通过在人工智能玩游戏的 21 小时的数据集(大约 60 万张图片)上进行模仿学习得以训练。(内建游戏人工智能是个非常好的初始目标:它要比典型的人类玩家表现更好,因为它能获取游戏内部状态,即使它仍然会犯在高速公路上 180 度掉头这样的错误)。该基线智能体能干在多种不同的天气环境中进行驾驶、应对交通环境,遵守交通规则。它也只是个开始,我们诚邀社区其他人对它进行改进。

其他研究人员已经证明我们能够在 GTA V 上训练视觉系统,并使用它在现实世界中分类图片。Universe GTA V 融合体使得在模拟自动驾驶系统上尝试强化学习技术变得很轻松。

GTA V 融合进 Universe 自动地继承了所有的工具和语义,Universe 提供了可比性和可共享性,也使得在 GTA V 上评估智能体的表现变得更容易。它可被单独使用,或者作为获取通用 Universe 智能体的另一环境。更多热点新闻尽在ope电子游戏 https://www.relianchem.com/

标签:

发表评论

电子邮件地址不会被公开。 必填项已用*标注