主页 > F一生活 >OpenAI开源新伙伴:《侠盗猎车手V》登场! >

OpenAI开源新伙伴:《侠盗猎车手V》登场!

时间: 2020-06-08 浏览量:643

OpenAI开源新伙伴:《侠盗猎车手V》登场!

OpenAI 的开源人工智慧测试平台有了一位新成员——《侠盗猎车手 5》,它由 Craig Quite 的 DeepDrive 计画所维护。你只需要购买正版游戏,然后 Universe 代理就可以在一个高拟真的世界开始驾驶汽车了。

那幺开发者需要注意哪些地方呢?一起来看看吧!

开始游戏

首先,打开 GTA V 伺服器。然后你需要将 Universe 的 Python 库装好。现在,你可以通过执行下面的程式挂代理。除了键盘和滑鼠,代理还可以使用虚拟摇桿。

import gym
import universe # register Universe environments into Gym
from universe.spaces import joystick_event

env = gym.make
env.configure # point to the GTA V Universe server
observation_n = env.reset

while True:
steer = joystick_event.JoystickAxisXEvent # turn right
throttle = joystick_event.JoystickAxisZEvent # go in reverse
# Alternatively, use WASD to steer:
action_n = [[steer, throttle] for _ in observation_n]
observation_n, reward_n, done_n, info = env.step
env.render

OpenAI开源新伙伴:《侠盗猎车手V》登场!
DeepDrive

DeepDrive 是一个平台,用于建立开放式自动驾驶汽车的 AI。DeepDrive 通过使用建模框架和内存检测技术来重新调整 GTA V,使其成为一个自动驾驶汽车的模拟器;除此之外,他可以提供预训练的自动驾驶汽车代理和数据库来训练。现有的 DeepDrive 环境和代理现在编译在 Universe 最上层。

DeepDrive 的起源比 Universe 早,因此,通过它可以有效看出在 Universe 出现前和出现后,现代游戏上特别鲜明的对比。最早的 DeepDrive 必须使用 Windows 操作系统的电脑并且需要一整天的时间打开游戏和游戏代理。而现在,打开只需 20 分钟,操作系统也可支持 Linux 或者 OS X,还与旧版本的 Universe 代理兼容。

本次开源发布的内容包括:

1. GTA V 环境的源代码和 AMI;

2. 一个预训练的驱动代理,具有 Caffe 和 TensorFlow 实现案例。

集合以上两者能够支持选择镜头机号和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。

环境改变

在 Universe 出现之前,DeepDrive 使用 DirectX 按键来捕获萤幕并且需要使用 C++与 Caffe 对接来写代理。现在的游戏则运行在 windows 平台下的网路虚拟机上,并和 Websockets 和 VNC 进行通讯。因此,代理可在 Linux 或者 Mac 的平台上跑,并且可以实现在任何 ML 框架的写动作。

Universe 通过 VNC 传输像素,滑鼠和键盘数据,通过 Websocket 传输其他数据。为了实现摇桿的方向和节流阀的控制,我们将摇桿的动作通过 Websockets 传给环境数据。

OpenAI开源新伙伴:《侠盗猎车手V》登场!

就如同 Universe 发布说明中提到的,客户端在公有云端上最多使用 20fps。GTA V 为研究人员提供了访问一个丰富多彩多样性的环境在测试和开发 AI 的环境。GTA V 的岛屿设置大小几乎是洛杉矶市的 1/5,并且给开发者提供了广泛的场景进行系统测试。另外,系统提供 257 种不同的汽车、7 种类型的自动驾驶车和 14 种天气,在这个模拟器使用这些数据进行排列组合,可以实现大量不同的虚拟场景。

OpenAI开源新伙伴:《侠盗猎车手V》登场!

GTA V 中 49 平方英尺的岛屿 San Andreas 为研究人员提供了培训 AI 穿过热奈的大都市地区,蜿蜒的山路,平坦的沙漠,和高速公路的能力。

在 GTA V+Universe 环境下也可以收集大量的标记数据:你可以用下面的 GTA V 引擎收录 2D 或 3D 模拟的块状资讯、汽车、行人、自动驾驶车、动物、路面、交通标誌分割标籤,或任何一个 GTA V 的其他 7000 +对象。环境通过真实世界的车辆,MODS 的道路建设,甚至也可以延伸到整个城市。

预训练代理

这次开源包含基础代理,是通过模仿学习 21 小时游戏画面进行驾驶训练的 AI。基础代理在各种不同的天气条件下驾驶,对交通作出反应并保持其车道。这种预训练的代理是我们最终目标的起始点!

其他研究人员的研究成果已经展现了通过对 GTA V 中的可视系统进行训练从而对现实世界中的图像进行分类的可行性。GTA V 与 Universe 融合则使得通过增强学习技术实现虚拟驾驶变得更加简单。

GTA V 与 Universe 的集成自动继承了 Universe 为了可比性和共享性而提供的所有工具和语义,能够很简单地对 GTA V 上的代理进行性能基準测试。Universe+GAT V 可以单独使用,也可以作为使用 Universe 代理访问的一个环境。

上一篇: 下一篇:
相关推荐
申博太阳城_申博在线开户|生活消费第一门户网|网站地图 申博官网备用网址_申博sundst 申博官网备用网址_申慱管理网入口