网站首页 财经 > 要闻 > 正文
弄清楚AI擅长什么是了解它们最难的事情之一。为了帮助确定这一点,OpenAI已经设计了一套游戏,可以帮助研究人员告诉他们的机器学习代理人是否真正学习基本技能,或者是什么同样可能已经对其有利想通了如何操纵系统。
这是AI研究中永远不会令人高兴的方面之一:代理人会弯腰或打破规则以尽力表现出研究人员要求做的事情的方式。作弊可能是开箱即用的想法,但这并不总是受欢迎的,一种检查方法是稍稍更改规则并查看系统是否崩溃。
可以通过查看代理人在只有某些相关知识的新情况下是否可以应用这些“技能”来确定代理人实际学习了什么。
例如,假设您想了解一个AI是否学会了玩类似于Mario的游戏,它可以正确行驶并越过障碍物。您可以改变方向,因此它必须向左走;您可以更改障碍的顺序;或者您可以完全改变游戏,让AI在正确行进时必须射击的怪物出现。
如果代理商真的从中学习了有关玩类似游戏的知识,那么它应该能够比全新游戏更快地获取游戏的修改版本。这就是所谓的“概括”-将现有知识应用于新的情况-人类会不断地做到这一点。
OpenAI研究人员在研究中曾多次遇到过这种情况,并且为了在基本水平上测试通用的AI知识,他们设计了一种AI街机,代理必须在各种重叠程度各异的游戏中证明自己的才能。游戏概念。
他们设计的16个游戏环境类似于我们认识和喜爱的游戏,例如《吃豆人》,《超级马里奥兄弟》,《小行星》等。不同之处在于,环境是从根本上构建到AI游戏的,并具有简化的控件,奖励和图形。
每个人都以不同的方式对AI的能力征税。例如,在一款游戏中,静止不动并观察游戏环境几秒钟可能不会受到惩罚,而在其他游戏中,则可能会使坐席处于危险之中。在某些情况下,人工智能必须探索环境,而在另一些情况下,人工智能可能只专注于单个大老板飞船。但它们都是毫无疑问的不同游戏,与Atari或NES控制台所提供的游戏没有什么不同(尽管显然有些不同)。
忍者:爬上塔,同时避免炸弹或用投掷的星星摧毁炸弹。
Coinrun:在关卡的右侧获得硬币,同时避免陷阱和怪物。
掠夺:从屏幕底部发射炮弹击中敌方船只并避免友善。
Caveflyer:使用小行星样式的控件导航洞穴,射击敌人并避开障碍物。
跳线:开放世界的平台游戏,上面有双跳兔子和指向目标的指南针。
矿工:挖土以获得遵守Atari时代重力规则的钻石和巨石。
迷宫:浏览随机生成的各种大小的迷宫。
大鱼:吃比你小的鱼成为大鱼,同时避免类似的命运。
追赶者:像吃豆人一样,吃点东西,并有策略地使用强力药丸吃掉敌人。
Starpilot:类似于Gradius的大爆炸,着眼于躲避和快速消灭敌舰。
Bossfight:与boss船进行一对一的战斗,随机选择攻击并补充盾牌。
抢劫:使用彩色的锁和相应的钥匙导航迷宫。
水果机器人:在收集水果并避免不结实的同时提高水平。
躲避球:在房间内四处走动,不要碰到墙壁,用球击打其他人,并避免被击中。
攀登者:攀登一系列平台,沿途收集星星并避开怪物。
死神:蛙人式的过马路游戏,有汽车,原木等。
您可以想象,可能会创建一种AI,该AI优于Heist,Maze和Chaser等基于网格的AI,但会丢失Jumper,Coinrun和Bossfight中的赛道。就像人类一样-因为每个人涉及不同的技能。但是也有一些共同点:理解玩家角色和移动物体可能会导致后果,或者不能进入游戏区域的某些区域。与不能很好地推广的AI相比,能够快速推广和适应的AI将在较短的时间内学会主导所有这些游戏。
版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
相关文章:
- 2020-01-09 Sidewalk Labs与投资组合公司AMP Robotics一起在多伦多启动回收试点
- 2019-08-19 西南航空公司将在2020年恢复夏威夷的扩张
- 2019-10-08 王玉琛到市六十五小作主题教育党课辅导
- 2019-09-07 Verizon刚刚提升其股息
- 2019-10-08 Acciona签署了对Nordex的10%的增资协议
- 2020-03-28 你有COVID-19吗?新的Apple网站,iOS应用程序帮助评估症状
- 2019-12-06 优步的致命事故统计显示出较低的事故率但不包括关键数字
- 2019-12-24 三星为CES亮相准备Neon AI
- 热点推荐
- 热评文章