谷歌展示Genie模型:一张草图就能生成一个2D游戏

·Genie是从互联网视频中训练出来的基础世界模型,可根据合成图像、照片、草图生成动作可控的2D世界。不过其生成的“游戏”画质很糊,离实时可玩还很远。
·DeepMind认为,Genie引入了一个能从图像或文本生成整个交互式世界的时代,它将成为训练未来通才AI智能体的催化剂。
Genie生成的2D世界。
谷歌DeepMind团队展示了Genie模型,能把草图变成2D游戏。
生成式人工智能可以通过语言、图像甚至视频生成创造性内容。而DeepMind引入了生成式人工智能新范式——Genie(generative interactive environments,生成式交互环境),根据单个图像提示来生成“交互式可玩环境”。该模型从游戏视频中学习游戏机制后,可以通过一个简单提示创建2D平台类游戏。
Genie生成的2D世界。
2月26日,DeepMind表示,Genie是一个从互联网视频中训练出来的基础世界模型,它可以根据合成图像、照片甚至草图生成各种各样动作可控的2D世界,使人们能够与他们想象的虚拟世界互动。
“只需要一张图片,Genie就可以创建一个全新的互动环境。” DeepMind表示,这为生成和进入虚拟世界打开了大门。例如可以采用最先进的文生图大模型来生成初始帧,然后用Genie赋予它们“生命”。
Genie根据图片生成动作可控的2D世界。
Genie根据图片生成动作可控的2D世界。
Genie的模型参数只有110亿,根据人类玩2D平台类游戏的20多万小时视频进行无监督训练。Genie的出现要归功于谷歌研究人员开发的可推断视频帧之间动作的潜在动作模型、将原始视频帧转换为离散标记的视频分词器,以及推测下一帧的动态模型。
DeepMind表示,Genie的独特之处在于,它能够在没有动作标签的情况下,完全从互联网视频中学习精细的控制。这是一个挑战,因为互联网视频通常没有关于执行哪个动作的标签,甚至没有关于应该控制图像哪个部分的标签。
Genie根据人的画作生成动作可控的2D世界。
Genie根据人的画作生成动作可控的2D世界。
DeepMind开发人员蒂姆·罗克塔谢尔(Tim Rockt?schel)表示,Genie学习各种潜在动作,以一致性控制角色。Genie习得潜动作空间不仅具有多样性和一致性,并且具有可解释性。此外,Genie模型是通用的,并不局限于2D。
DeepMind 在官方声明中也表示,Genie “专注于2D平台类游戏和机器人的视频”,“但我们的方法是通用的,适用于任何类型的领域,并可以扩展到更大的互联网数据集。”DeepMind认为,Genie引入了一个能从图像或文本生成整个交互式世界的时代,它将成为训练未来通才AI智能体的催化剂。
不过Genie是一个研究项目,而不是最终产品。它的训练视频是160 x 90像素的超低分辨率视频,每秒只有10帧,它生成的“游戏”同样是低分辨率的,每秒只有1帧。“该模型目前以每秒1帧的速度运行,所以现在它离实时可玩还很远。”蒂姆·罗克塔谢尔表示。
本文链接:http://knowith.com/news-3-339.html谷歌展示Genie模型:一张草图就能生成一个2D游戏
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
赞美雪的句子唯美
描写大雪纷飞的诗句
个人委托书电子版
《这个杀手不太冷》台词
夜孔雀台词
医药公司下半年工作计划
下半年小学教师个人工作计划
中学学校学生会工作计划
唯美简短句子
描写团圆的诗句
2025靶向药印度奥希替尼(30片)一盒价格一览表:售价约3000元一盒!印度奥希替尼多少钱一盒价格折合人民币约3000元一盒(2025更新中)肺癌靶向药印度奥希替尼代购价格约3000元一盒方法
大吉大利:佛山上门代还信用卡,真实商户积分,实体店多种方式
先苦后甜:DY月付怎么套出来现金(推荐十个操作步骤)
必看:白条要扫哪种二维码才能消费(最简单的5种方法)-知者
重大:白条套取现金二维码(12种提现方法技巧分享)-知者
最新解答:羊小咩享花卡在线下单秒到账 『重要方法须掌握』
通报:带你了解怎么找京东商家套白条(需要套京东的速看精选步骤)-知者
合肥男子手术数月后刀口发炎并发现线头,医院:可能是将可吸收的内缝线排出来了
本地:贵阳实体店套花呗信用购当面,8种秒到账记得收藏!
重要:白条额度自己怎么提出来的(亲测这两个方法很实用)-知者