谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境

据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。
Genie效果的动图截图演示。
图片来源:谷歌官网
过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。
Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。
Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。
该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。
用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。
谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。
本文链接:http://knowith.com/news-1-597.html谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
贵州2021考研报名人数(2023年考研各省人数)
邢台考研机构(邢台学院会计专业有必要考研究生吗邢台学院会计专业考研报哪些学校)
东莞理工学院研究生(东莞理工学院研究生院)
在职研究生和全日制(在职研究生和全日制研究生的区别)
辽宁省考研信息招生网(辽宁省考研信息招生网官网)
2015经济学考研:微观经济学脉络图(第五章)
2015经济学考研:西方经济学模拟试题二答案
复旦大数据学院怎么样(复旦大学大数据学院怎么样)
哪里查找国家颁发的文件(哪里查找国家颁发的文件信息)
护理考研是在哪里考试_护理考研是在哪里考试的
正月初一,他在饭桌上被带走!
万利兴:果呗苹果id贷,用苹果手机id贷款口子
秒懂:京东白条取现方法教程(掌握三个方法轻松提现)-知者
惊奇: 得物佳物分期怎么提出来秒到, 超级实用提现方法!
购买印度仿制药索托拉西布多少钱一盒amg510 请问怎么才能代购到印度正品仿制药 索托拉西布
如登春台:石家庄赵县代还信用卡取现,找我就可以了,流程简单高效
女子孕检发现脐带血流异常,专家紧急剖出三个“蛋宝宝”
夜以继日:美团月付怎么套出来(套美团使用什么方法)
眉清目秀:石家庄桥西区上门代还信用卡,的6种刷法 (无视风控秒回款)
分享:羊小咩享花卡套出来现金方法详解「秒到流程+商家查找」