快手可灵大模型发布图生视频及视频续写功能

快手视频生成大模型“可灵”自面世以来引发国内外广泛关注。6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。同时,可灵还发布了视频续写功能,可为已生成的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长延伸至约3分钟,极大拓展了视频大模型的创作边界。
按需定制视觉叙事
此前,可灵在文生视频方面已经展现出了创造逼真运动场景、精确模拟物理特性以及将复杂概念巧妙融合的能力,输出画质高,并允许用户自由调节视频的纵横比。这些特性如今都被融入到图生视频模型。用户只需上传一张图片,可灵即能基于对图像的深度解析,变静为动。
比如用户如上传经典的蒙娜丽莎照片,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流。
得益于其基础模型架构中的3D时空联合注意力机制,可灵在转换静态图像为动态视频时,能够细腻准确地实现大幅度运动场景。例如,只需上传一张牧羊犬追球的静止照片,模型就能生成一段牧羊犬奔跑追逐网球的视频,牧羊犬耳朵晃动、毛发飘扬,而网球则在空中弹跳,视频整体自然而流畅。
可灵图生视频模型还融入了提示词融合技术,深化对图像语义与用户指令的理解整合。这意味着,模型能够根据用户提供的不同文本指令变换视频中的动态表现,实现“按需定制”。
再比如用巨龙图片生成视频,输入“正在捕食的巨龙,飞扬的沙子,奇幻风格的电影”,视频便呈现巨龙掀起漫天黄沙,嘴部仿佛在咆哮的效果。此外,可灵图生视频模型支持不同风格的图像输入,同时兼容各种长宽比的图像输入。
视频续写可生成最长约3分钟视频
可灵大模型推出视频续写功能,用户只需一键操作,即可在已生成视频的基础上延续生成约5秒内容,该功能同时适用于文生视频和图生视频。同时,通过连续多次续写,能够最长生产约3分钟的连贯视频。基于对物理运动的深入理解,视频续写不仅确保新生成部分与原视频间的运动连贯性及物理合理性,还能融入大幅度的动作变化。
此次升级的一大亮点是集成文本控制机制于视频续写中,这意味着用户能够通过自定义提示词,为每段视频续写注入个性化创意。比如一个关于古堡的视频片段,用户既可以选择让它先“太阳落下去,天空变暗”,继而“太阳升起来,天空变亮”,也可以探索另一路径:“太阳落下去,天空变暗,灯光渐亮”,随后“灯光亮起,雾气氤氲”,以此创造出各具特色的连续视觉叙事。
6月6日,可灵文生视频大模型正式亮相,并即时在快影App上启动邀测体验,截至目前,已有累计超过14万人排队申请。此次进化,可灵文生视频基础大模型的能力被整合到图生视频和视频续写功能中,将为用户带来更丰富、灵活的视频创作体验。
据悉,快手还将在下月召开的2024世界人工智能大会(WAIC)上举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛,届时将发布最新的大模型技术与应用战略,包括大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。
(受访者供图)
本文链接:http://knowith.com/news-1-812.html快手可灵大模型发布图生视频及视频续写功能
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
贵州2021考研报名人数(2023年考研各省人数)
辽宁考研机构实力排名?大连理工大学盘锦校区海洋工程研究生怎么样
贵州省黔南州考研地点,2023年贵州考研报名总人数
大学生毕业后考研的好处(大学毕业后考研有什么好处)
医学学硕(医学学硕与专硕的区别)
首都医科大学考研难度(蚌埠医学院考研通过率)
陕西省考研时间 考研政治名师都有谁
河南研究生院校有哪些(河南研究生院校有哪些学校)
中国在线教育考研频道(中国在线教育考研频道官网)
驻马店考研考点()
如何代购孟加拉/老挝阿伐曲泊帕需要多少钱?阿伐曲泊帕最便宜价格分享
今天揭晓: 得物佳物分期商城提现秒到秒回款!! 揭晓七个实用的提现方法
大吉大利:深圳罗湖上门代还信用卡,找我就可以了,需要的请联系
如登春台:石家庄新华区代还信用卡口碑商户实体店多种方式
准确预估:在2025年印度老挝索托拉西布国内购买一盒多少钱,老挝索托拉西布价格官宣售价约1500~2300元
心旷神怡:上海虹口区代还信用卡垫还,秒到账(当面秒结算)
爆料:白条怎么套出来真相(白条无损自套详细教程)-知者
当面!青岛崂山套visa万事达认准旗舰店,小编亲身经历教你如何套
必看:京东白条有办法套出来吗(诚信商家教会你怎么做)-知者
横评:pos机能不能套分付,实用教程与心得分享