快手可灵大模型发布图生视频及视频续写功能

快手视频生成大模型“可灵”自面世以来引发国内外广泛关注。6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。同时,可灵还发布了视频续写功能,可为已生成的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长延伸至约3分钟,极大拓展了视频大模型的创作边界。
按需定制视觉叙事
此前,可灵在文生视频方面已经展现出了创造逼真运动场景、精确模拟物理特性以及将复杂概念巧妙融合的能力,输出画质高,并允许用户自由调节视频的纵横比。这些特性如今都被融入到图生视频模型。用户只需上传一张图片,可灵即能基于对图像的深度解析,变静为动。
比如用户如上传经典的蒙娜丽莎照片,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流。
得益于其基础模型架构中的3D时空联合注意力机制,可灵在转换静态图像为动态视频时,能够细腻准确地实现大幅度运动场景。例如,只需上传一张牧羊犬追球的静止照片,模型就能生成一段牧羊犬奔跑追逐网球的视频,牧羊犬耳朵晃动、毛发飘扬,而网球则在空中弹跳,视频整体自然而流畅。
可灵图生视频模型还融入了提示词融合技术,深化对图像语义与用户指令的理解整合。这意味着,模型能够根据用户提供的不同文本指令变换视频中的动态表现,实现“按需定制”。
再比如用巨龙图片生成视频,输入“正在捕食的巨龙,飞扬的沙子,奇幻风格的电影”,视频便呈现巨龙掀起漫天黄沙,嘴部仿佛在咆哮的效果。此外,可灵图生视频模型支持不同风格的图像输入,同时兼容各种长宽比的图像输入。
视频续写可生成最长约3分钟视频
可灵大模型推出视频续写功能,用户只需一键操作,即可在已生成视频的基础上延续生成约5秒内容,该功能同时适用于文生视频和图生视频。同时,通过连续多次续写,能够最长生产约3分钟的连贯视频。基于对物理运动的深入理解,视频续写不仅确保新生成部分与原视频间的运动连贯性及物理合理性,还能融入大幅度的动作变化。
此次升级的一大亮点是集成文本控制机制于视频续写中,这意味着用户能够通过自定义提示词,为每段视频续写注入个性化创意。比如一个关于古堡的视频片段,用户既可以选择让它先“太阳落下去,天空变暗”,继而“太阳升起来,天空变亮”,也可以探索另一路径:“太阳落下去,天空变暗,灯光渐亮”,随后“灯光亮起,雾气氤氲”,以此创造出各具特色的连续视觉叙事。
6月6日,可灵文生视频大模型正式亮相,并即时在快影App上启动邀测体验,截至目前,已有累计超过14万人排队申请。此次进化,可灵文生视频基础大模型的能力被整合到图生视频和视频续写功能中,将为用户带来更丰富、灵活的视频创作体验。
据悉,快手还将在下月召开的2024世界人工智能大会(WAIC)上举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛,届时将发布最新的大模型技术与应用战略,包括大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。
(受访者供图)
本文链接:http://knowith.com/news-1-812.html快手可灵大模型发布图生视频及视频续写功能
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
南开大学研究生学费(南开大学研究生学费一年多少钱)
水利水电工程考研院校(水利水电工程考研院校排名)
37岁考上研究生(37岁考上研究生有用吗)
一个差等生的考研奋斗史
2015经济学考研:微观经济学脉络图(第三章)
2014年考研南京师范大学880语文学科基础真题(回忆版)
重庆考研时间 綦江中医院现任院长
陕西省考研时间 考研政治名师都有谁
博士答辩上演催人老现场,导师舌战群儒,答辩后学生比老师还沧桑
考研的政治考哪几本书(考研的政治考哪几本书啊)
厚积薄发:抖音月付怎么套出来(推荐四个操作方法)
吉星照:苹果id贷安全吗,苹果id贷款叫什么软件
海纳川:正规苹果id贷款微信,苹果id贷款口子2025一个月
大吉大利:深圳宝安代还信用卡真实商户积分,便捷商家
如登春台:石家庄无极县垫还信用卡,真实商户积分,值得信任
如登春台:昆明石林县垫还信用卡,找我就可以了,高效便捷服务
操作秒到攻略:鹿怎么优品取现,教你一种简单的方法
大吉大利:广州天河区上门代还信用卡,都在这信誉至上,高效便捷服务
欣欣向荣:佛山代还信用卡垫还,找我就可以了,流程简单高效
个性化台历一键定制,他们把温暖“年货”送到家