快手可灵3.0重磅登场：多项升级开启AI视频创作新时代

主页 ꄲ AI更新快报 ꄲ 快手可灵3.0重磅登场：多项升级开启AI视频创作新时代

快手推出可灵3.0系列并开启超前内测

快手今日官宣推出新一代视频生成模型可灵3.0系列，涵盖图片3.0、视频3.0及视频3.0 Omni，并正式开启超前内测。此次可灵3.0的升级意义重大，将单次视频生成时长拓展到最长15秒，还新增了智能分镜、极致细节一致性、音画同步及多语言口型等突破性能力，这是AI视频生成从“片段”迈向“叙事”的关键一步。

可灵图片3.0模型特点

可灵图片3.0模型着重优化了画质精度与创作连贯性，以满足专业内容生产需求。它具备组图生成能力，能通过单张或多张输入图像批量生成逻辑连贯的系列画面，解决过去AI生成多图时风格与内容跳变的难题。同时，输出分辨率提升至2K与4K级别，可直接适配影视预演图和高精度场景设定需求。在细节方面，优化了一致性，降低了图像的 “AI塑料感”，还强化了对构图、景别及视角的控制精度，提高了在影视创作场景中的适用性。

可灵视频3.0模型特点

视频3.0采用统一的多模态训练框架，支持多种输入形式，核心升级在于补全叙事能力。它能生成15秒长视频，并且支持3 - 15秒的灵活时长设置，为复杂动作呈现提供了空间。新增的智能分镜系统可根据文本指令自动调度景别与机位运动，模拟专业导演的镜头语言。还可以允许用户通过多张图片或视频片段“锚定”特定视觉元素，确保角色或物体外观一致。音画同步功能支持中、英、日、韩、西五种语言及方言的精准口型匹配，能实现多人场景下的角色定向发声。文字生成清晰度也大幅提升。

可灵3.0的底层技术创新

可灵3.0的升级依托多项底层技术创新，采用视觉思维链（vCoT）技术提升逻辑合理性，通过Deep - Stack视觉信息流机制增强细粒度感知能力，模型训练引入强化学习框架。此外，视频3.0 Omni版本推出“视频主体特征库”功能，方便用户建立专属特征库进行还原应用。

可灵3.0发布的意义

可灵3.0的发布不仅是参数提升，更强调综合表现。从4K图片预演到15秒长视频生成，再到精确口型同步，快手试图构建一个完整的工作流闭环。随着超前内测的推进，其智能分镜与主体一致性等能力将成为在影视预演与专业内容生产领域落地质量的关键检验。

可灵AI工具体验链接

可灵AI工具体验：https://app.klingai.com/cn/

ꂃ前一个：无

ꁹ后一个：无