美团开源 LongCat-Video，5分钟视频生成技术引爆AI创作新纪元

唠唠资讯2025年10月27日 13:44消息，美团开源LongCat-Video，支持稳定生成5分钟视频内容。

　　 2025年10月27日，今日上午，美团LongCat团队正式发布并开源了LongCat-Video视频生成模型。据官方介绍，该模型在文本生成视频、图像生成视频等基础任务中均达到开源领域的最先进水平。同时，通过原生视频续写任务的预训练，LongCat-Video实现了分钟级的长视频连贯生成，有效保障了跨帧之间的时序一致性和物理运动的合理性，在长视频生成领域展现出显著优势。

　　根据介绍，近年来，“世界模型”（World Model）被认为是通向下一代人工智能的核心技术，它使人工智能能够真正理解、预测甚至重构现实世界。作为一种能够模拟物理规律、时空变化和场景逻辑的智能系统，“世界模型”让人工智能具备了“观察”和“理解”世界运行本质的能力。而视频生成模型则有望成为构建世界模型的重要途径：通过视频生成任务，人工智能可以整合几何、语义、物理等多方面的知识，在数字空间中进行模拟、推演乃至预演真实世界的运作过程。

　　作为一款基于DiffusionTransformer（DiT）架构的多功能统一视频生成基础模型，LongCat-Video创新性地通过“条件帧数量”来区分不同任务——文本生成视频时无需提供条件帧，图像生成视频时需输入1帧参考图，视频续写则依赖于多帧前序内容。该模型原生支持三大核心任务，无需额外模型调整，构建起“文生视频/图生视频/视频续写”的完整任务闭环。

　　文生视频：可生成720p、30fps的高清视频，能够准确解析文本中的物体、人物、场景及风格等细节指令，其语义理解与视觉生成能力达到开源领域的最先进水平。

　　图生视频：严格保留参考图像的主体属性、背景关系与整体风格，动态过程符合物理规律，支持详细指令、简洁描述、空指令等多类型输入，内容一致性与动态自然度表现优异。这一技术在图像生成领域展现出强大的能力，尤其在保持画面结构和逻辑关系方面具有显著优势。无论是复杂场景还是细微变化，系统都能精准还原原始图像的核心特征，同时确保动态过程的合理性与自然流畅。这种技术不仅提升了生成内容的质量，也为后续应用提供了更可靠的支撑。

　　视频续写：视频续写是LongCatVideo的核心竞争优势，能够基于多帧条件帧延续视频内容，为长视频的生成提供原生的技术支持。

　　依托视频续写任务的预训练技术、Block-Causal Attention机制以及GRPO后训练方法，LongCat-Video能够稳定生成5分钟长度的视频内容，且保持高质量输出，被称作行业“顶尖”水平。

　　附有关链接如下：

　　 GitHub：https://github.com/meituan-longcat/LongCat-Video

　　 Hugging Face：https://huggingface.co/meituan-longcat/LongCat-Video

　　 Project Page：https://meituan-longcat.github.io/LongCat-Video/

美团开源 LongCat-Video，5分钟视频生成技术引爆AI创作新纪元

美团开源LongCat-Video，5分钟视频生成引领AI创作新革命

相关阅读

2026 AI巨头名单揭晓：字节、智谱、阿里强势登榜

数千个AI智能体夜以继日为我写代码：Claude开发者揭秘未来编程新纪元

豆包二代AI手机即将登场：骁龙8至尊版引爆上半年旗舰战场

生成式AI备案突破800大关，中国人工智能发展提速

发表评论

人工智能AI栏目

即时资讯

深度分析

24小时热文

阿里千问开放对外办事能力，东航成首个接入航司

口袋里的智能助手：MiniMax Agent 新增 Pocket 功能，无缝对接飞书、微信

红魔游戏平板5 Pro震撼首发：全球首款搭载骁龙8E5+自研豆包端侧大模型的AI游戏核弹！

字节跳动放大招！Seedance 2.0 API上线：1元/秒飙出电影级视频，AIGC生产力革命来了

脑洞大开！日本团队训练大鼠神经元实现AI实时计算

苹果遭博主集体起诉：AI训练涉嫌盗用数百万视频

《AI经济革命：公共财富基金、机器人税与四天工作制的未来图景》

猛玛LARK A1杀疯了！8GB+三档AI降噪实测封神，无线领夹麦克风听觉革命引爆行业地震

AI漫剧将颠覆真人短剧？

宇树王兴兴爆赞：字节跳动Seedance 2.0横空出世，全球AI视频生成新王登基！

相关文章

友情链接

零点快讯社

智慧科技

文化潮流网

讯界聚合

手机扫码访问