13.6 亿参数开源神器！LongCat‑Video 一键生成分钟级720P视频，媲美商业级！ | MYAIGC

type

Post

status

Published

date

Oct 27, 2025

slug

summary

tags

category

技术分享

icon

password

LongCat-Video 视频生成模型：美团LongCat团队的开源力作

简介

LongCat-Video 是由美团LongCat团队开发并开源的一款视频生成模型，拥有13.6亿参数规模。该模型基于MIT开源协议发布，能够支持文本生成视频、图像生成视频以及视频续写等三种主要功能。通过采用“从粗到细”的生成策略和块稀疏注意力机制，LongCat-Video 可在短时间内产出长达数分钟的720P高清视频，并确保画面色彩稳定、质量无衰减。

在技术层面，模型引入了多奖励强化学习优化方法，在生成效果上接近商业级顶尖水平。内部测试数据显示，其在多个关键指标上已经超越了现有的同类开源模型。目前，该模型已在 Hugging Face 与 GitHub 平台开放使用，便于开发者快速部署和应用。

核心功能概览

LongCat-Video 的多功能特性使其能够胜任多种复杂视频创作需求：

多样化生成路径：同时支持文字描述转视频、图片内容扩展为视频以及已有视频片段的延续创作。

长时视频输出：擅长处理时间跨度较长的内容，生成分钟级视频且保证视觉一致性。

高效推理能力：借助创新的技术架构，显著加快高分辨率视频生成速度。

强化学习驱动：通过多奖励机制对生成质量进行精细调控，提升整体表现。

易用性强：模型权重和相关代码公开，配套完整的文档与示例，极大降低了使用门槛。

突出优势

这款模型的优势体现在多个方面：

集成化任务支持：单一模型即可应对文本生视频、图像驱动视频及视频接龙等不同场景，无需切换工具。

高质量长视频输出：具备持续输出长时间视频的能力，过程中保持画面色彩与清晰度的稳定性。

推理效率领先：结合粗粒度至细粒度的处理流程和块稀疏注意力技术，可在极短时间内生成规格为720p、帧率为30fps的流畅视频。

生成质量媲美高端方案：依托Group Relative Policy Optimization（GRPO）算法框架，使得生成内容在文本契合度、画面品质和动态流畅性等方面均达到行业领先水准。

获取通道

如需深入了解或直接体验 LongCat-Video，可通过以下资源访问：

官方网站：https://meituan-longcat.github.io/LongCat-Video/

GitHub 地址：https://github.com/meituan-longcat/LongCat-Video

HuggingFace 页面：https://huggingface.co/meituan-longcat/LongCat-Video

适用领域

LongCat-Video 适用于多个专业与创意场景，包括但不限于：

影视内容创作者：用于快速构思情节、生成镜头样片或延续现有剧情。

教育行业从业者：便于制作生动的教学视频或课程演示材料。

游戏行业开发人员：辅助创建动态背景、角色动画等内容以增强沉浸感。

科研与AI爱好者：可供学术研究和技术验证使用。

市场营销团队：适合快速生成产品介绍短片或品牌宣传内容。

社交媒体运营者：帮助高频产出吸引眼球的短视频内容，增强账号互动性。

相关开源项目推荐

如果你对 LongCat-Video 感兴趣，还可以看看其他值得关注的开源AI工具：

阿布量化交易系统

一款基于 Python 构建的开源量化交易平台，特别适合金融数据分析与策略回测。

BAGEL 多模态模型

由字节跳动推出的多模态AI基础模型，集合图像、文本等多维信息处理能力。

Diffusers Image Outpaint

强大图像外绘工具，可实现高质量的图片扩展与修复工作，提升视觉素材可用性。

AgentLaboratory 科研助手

专为科研全流程设计的智能代理平台，助力研究人员提高实验与论文编写效率。

作者:数字Baby
链接:myaigc.top/article/299b7c2d-0e98-8100-a5a3-f265120acb9c
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

NVIDIA 重磅开源！OmniVinci 低标记高分全模态模型，一举颠覆跨媒体 AI 时代！AI内容人性化：工具与人工，谁是终极润色大师？

Loading...

目录

0%

数字Baby

AIGC加速人类文明

最新发布

编程屠榜！智谱王炸开源GLM-4.7-Flash，30B参数仅激活3B，本地运行神器！

别再忍受渣音质！这52KB的开源神器，让电话秒变录音棚。

颠覆认知！英伟达发布能“抢话”的AI，这才是真正的人类对话！

AI绘画大变天！半秒出图，消费级显卡就够，FLUX.2 Klein杀疯了！

谷歌重磅开源！这款能看图说话的翻译AI，让55国语言壁垒瞬间瓦解

AI训练模式被颠覆！高德阿里首创“锦标赛”机制，专治开放式难题！

公告

🎉Dify/n8n视频课程已经上线🎉

-- 感谢您的支持 ---

👏欢迎体验👏

🎉更多惊喜🎉

咨询微信:myaigcpro

目录

0%