CogVideoX-5B-I2V是什么
CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型,通过一张图片和文本提示词生成视频。模型采用了3D 因果变分自编码器和专家自适应 LayerNorm 技术,能输出720×480分辨率、6秒长的视频。CogVideoX-5B-I2V 的代码已开源,支持多种应用场景,如教育和虚拟现实、娱乐或社交媒体等。这次CogVideoX-5B-I2V的开源,也代表着CogVideoX系列开源模型已经支持文生视频、视频延长、图生视频三种任务。

来源:爱论文 时间:2025-02-27 13:27:45
CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型,通过一张图片和文本提示词生成视频。模型采用了3D 因果变分自编码器和专家自适应 LayerNorm 技术,能输出720×480分辨率、6秒长的视频。CogVideoX-5B-I2V 的代码已开源,支持多种应用场景,如教育和虚拟现实、娱乐或社交媒体等。这次CogVideoX-5B-I2V的开源,也代表着CogVideoX系列开源模型已经支持文生视频、视频延长、图生视频三种任务。
CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型,通过一张图片和文本提示词生成视频。模型采用了3D 因果变分自编码器和专家自适应 LayerNorm 技术,能输出720×480分辨率、6秒长的视频。
AI教程资讯
2023-04-14
RapidPages 是一个开源的集成开发环境(IDE),专注于基于AI技术快速生成 React 和 Tailwind CSS 的 UI 组件。基于自然语言处理,支持用户仅通过描述所需界面的方式,可实时创建和迭代设计。
AI教程资讯
2023-04-14
Ovis1 6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是在30亿参数以下的模型中综合得分排名第一,超越了其他主流模型。Ovis1 6模型在数学推理、视觉理解等多项任务中表现出色,甚至超过闭源的GPT-4o-mini模型。
AI教程资讯
2023-04-14
Gummy是通义实验室在2024年云栖大会上推出的端到端语音翻译大模型。模型能实时流式生成语音识别与翻译结果,支持包括中文、英语、粤语、日语、韩语、法语、德语、俄语、意大利语、西班牙语等十余种语言的语音输入,将其翻译成目标语言。
AI教程资讯
2023-04-14
AiPPT 9.9MB
2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
CopyAI 9.9MB
2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
巨日禄AI故事绘图 9.9MB
2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
135AI排版 9.9MB
2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
笔灵AI写作 9.9MB
2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
Typeframes 9.9MB
Typeframes是一个创新的AI在线视频创作平台,允许用户通过简单的文本输入来快速生成专业的产品介绍视频。该工具的核心优势在于它的便捷性和易用性,无需掌握复杂的视频编辑软件,即使是没有视频制作经验的用户也能够利用人工智能轻松创建出高质量的视频内容,将文本转变为引人入胜的产品视频。