当前位置: 网站首页 >AI教程资讯 >正文

InternVL3 – 上海 AI Lab 开源的多模态大语言模型

来源:爱论文 时间:2025-04-27 15:24:14

InternVL3是什么

InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时处理文字、图片、视频等多种信息。 InternVL3采用了创新的原生多模态预训练方法,将语言和多模态学习整合到同一个预训练阶段,提升了多模态能力的同时,进一步增强了纯语言能力。模型通过混合偏好优化算法和多模态测试阶段增强,大幅提升了模型的推理能力。

上一篇:豆包1.5·UI-TARS – 字节豆包推出的 GUI Agent 模型
相关资讯 更多+
  • InternVL3 – 上海 AI Lab 开源的多模态大语言模型
    InternVL3 – 上海 AI Lab 开源的多模态大语言模型

    InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时处理文字、图片、视频等多种信息。

    AI教程资讯 2023-04-14

  • 豆包1.5·UI-TARS – 字节豆包推出的 GUI Agent 模型
    豆包1.5·UI-TARS – 字节豆包推出的 GUI Agent 模型

    豆包1 5·UI-TARS是字节豆包推出的面向图形界面交互(GUI)的Agent模型。模型基于感知、推理和动作执行等类人能力,与图形界面进行连续、流畅的交互。模型将视觉理解、逻辑推理、界面元素定位和操作整合在单一模型中,无需预定义工作流程或人工规则,实现端到端的任务自动化。

    AI教程资讯 2023-04-14

  • GoodWeBot – 基于 RPA 技术开源的 AI 微信机器人
    GoodWeBot – 基于 RPA 技术开源的 AI 微信机器人

    GoodWeBot 是开源的基于 RPA 技术开发的 AI 微信机器人, 支持一键免安装运行,用户下载后即可直接使用。工具已接入 Coze 等主流 AI,能实现智能回复、私聊群发、群聊群发、自动加好友、接受好友申请以及自动给好友打标签等功能。

    AI教程资讯 2023-04-14

  • 万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型
    万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型

    万相首尾帧模型(Wan2 1-FLF2V-14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频过渡效果,支持多种风格和特效变换。

    AI教程资讯 2023-04-14

最新录入 更多+
确定