当前位置: 网站首页 >AI教程资讯 >正文

Cradle – 通用计算机控制的多模态AI Agent框架

来源:爱论文 时间:2025-05-04 08:28:48

Cradle是什么

上一篇:Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型
相关资讯 更多+
  • Cradle – 通用计算机控制的多模态AI Agent框架
    Cradle – 通用计算机控制的多模态AI Agent框架

    Cradle是面向通用计算机控制(General Computer Control, GCC)的多模态AI Agent框架,由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校机构推出的通用计算机控制框架,使AI Agent无需训练便能像人一样直接控制键盘鼠标,不依赖任何内部API,实现任意开闭源软件交互。

    AI教程资讯 2023-04-14

  • Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型
    Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型

    Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge TTS、XTTS 和 CosyVoice 等技术进行高质量语音合成。

    AI教程资讯 2023-04-14

  • VITA – 腾讯推出的开源多模态AI模型
    VITA – 腾讯推出的开源多模态AI模型

    VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了双语指令微调,支持自然人机交互,无需唤醒词即可响应。

    AI教程资讯 2023-04-14

  • AI Scientist – Sakana AI推出的全自动科学发现AI系统
    AI Scientist – Sakana AI推出的全自动科学发现AI系统

    AI Scientist是Sakana AI推出的首个全自动科学发现AI系统。能独立完成从创意生成、编码、实验执行到撰写科学论文的整个研究流程。

    AI教程资讯 2023-04-14

最新录入 更多+
确定