当前位置: 网站首页 >AI教程资讯 >正文

ASAM – vivo公司推出的AI图像分割模型

来源:爱论文 时间:2025-05-04 13:43:18

ASAM是什么

ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI图像分割模型,通过对抗性调整来增强原有SAM模型的性能。ASAM用自然对抗性示例,通过稳定的扩散模型增强数据集,生成能代表自然变化的对抗性实例。这些实例保持照片级真实感,与原始掩模注释对齐,确保了分割任务的完整性。

ASAM的主要功能

提升能力:ASAM让原本的SAM模型在图像分割任务上做得更好。不用改变:不需要改变模型的基本结构,就像给汽车换个新轮胎,但车身不变。增加挑战:通过添加一些特殊的图像(对抗性样本),模型学会在更多不同的情况下工作。更真实:这些特殊的图像看起来和真的一样,模型学习得更贴近现实。不用新数据:不需要额外的图片或数据,就像用旧书复习,也能学到新知识。全面提高:在多种不同的图像分割任务上,ASAM能让模型表现得更出色。

ASAM的技术原理

对抗性训练:ASAM利用对抗性训练的概念,通过向模型输入精心设计的扰动来提高模型泛化能力的方法。自然对抗性示例:ASAM特别关注自然对抗性示例,示例在视觉上与正常样本相似,在模型的决策边界附近。稳定扩散模型:ASAM使用稳定扩散模型来增强SA-1B数据集的一个子集,生成对抗性实例。这种方法能在保持图像质量的同时,引入细微的扰动。照片级真实感:生成的对抗性样本需要保持与原始图像相同的视觉真实性,这样在训练过程中,模型就不会因为不真实的样本而学习到错误的特征。掩模注释对齐:对抗性样本需要与原始的掩模注释保持对齐,确保在分割任务中,模型能够正确地识别和分割目标对象。微调过程:ASAM通过用这些对抗性样本对原有的SAM模型进行微调,在不改变原始架构的前提下提高模型性能。

ASAM的项目地址

GitHub仓库:https://github.com/luckybird1994/ASAM
上一篇:Falcon Mamba 7B – 首个通用Mamba开源AI大模型
相关资讯 更多+
  • ASAM – vivo公司推出的AI图像分割模型
    ASAM – vivo公司推出的AI图像分割模型

    ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI图像分割模型,通过对抗性调整来增强原有SAM模型的性能。ASAM用自然对抗性示例,通过稳定的扩散模型增强数据集,生成能代表自然变化的对抗性实例。

    AI教程资讯 2023-04-14

  • Falcon Mamba 7B – 首个通用Mamba开源AI大模型
    Falcon Mamba 7B – 首个通用Mamba开源AI大模型

    Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3 1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意力技术,优化了长序列处理能力。

    AI教程资讯 2023-04-14

  • Clapper – 免费开源的可视化AI视频编辑工具
    Clapper – 免费开源的可视化AI视频编辑工具

    Clapper 是一款免费开源的可视化AI视频编辑工具,由 HuggingFace 的AI前端工程师 Julian Bilcke 开发。集成多种生成式 AI 技术,用户通过交互式、迭代和直观的过程使用 AI 创建视频,无需专业的电影制作或 AI 工程技能。

    AI教程资讯 2023-04-14

  • UniTalker – 商汤推出的音频驱动3D面部动画生成模型
    UniTalker – 商汤推出的音频驱动3D面部动画生成模型

    UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音频类型的处理,包括语音和歌曲。

    AI教程资讯 2023-04-14

最新录入 更多+
确定