vivo推出AI图像分割模型ASAM,提升分割精度,应用场景广泛
vivo公司近日发布了全新的AI图像分割模型ASAM(Adversarial Adjustment of Segment Anything Model),该模型通过对抗性调整,显著提升了原有SAM模型的性能,在医学图像分析、自动驾驶、机器人视觉、增强现实等领域拥有广泛的应用前景。
ASAM的核心技术在于利用对抗性训练,通过向模型输入精心设计的扰动,来提高模型的泛化能力。该模型特别关注自然对抗性示例,这些示例在视觉上与正常样本相似,但能够在模型的决策边界附近产生扰动,从而迫使模型学习更鲁棒的特征。
为了生成这些自然对抗性示例,ASAM采用了稳定扩散模型,对SA-1B数据集的一个子集进行增强。这种方法能够在保持图像质量的同时,引入细微的扰动,确保生成的对抗性样本与原始图像具有相同的视觉真实性,并与原始的掩模注释保持对齐。
通过使用这些对抗性样本对原有的SAM模型进行微调,ASAM能够在不改变原始架构的前提下,显著提升模型的分割精度。
ASAM在多个应用场景中展现出巨大的潜力:
- 医学图像分析: ASAM可以用于提高医学图像分割的准确性,辅助医生进行疾病诊断和治疗规划。例如,它可以帮助医生更准确地识别肿瘤边界,为手术提供更精准的指导。
- 自动驾驶汽车: 在自动驾驶技术中,ASAM可用于提高道路和物体的分割精度,增强车辆对周围环境的理解能力。例如,它可以帮助自动驾驶汽车更准确地识别行人、车辆和交通信号灯,提高驾驶安全。
- 机器人视觉: 在机器人技术中,ASAM可以帮助机器人更好地理解其工作环境,进行精确的物体识别和操作。例如,它可以帮助机器人更准确地抓取物体,完成更复杂的任务。
- 增强现实(AR): 在AR应用中,ASAM可以提升虚拟对象与现实世界融合的自然度,提供更加沉浸式的体验。例如,它可以帮助AR应用程序更准确地识别现实世界中的物体,并将其与虚拟对象进行融合,创造更加逼真的AR体验。
ASAM的发布标志着vivo公司在AI图像分割领域取得了重大突破,也为该技术在更多领域的应用打开了新的可能性。 vivo公司表示,未来将继续致力于AI技术的研发,为用户提供更加智能、便捷的服务。
相关链接:
- GitHub仓库:https://github.com/luckybird1994/ASAM
- Hugging Face模型库:https://huggingface.co/spaces/xhk/ASAM
- arXiv技术论文:https://arxiv.org/pdf/2405.00256
【source】https://ai-bot.cn/asam/
Views: 3