近日,Hugging Face 发布了一种新的模型,名为 SegGPT,该模型可以通过上下文推断执行图像或视频中的任意分割任务,例如对象实例、物品、部分、轮廓和文本等,只需要一个单一的模型。这种模型的训练数据来自多个数据集,包括 COCO、ADE20K、Cityscapes 和 TextVQA 等。在测试中,SegGPT 通过在推理时利用上下文信息,取得了一系列显著的成果。

如果你对 SegGPT 感兴趣,可以在以下链接中查看更多信息:

https://huggingface.co/spaces/BAAI/SegGPT