Chatbene - AI Product News
计算机视觉
Total posts:24
1 / 1
LiarLiar.ai - 将心理学与计算机视觉相结合
2023-11-30
LiarLiar.ai 是一项突破性的 AI 虚假检测技术,将心理学方法与先进的计算机视觉相结合,旨在实时辨别真实性并识别潜在的欺骗行为。 LiarLiar.ai 利用先进的计算机视觉算法,结合心理学…
Manot - 深入了解您的计算机视觉模型盲区
2023-11-30
Manot 是一款计算机视觉模型性能的洞察管理平台。它能够准确定位计算机视觉模型失败的位置、原因和方式。Manot 可以将模型的优化和重新部署过程加速 10 倍,提高准确性 20%,…
VoxelGPT - 计算机视觉的 AI 助手
2023-06-15
VoxelGPT 是一个针对 FiftyOne 的开源插件,将您的自然语言提示转化为组织和探索图像、视频和三维点云数据的操作。 VoxelGPT 为计算机视觉提供了强大的人工智能助手功能,能够帮助您更…
SadTalker:学习逼真的三维运动系数,为风格化音频驱动的单张图像说话人动画提供支持
2023-04-26
近日,来自 CVPR 2023 的一组研究人员发布了他们的最新研究成果——SadTalker。这是一种学习逼真的三维运动系数,为风格化音频驱动的单张图像说话人动画提供支持的技术。 SadTalker …
Mini GPT-4:利用先进的大型语言模型增强视觉语言理解
2023-04-18
Mini GPT-4 是一个基于 PyTorch 实现的小型自然语言处理模型,使用类似于 GPT-3 的架构,但参数数量只有 GPT-3 的一小部分。Mini GPT-4 在多个自然语言处理任务上表现…
DINOv2:无需监督学习的稳健视觉特征学习
2023-04-18
DINOv2 是一个基于 PyTorch 实现的无监督学习算法,用于学习稳健的视觉特征。该算法在没有使用任何标签或注释的情况下,对包含 142M 张图像的数据集进行了预训练。DINOv2 模型产生的视…
SceneDreamer: 从 2D 图像集合生成无限制 3D 场景
2023-04-10
最近,研究人员通过一项名为 SceneDreamer 的新方法,实现了从 2D 图像集合生成无限制 3D 场景,该方法能够跨不同风格合成多样化的景观,具有 3D 一致性、明确的深度和自由相机轨迹。 该…
SegGPT 语义分割模型:在上下文中分割所有内容
2023-04-07
近日,Hugging Face 发布了一种新的模型,名为 SegGPT,该模型可以通过上下文推断执行图像或视频中的任意分割任务,例如对象实例、物品、部分、轮廓和文本等,只需要一个单一的模型。这种模型的…
Meta AI 发布新型 AI 模型:Segment Anything Model (SAM)
2023-04-06
Meta AI 最近发布了一种新的 AI 模型,名为 Segment Anything Model (SAM)。这个模型能够在任何图像中“剪切”出任何对象,只需单击一次。 SAM 是一种可提示分割系…