计算机视觉

计算机视觉

计算机视觉

计算机视觉

计算机视觉

LiarLiar.ai - 将心理学与计算机视觉相结合

LiarLiar.ai 是一项突破性的 AI 虚假检测技术，将心理学方法与先进的计算机视觉相结合，旨在实时辨别真实性并识别潜在的欺骗行为。

人工智能

Manot - 深入了解您的计算机视觉模型盲区

Manot 是一款计算机视觉模型性能的洞察管理平台。

Manot - 深入了解您的计算机视觉模型盲区

计算机视觉

VoxelGPT - 计算机视觉的 AI 助手

VoxelGPT 是一个针对 FiftyOne 的开源插件，将您的自然语言提示转化为组织和探索图像、视频和三维点云数据的操作。

VoxelGPT - 计算机视觉的 AI 助手

计算机视觉

SadTalker：学习逼真的三维运动系数，为风格化音频驱动的单张图像说话人动画提供支持

近日，来自 CVPR 2023 的一组研究人员发布了他们的最新研究成果——SadTalker。

SadTalker：学习逼真的三维运动系数，为风格化音频驱动的单张图像说话人动画提供支持

计算机视觉

Mini GPT-4：利用先进的大型语言模型增强视觉语言理解

Mini GPT-4 是一个基于 PyTorch 实现的小型自然语言处理模型，使用类似于 GPT-3 的架构，但参数数量只有 GPT-3 的一小部分。

人工智能

DINOv2：无需监督学习的稳健视觉特征学习

DINOv2 是一个基于 PyTorch 实现的无监督学习算法，用于学习稳健的视觉特征。

人工智能

SceneDreamer: 从 2D 图像集合生成无限制 3D 场景

研究人员通过一项名为 SceneDreamer 的新方法，实现了从 2D 图像集合生成无限制 3D 场景。

人工智能

SegGPT 语义分割模型：在上下文中分割所有内容

近日，Hugging Face 发布了一种新的模型，名为 SegGPT，该模型可以通过上下文推断执行图像或视频中的任意分割任务，例如对象实例、物品、部分、轮廓和文本等，只需要一个单一的模型。

计算机视觉

Meta AI 发布新型 AI 模型：Segment Anything Model (SAM)

这个模型能够在任何图像中“剪切”出任何对象，只需单击一次。

Meta AI 发布新型 AI 模型：Segment Anything Model (SAM)

人工智能